语音最新相关新闻-科技魔方_中文AI大模型门户网站

语音最新相关新闻

出门问问发布TicVoice7.0支持超自然语音克隆与跨语种生成能力

出门问问与多所顶尖高校合作，推出了新一代语音生成模型TicVoice7.0，标志着语音生成技术的重大突破。

科技魔方 出门问问大模型语音

637

Sesame发布超真实的AI语音产品:几乎没有AI味

Sesame团队正在开发一种全新的“语音存在”概念，旨在让数字助手不仅能执行命令，还能进行真实的对话。

科技魔方 Sesame大模型语音

592

马斯克宣布Grok语音模式正式上线：早期测试版本可能有一些问题

2月23日消息，据报道，马斯克旗下xAI团队近期动作频频，继2月18日直播发布Grok最新版本Grok3后，马斯克又在社交平台X上宣布，Grok语音模式早期测试版现已在Grok应用程序上线，并对其表现给予了高度评价。

快科技 马斯克语音

618

GPT-4o 级别!VITA-1.5:实时视觉与语音交互，1.5秒互动延迟

VITA-MLLM团队最近推出了VITA-1.5，这是对VITA-1.0的重大升级，旨在提升多模态交互的实时性和准确性。

科技魔方 GPT-4o大模型视觉语音

558

Hume AI发布全能语音引擎OCTAVE:文本秒变真人声，克隆人格特征

Hume AI最近推出的OCTAVE语音引擎，标志着人工智能语音领域的一次重大突破。

科技魔方 HumeAI大模型语音

652

ElevenLabs推Flash语音对话模型:仅75毫秒延迟支持32种语言

　ElevenLabs近期推出了其最新的人声合成模型Flash，声称这是迄今为止最快的文本转语音解决方案，生成语音的延迟仅为75毫秒，特别适合低延迟的对话式语音助手。

科技魔方 ElevenLabs大模型语音

608

海螺AI海外版上线超强AI语音克隆功能

海螺AI最近推出了其海外版的音频克隆模块，用户只需10到60秒的音频样本即可完美复刻自己的声音。

科技魔方 海螺AI语音AI音频

824

ElevenLabs推出全新对话式AI平台

ElevenLabs最近推出了一款全新的对话式AI平台，旨在帮助开发者在短时间内构建高效的智能语音代理。

科技魔方 ElevenLabsAI语音

553

告别语音克隆侵权!Hume AI推出语音控制功能，可创建个性化AI语音

Hume AI最近推出了一项名为“语音控制”的实验性功能，使用户能够轻松创建个性化的AI声音，无需任何编码技能。

科技魔方 大模型HumeAI语音

601

Rivian宣布2025年推AI语音助手，提升车主智能体验

近日，Rivian 公司的首席软件官 Wassym Bensaid 在加州威尼斯的展厅内确认，Rivian R1T 和 R1S 车型将于2025年推出全新的 AI 语音助手。这一助手将支持文本到语音的信息功能，旨在提升用户在车内的智能体验。

AIbase基地 Rivian语音汽车

570

语音AI的颠覆者！PlayAI：用声音重塑数字交互的边界

从一个简单的Chrome扩展，到如今估值超2000万美元的AI语音帝国，PlayAI正用声音技术重新定义人机交互的想象边界。

AIbase基地 语音AIPlayAI语音

556

谷歌发布Gemini Live：支持AI语音聊天，可模拟面试场景、推荐演讲技巧

谷歌在今天召开的 Pixel 9 系列手机发布会上，发布了 Gemini Live 服务，将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。

IT之家谷歌AI语音聊天

734

ColorOS 14 七月新增语音转文字实时字幕等功能

ColorOS 官方发布了 7 月升级公告，新增多种新功能，还有细节方面的优化。

Donews ColorOS语音文字字幕

689

腾讯实时语音编码大突破：电梯、地库里通话也不卡顿

腾讯宣布，腾讯主导的新一代实时语音编码行业标准AVS3P10，即将正式对外发布。

快科技腾讯编码语音

533

OpenAI升级ChatGPT语音，使其能够以不同角色的声音说话

OpenAI正在更新ChatGPT的语音功能，允许用户使用各种 AI 生成的声音和声音风格与聊天机器人进行交互。

站长之家 OpenAIChatGPT语音大模型AI

597

Cartesia发布了一个拥有极快推理速度和超低延迟的语音生成模型Sonic

据来自Cartesia的最新消息，他们今天发布了Sonic，这是他们在构建实时多模态智能时代的第一步。Sonic 是一个极速的生成语音模型和 API，拥有令人惊叹的低延迟(仅为135毫秒模型延迟)，栩栩如生的声音效果，目前只支持英文。

站长之家 Cartesia大模型语音模型

590

ChatTTS：一个专为对话场景设计的语音生成模型

ChatTTS是一个为对话场景设计的语音生成模型，专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文，并且在视频中展示的是中等参数的版本，使用了约10万小时的中英文数据进行训练

站长之家 ChatTTS大模型语音

693

亚马逊计划对Alexa语音助手重大升级，以保持竞争力

亚马逊计划在今年晚些时候对其 Alexa 语音助手进行重大升级，引入生成式人工智能，以保持与 OpenAI 和谷歌等聊天机器人的竞争。

站长之家 亚马逊Alexa语音助手语音聊天机器人

661

真免费不绑定，声智首推实时语音转写与多语翻译免费开放！

5月14日，OpenAI召开春季发布会发布基于GPT-4o打造的语音版ChatGPT，次日Google I/O大会正式召开，推出从基座模型 Gemini 升级到新的AI语音助手 Astra，标志着人机语音对话技术进入新的历史时刻。

科技魔方

654

媲美Suno、Udio！AI铁了心，要砸音乐人的饭碗

5月10日凌晨，著名语音生成式AI平台ElevenLabs在社交平台宣布，推出文本生成歌曲产品ElevenLabs Music。

AIGC开放社区公众号语音生成式AI音乐

739

微软发布对口型软件VASA-1 图片加语音即可生成逼真说话视频

由微软亚洲研究院开发的VASA-1项目，是一项前沿的人工智能技术，它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。

站长之家微软大模型软件语音视频

730

百度文心一言“新花样”！上线语音定制功能：2秒完美复刻个人声音

百度日前官方宣布文心一言语音定制功能上线，只需2秒钟，AI 就能完美重建任何一个人的声音，每个人都能拥有自己的AI声优。

快科技百度文心一言语音大模型

551

VoiceCraft：一个支持克隆语音及修改原始音频文本的语音模型

近日，一款名为VoiceCraft的语音模型引起了业界的广泛关注。据官方宣称，该模型的性能已经超过了XTTS，这无疑为AI音频处理领域带来了新的突破。

站长之家 VoiceCraft大模型语音

637

Voicepanel：利用AI进行语音或视频采访

Voicepanel是一个利用AI进行语音或视频采访的产品，帮助企业以较低成本获取客户反馈，远比传统的人工访谈更便宜。其使用户能够在短时间内进行大量对话，获取比传统调查更深入的洞察。

站长之家 Voicepanel语音视频

636

语音生成的「智能涌现」：10万小时数据训练，亚马逊祭出10亿参数BASE TTS

伴随着生成式深度学习模型的飞速发展，自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变，从有监督训练的专门模型，转变为只需有限的明确指令就能完成各种任务的通用模型。

机器之心Pro 语音数据亚马逊模型

707

-------------没有了-------------

图赏更多>

: 2025Q1鲁大师PC排行榜：新品井喷，格局重塑

: Spectrum数字化仪卡将海豚声呐点击转为鼠标点击

: 鲁大师2025年手机Q1季报：ROG成功卫冕性能榜，OPPO延续流畅榜大满贯

: 斯坦福最新AI研究报告出炉中美模型质量差距缩小至0.3%

: 谷歌 AI 模式新增多模态搜索，支持图像提问功能

: 鲁大师2025年新能源汽车Q1季报：全新驾舱流畅榜单上线，极氪车机强势翻身

最热新闻最新新闻 更多>

用户推荐最热产品 更多>

倾城

小新

叶紫

创维电视（SKYWORTH）55V40

小米全面屏电视E43K

康佳（KONKA）55D6S

荣泰S60按摩椅

自媒体头条更多>: 极致听感智能降噪三星Galaxy Buds Pro诠释非同凡“响”

未来科技范试驾摩灵MOi｜视频

品牌专区更多>