科技魔方
  • 语音最新相关新闻
  • 出门问问发布TicVoice7.0支持超自然语音克隆与跨语种生成能力

    出门问问与多所顶尖高校合作,推出了新一代语音生成模型TicVoice7.0,标志着语音生成技术的重大突破。

  • 科技魔方 出门问问大模型语音
  • 637 0
  • Sesame发布超真实的AI语音产品:几乎没有AI味

    Sesame团队正在开发一种全新的“语音存在”概念,旨在让数字助手不仅能执行命令,还能进行真实的对话。

  • 科技魔方 Sesame大模型语音
  • 592 0
  • 马斯克宣布Grok语音模式正式上线:早期测试版本 可能有一些问题

    2月23日消息,据报道,马斯克旗下xAI团队近期动作频频,继2月18日直播发布Grok最新版本Grok3后,马斯克又在社交平台X上宣布,Grok语音模式早期测试版现已在Grok应用程序上线,并对其表现给予了高度评价。

  • 快科技 马斯克语音
  • 618 0
  • GPT-4o 级别!VITA-1.5:实时视觉与语音交互,1.5秒互动延迟

    VITA-MLLM团队最近推出了VITA-1.5,这是对VITA-1.0的重大升级,旨在提升多模态交互的实时性和准确性。

  • 科技魔方 GPT-4o大模型视觉语音
  • 558 0
  • Hume AI发布全能语音引擎OCTAVE:文本秒变真人声,克隆人格特征

    Hume AI最近推出的OCTAVE语音引擎,标志着人工智能语音领域的一次重大突破。

  • 科技魔方 HumeAI大模型语音
  • 652 0
  • ElevenLabs推Flash语音对话模型:仅75毫秒延迟 支持32种语言

     ElevenLabs近期推出了其最新的人声合成模型Flash,声称这是迄今为止最快的文本转语音解决方案,生成语音的延迟仅为75毫秒,特别适合低延迟的对话式语音助手。

  • 科技魔方 ElevenLabs大模型语音
  • 608 0
  • 海螺AI海外版上线超强AI语音克隆功能

    海螺AI最近推出了其海外版的音频克隆模块,用户只需10到60秒的音频样本即可完美复刻自己的声音。

  • 科技魔方 海螺AI语音AI音频
  • 824 0
  • ElevenLabs推出全新对话式AI平台

    ElevenLabs最近推出了一款全新的对话式AI平台,旨在帮助开发者在短时间内构建高效的智能语音代理。

  • 科技魔方 ElevenLabsAI语音
  • 553 0
  • 告别语音克隆侵权!Hume AI推出语音控制功能,可创建个性化AI语音

    Hume AI最近推出了一项名为“语音控制”的实验性功能,使用户能够轻松创建个性化的AI声音,无需任何编码技能。

  • 科技魔方 大模型HumeAI语音
  • 601 0
  • Rivian宣布2025年推AI语音助手,提升车主智能体验

    近日,Rivian 公司的首席软件官 Wassym Bensaid 在加州威尼斯的展厅内确认,Rivian R1T 和 R1S 车型将于2025年推出全新的 AI 语音助手。这一助手将支持文本到语音的信息功能,旨在提升用户在车内的智能体验。

  • AIbase基地 Rivian语音汽车
  • 570 0
  • 语音AI的颠覆者!PlayAI:用声音重塑数字交互的边界

    从一个简单的Chrome扩展,到如今估值超2000万美元的AI语音帝国,PlayAI正用声音技术重新定义人机交互的想象边界。

  • AIbase基地 语音AIPlayAI语音
  • 556 0
  • 谷歌发布Gemini Live:支持AI语音聊天,可模拟面试场景、推荐演讲技巧
    谷歌发布Gemini Live:支持AI语音聊天,可模拟面试场景、推荐演讲技巧

    谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。

  • IT之家 谷歌AI语音聊天
  • 734 0
  • ColorOS 14 七月新增语音转文字实时字幕等功能

    ColorOS 官方发布了 7 月升级公告,新增多种新功能,还有细节方面的优化。

    腾讯实时语音编码大突破:电梯、地库里通话也不卡顿

    腾讯宣布,腾讯主导的新一代实时语音编码行业标准AVS3P10,即将正式对外发布。

  • 快科技 腾讯编码语音
  • 533 0
  • OpenAI升级ChatGPT语音,使其能够以不同角色的声音说话

    OpenAI正在更新ChatGPT的语音功能,允许用户使用各种 AI 生成的声音和声音风格与聊天机器人进行交互。

  • 站长之家 OpenAIChatGPT语音大模型AI
  • 597 0
  • Cartesia发布了一个拥有极快推理速度和超低延迟的语音生成模型Sonic

    据来自Cartesia的最新消息,他们今天发布了Sonic,这是他们在构建实时多模态智能时代的第一步。Sonic 是一个极速的生成语音模型和 API,拥有令人惊叹的低延迟(仅为135毫秒模型延迟),栩栩如生的声音效果,目前只支持英文。

  • 站长之家 Cartesia大模型语音模型
  • 590 0
  • ChatTTS:一个专为对话场景设计的语音生成模型

    ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文,并且在视频中展示的是中等参数的版本,使用了约10万小时的中英文数据进行训练

  • 站长之家 ChatTTS大模型语音
  • 693 0
  • ​亚马逊计划对Alexa语音助手重大升级,以保持竞争力

    亚马逊计划在今年晚些时候对其 Alexa 语音助手进行重大升级,引入生成式人工智能,以保持与 OpenAI 和谷歌等聊天机器人的竞争。

    真免费不绑定,声智首推实时语音转写与多语翻译免费开放!
    真免费不绑定,声智首推实时语音转写与多语翻译免费开放!

    5月14日,OpenAI召开春季发布会发布基于GPT-4o打造的语音版ChatGPT,次日Google I/O大会正式召开,推出从基座模型 Gemini 升级到新的AI语音助手 Astra,标志着人机语音对话技术进入新的历史时刻。

  • 科技魔方
  • 654 0
  • 媲美Suno、Udio!AI铁了心,要砸音乐人的饭碗

    5月10日凌晨,著名语音生成式AI平台ElevenLabs在社交平台宣布,推出文本生成歌曲产品ElevenLabs Music。

  • AIGC开放社区公众号 语音生成式AI音乐
  • 739 0
  • 微软发布对口型软件VASA-1 图片加语音即可生成逼真说话视频

    由微软亚洲研究院开发的VASA-1项目,是一项前沿的人工智能技术,它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。

    百度文心一言“新花样”!上线语音定制功能:2秒完美复刻个人声音

    百度日前官方宣布文心一言语音定制功能上线,只需2秒钟,AI 就能完美重建任何一个人的声音,每个人都能拥有自己的AI声优。

    VoiceCraft:一个支持克隆语音及修改原始音频文本的语音模型

    近日,一款名为VoiceCraft的语音模型引起了业界的广泛关注。据官方宣称,该模型的性能已经超过了XTTS,这无疑为AI音频处理领域带来了新的突破。

  • 站长之家 VoiceCraft大模型语音
  • 637 0
  • Voicepanel:利用AI进行语音或视频采访

    Voicepanel是一个利用AI进行语音或视频采访的产品,帮助企业以较低成本获取客户反馈,远比传统的人工访谈更便宜。其使用户能够在短时间内进行大量对话,获取比传统调查更深入的洞察。

  • 站长之家 Voicepanel语音视频
  • 636 0
  • 语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS
    语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

    伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转变为只需有限的明确指令就能完成各种任务的通用模型。

  • 机器之心Pro 语音数据亚马逊模型
  • 707 0
  • -------------没有了-------------

    图赏更多>