科技魔方
  • 语音最新相关新闻
  • 谷歌发布Gemini Live:支持AI语音聊天,可模拟面试场景、推荐演讲技巧
    谷歌发布Gemini Live:支持AI语音聊天,可模拟面试场景、推荐演讲技巧

    谷歌在今天召开的 Pixel 9 系列手机发布会上,发布了 Gemini Live 服务,将于今天开始率先面向使用英语的 Gemini Advanced 订阅用户开放。

  • IT之家 谷歌AI语音聊天
  • 721 0
  • ColorOS 14 七月新增语音转文字实时字幕等功能

    ColorOS 官方发布了 7 月升级公告,新增多种新功能,还有细节方面的优化。

    腾讯实时语音编码大突破:电梯、地库里通话也不卡顿

    腾讯宣布,腾讯主导的新一代实时语音编码行业标准AVS3P10,即将正式对外发布。

  • 快科技 腾讯编码语音
  • 527 0
  • OpenAI升级ChatGPT语音,使其能够以不同角色的声音说话

    OpenAI正在更新ChatGPT的语音功能,允许用户使用各种 AI 生成的声音和声音风格与聊天机器人进行交互。

  • 站长之家 OpenAIChatGPT语音大模型AI
  • 591 0
  • Cartesia发布了一个拥有极快推理速度和超低延迟的语音生成模型Sonic

    据来自Cartesia的最新消息,他们今天发布了Sonic,这是他们在构建实时多模态智能时代的第一步。Sonic 是一个极速的生成语音模型和 API,拥有令人惊叹的低延迟(仅为135毫秒模型延迟),栩栩如生的声音效果,目前只支持英文。

  • 站长之家 Cartesia大模型语音模型
  • 580 0
  • ChatTTS:一个专为对话场景设计的语音生成模型

    ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文,并且在视频中展示的是中等参数的版本,使用了约10万小时的中英文数据进行训练

  • 站长之家 ChatTTS大模型语音
  • 678 0
  • ​亚马逊计划对Alexa语音助手重大升级,以保持竞争力

    亚马逊计划在今年晚些时候对其 Alexa 语音助手进行重大升级,引入生成式人工智能,以保持与 OpenAI 和谷歌等聊天机器人的竞争。

    真免费不绑定,声智首推实时语音转写与多语翻译免费开放!
    真免费不绑定,声智首推实时语音转写与多语翻译免费开放!

    5月14日,OpenAI召开春季发布会发布基于GPT-4o打造的语音版ChatGPT,次日Google I/O大会正式召开,推出从基座模型 Gemini 升级到新的AI语音助手 Astra,标志着人机语音对话技术进入新的历史时刻。

  • 科技魔方
  • 646 0
  • 媲美Suno、Udio!AI铁了心,要砸音乐人的饭碗

    5月10日凌晨,著名语音生成式AI平台ElevenLabs在社交平台宣布,推出文本生成歌曲产品ElevenLabs Music。

  • AIGC开放社区公众号 语音生成式AI音乐
  • 727 0
  • 微软发布对口型软件VASA-1 图片加语音即可生成逼真说话视频

    由微软亚洲研究院开发的VASA-1项目,是一项前沿的人工智能技术,它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。

    百度文心一言“新花样”!上线语音定制功能:2秒完美复刻个人声音

    百度日前官方宣布文心一言语音定制功能上线,只需2秒钟,AI 就能完美重建任何一个人的声音,每个人都能拥有自己的AI声优。

    VoiceCraft:一个支持克隆语音及修改原始音频文本的语音模型

    近日,一款名为VoiceCraft的语音模型引起了业界的广泛关注。据官方宣称,该模型的性能已经超过了XTTS,这无疑为AI音频处理领域带来了新的突破。

  • 站长之家 VoiceCraft大模型语音
  • 633 0
  • Voicepanel:利用AI进行语音或视频采访

    Voicepanel是一个利用AI进行语音或视频采访的产品,帮助企业以较低成本获取客户反馈,远比传统的人工访谈更便宜。其使用户能够在短时间内进行大量对话,获取比传统调查更深入的洞察。

  • 站长之家 Voicepanel语音视频
  • 628 0
  • 语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS
    语音生成的「智能涌现」:10万小时数据训练,亚马逊祭出10亿参数BASE TTS

    伴随着生成式深度学习模型的飞速发展,自然语言处理(NLP)和计算机视觉(CV)已经经历了根本性的转变,从有监督训练的专门模型,转变为只需有限的明确指令就能完成各种任务的通用模型。

  • 机器之心Pro 语音数据亚马逊模型
  • 699 0
  • 语音大模型SpeechGPT-Gen:8B参数,零样本生成语音

    人工智能和机器学习领域中最令人兴奋的进展之一是使用大型语言模型(LLMs)进行语音生成。虽然传统方法在各种应用中表现出色,但面临一个重大挑战:语义和感知信息的整合,常常导致低效和冗余。

  • 站长之家 语音大模型
  • 559 0
  • AI语音公司ElevenLabs B轮融资8000万美元,估值超10亿美元

    AI语音合成初创公司ElevenLabs宣布已完成8000万美元的B轮融资,由Andreessen Horowitz、Nat Friedman等领投。

  • 站长之家 AI语音
  • 682 0
  • 开源语音超分辨率AI模型Resemble Enhance 可有效去除噪音杂音

    Resemble Enhance是一款令人印象深刻的语音处理技术,专为将嘈杂的音频转换为清晰有力的语音而设计。

  • 站长之家 开源语音杂音
  • 771 0
  • 新语音转换技术CoMoSVC :速度飙升500倍,高质量歌声转换
    新语音转换技术CoMoSVC :速度飙升500倍,高质量歌声转换

    近日,香港科技大学与微软亚洲研究院的研究团队联手开发的CoMoSVC技术在歌声转换领域取得了革命性突破。

  • 站长之家 语音CoMoSVC
  • 546 0
  • ChatGPT语音功能现已全面开放
    ChatGPT语音功能现已全面开放

    12月22日消息,OpenAI宣布将ChatGPT with voice语音功能免费对所有用户开放。

  • 快科技 ChatGPT语音
  • 630 0
  • 诺基亚最新AI突破:可通过人类语音实现网络重新配置

    诺基亚官网消息称,该公司在实现网络真正自治化方面迈出了一大步。

  • C114通信网 诺基亚AI语音网络
  • 631 0
  • 16万抖音网友围观AI谈恋爱 ChatGPT语音功能被网友玩坏了

    ChatGPT语音功能被网友玩坏了!最近,抖音博主“新竹AI”让两个手机上的ChatGPT互相亲密交流,这场AI之间的恋爱对话被超16万网友围观。

  • 站长之家 抖音ChatGPT语音
  • 680 0
  • 完全听不出来不是人!ChatGPT语音模型实测:语气、断句超真实

    9月29日消息,ChatGPT在25日正式推出了全新版本,现在可以看、听、说”了。

  • 快科技 ChatGPT语音模型
  • 605 0
  • 再增两百博士下一线 华为云盘古大模型奔涌进行业

    在过去几个月的大模型落地实践中,业界遇到了方方面面的挑战。

  • 数智前线
  • 619 0
  • 甲骨文发布语音AI助手,助力医疗保健领域

    甲骨文公司在其年度健康大会上宣布推出一款语音生成式人工智能助手,旨在改善医疗保健领域的临床工作流程。

  • 站长之家 甲骨文语音AI助手
  • 660 0
  • -------------没有了-------------

    图赏更多>