在即将到来的苹果全球开发者大会(WWDC)上,苹果公司将重点展示其在人工智能(AI)领域的最新进展。知情人透露,苹果的焦点将是普通用户在日常生活中可以使用的AI工具。
ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文,并且在视频中展示的是中等参数的版本,使用了约10万小时的中英文数据进行训练。
微软公司今年 4 月预告将为 Windows 10、Windows 11 系统上的 PowerToys 新增 AI 功能--高级粘贴(Advanced Paste)功能,从剪贴板复制的代码片段可以转换成用户喜欢的编程语言。
微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。
5月27日消息,齐心集团日前接受机构调研时表示,针对数字化采购市场的动态变化和业务数据的深度分析,公司加强与AI云服务优秀客户的战略合作。
Open-Sora1.1发布,带来了显著的提升,尤其是在视频生成的质量和时长方面。新版本模型能够生成最长约为21秒的视频,使用更高质量的视觉数据和字幕进行训练,从而使其更好地理解世界的运作。
最近,对话形象生成模型在实现与音频的逼真准确口型同步方面取得了进展,但在控制和传达形象的细节表情和情感方面仍有不足,使生成的视频缺乏生动性和可控性。
-------------没有了-------------