EasyControl_Ghibli模型的上线为用户提供了一个免费的工具,可以轻松生成吉卜力风格的图像。
ElevenLabs推出了全球首款专为犬类设计的AI文本转语音模型“Text To Bark”,该技术能够将人类输入的文字转化为高度逼真的狗吠声,声称95%的狗无法分辨声音的来源。
MiniMax Audio最近推出了全新的Speech-02系列语音模型,支持超过30种语言,且一次性可输入多达20万字符。
OpenAI的首席执行官山姆·阿尔特曼宣布,将在未来几个月内推出一个开源的人工智能模型,以应对来自行业竞争的压力。
Wayve公司推出了GAIA-2视频生成世界模型,显著提升了自动驾驶系统的训练和验证能力。
ComfyUI-C opilot是一款创新的AI工具,通过自然语言处理与节点式工作流的结合,极大地降低了图像生成的使用门槛。
OpenAI 最近推出的 ChatGPT 图像生成功能引起了广泛关注,尤其是其“吉卜力风格”的图像生成备受喜爱。
谷歌最新发布的Gemini2.5Pro人工智能模型现已向所有用户免费开放,该模型被称为迄今为止最智能的AI,具备多种功能,如应用和浏览器扩展、文件上传及与谷歌协作工具Canvas的无缝集成。
OpenAI于3月27日对其ChatGPT进行了重大升级,推出了新版GPT-4o模型及全新的记忆功能“Moonshine Nux V2”。
OpenAI首席执行官山姆·奥尔特曼近日在其X账号上透露,由于ChatGPT的文生图应用需求激增,导致GPU超负荷运转。
美图公司旗下的AI素材生成器WHEE与DeepSeek R1的成功接入,标志着AI创作领域的一次重要进步。
OpenAI的首席执行官山姆·阿尔特曼宣布,该公司将支持竞争对手Anthropic推出的模型上下文协议(MCP),旨在提升AI助手在特定查询中的响应准确性和相关性。
阿里云通义千问团队推出了Qwen2.5-Omni,这是一个新一代的多模态旗舰模型,旨在实现文本、图像、音频和视频的无缝处理。
-------------没有了-------------