科技魔方
  • 商业方向
  • 开源版EMO?AniTalker可通过照片加音频生成说话视频

    AniTalker是一个创新的开源项目,它能够通过静态肖像画和输入的音频信号生成生动的面部说话视频。

  • 站长之家 开源AniTalker音频视频
  • 717 0
  • AI 音乐应用 Udio 推出音频修复扩展新功能和付费订阅计划

    AI 音乐初创公司 Udio 推出了几项新功能,包括音频修复和更长的上下文口,以改善音乐创作体验。Udio 还宣布了新的订阅计划细节。

  • 站长之家
  • 675 0
  • Siri Ultra:快捷命令激活iPhone上的大模型进行对话与搜索

    SiriUltra是一款由大型语言模型(LLMs)支持的智能助手,它能够与iPhone上的快捷命令集成,实现包括Llama3、GPT等模型在内的对话功能。用户现在可以享受实时语音交互和联网搜索的便利。

  • 站长之家 SiriUltra大模型语言模型
  • 668 0
  • AI音乐应用 Udio 推出音频修复扩展新功能和付费订阅计划

    AI 音乐初创公司 Udio 推出了几项新功能,包括音频修复和更长的上下文口,以改善音乐创作体验。Udio 还宣布了新的订阅计划细节。

    Stylar:一站式AI图像和设计工具,提升创作效率

    Stylar是一款集多功能于一体的人工智能图像和设计工具,以其全面的功能和简单易操作的特点,受到了创作者和设计师的广泛欢迎。该工具将生成式AI与编辑工具融合在一个平台上,极大地提高了从图像生成到编辑的工作效率。

    Phi-3 WebGPU:允许用户直接在浏览器本地运行Phi-3模型

    Phi-3WebGPU是一款由Xenova提供的AI模型,它在Hugging Face Space中推出,允许用户直接在浏览器中本地运行AI模型。这一创新工具结合了Transformers.js和onnxruntime-web,为用户提供了一个私密且高效的AI体验。

  • 站长之家 浏览器大模型模型
  • 711 0
  • 最强中文大模型,通义千问2.5追上GPT-4了?
    最强中文大模型,通义千问2.5追上GPT-4了?

    5月9日,阿里云正式发布通义千问 2.5,这是其旗下的通义大模型系列的最新版本。与此同时,阿里云还开源通义千问 1100 亿参数模型。

    Digen AI数字人上线 不支持中文,对嘴型效果尚不理想

    近日,DigenAI 推出了其先进的生成式 AI数字人,引发行业内外的广泛关注。作为一款创新的AI产品,DigenAI 数字人以其独特的功能和应用前景,预示着数字互动方式的革新。

  • 站长之家 DigenAI数字人应用AI
  • 612 0
  • Anthropic 控制台推出两大新功能:自动生成提示与变量功能

    Anthropic近日为其控制台用户发布了两项重要的新功能:自动生成提示和变量功能。这些更新旨在提高用户的工作效率,同时为生成的提示内容带来更多的灵活性和个性化。

  • 站长之家 Anthropic控制台解决方案
  • 530 0
  • OpenAI开发全新AI人机对话技术 支持识别物体和图像

    据The Information消息,OpenAI正筹备展示一种革命性的人机对话技术。据可靠消息,这一技术将结合声音和文本,不仅能与用户进行流畅的交流,还具备识别物体和图像的能力,为用户带来前所未有的交互体验。

  • 站长之家 OpenAIAI人机对话图像
  • 584 0
  • -------------没有了-------------

    图赏更多>