备受期待的Deepseek V3终于开源,展现出卓越的多语言编程能力,超越了Claude3.5Sonnet V2等竞争对手。
阿布扎比技术创新研究院(TII)发布的新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上表现出色,创下新纪录。
图森未来今日发布“Ruyi”图生视频大模型,并将 Ruyi-Mini-7B 版本开源,用户可以从 huggingface 上下载使用。
无问芯穹在AI领域取得了重要进展,推出了全球首个端侧全模态理解开源AI模型Megrez-3B-Omni,标志着其在技术创新上的领先地位。
阿里巴巴通义实验室语音团队宣布,其开源的语音生成大模型CosyVoice已升级至2.0版本,这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。
阿里巴巴达摩院的通义实验室推出了ClearerVoice-Studio,这是一项开源的语音处理技术,旨在提升语音质量与可懂度。
逐步开源高性能KVCache多级缓存Mooncake Store的实现,同时针对各类推理引擎和底层存储/传输资源进行兼容。
在人工智能快速发展的背景下,Kimi公司与清华大学MADSys实验室合作推出了基于KVCache的Mooncake推理系统,旨在解决高推理负载和降低推理成本的问题。
今年7月,微软首次开源了超大知识索引GraphRAG,仅4个多月的时间在Github已超过19000颗星,成为目前最火的RAG框架之一。
Lightricks 推出了名为 LTX Video 的开源视频生成模型,具有20亿参数。
Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。
在 2024 年世界互联网大会上,阿里巴巴首席执行官吴泳铭强调人工智能对互联网行业的深远影响,介绍了阿里发布的 100 多个开源模型及 30 万家企业接入通义大模型的情况。
以全面提升的创意写作、技术支持和文件处理能力,再次夺回 Chatbot Arena 的榜首宝座。
一个以隐私为中心的被动录制项目。它可以自动记录屏幕内容,构建智能索引,并提供方便的网页界面以检索历史记录。
今天凌晨,法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——Pixtral Large。
在人工智能的应用中,如何实现与 AI 的实时互动一直是开发者和研究人员面临的重大挑战。这其中,整合多模态信息(如文本、图像和音频)以形成一个连贯的对话系统显得尤为复杂。
通义千问团队最新开源Qwen2.5-Coder全系列,旨在推动Open Code LLMs的发展。
-------------没有了-------------