VITA-MLLM团队最近推出了VITA-1.5,这是对VITA-1.0的重大升级,旨在提升多模态交互的实时性和准确性。
多模态大模型在听觉上,居然也出现了「9.11>9.8」的现象,音量大小这种简单问题都识别不了!港中文、斯坦福等大学联合发布的AV-Odyssey基准测试,包含26个视听任务,覆盖了7种声音属性,跨越了10个不同领域,确保测试的深度和广度
近日,上海 AI 实验室宣布推出书生·万象InternVL2.5模型。
微软于 11 月 26 日发布博文,宣布在其 LlamaParse 中集成 Azure OpenAI 端点,利用 GPT-4o 系列模型,增强提取非结构化数据和解析多模态文档,并无缝衔接 Azure AI Search 向量数据库,构建完整的检索增强生成(RAG)工作流程。
以全面提升的创意写作、技术支持和文件处理能力,再次夺回 Chatbot Arena 的榜首宝座。
今天凌晨,法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——Pixtral Large。
Anthropic 宣布开发者可以通过第一方 API、Amazon Bedrock 和GoogleCloud 的 Vertex AI,调用 Claude 3.5 Haiku 模型。
最近,一项由 OpenAI 进行的研究显示,尽管人工智能技术飞速发展,当前最先进的语言模型在回答事实问题时的成功率却远低于预期。
实时语音通话早已不是什么新奇功能了,ChatGPT、智谱清言、字节豆包、百度文小言、讯飞星火等海内外友商陆续发布,只不过效果各有千秋。
全球AI领导者英伟达(Nvidia)开源了超强大模型——Llama-3.1-Nemotron-70B-Instruct。
今天凌晨,阿里巴巴官宣了史上最大规模的开源发布,推出了基础模型Qwen2.5、专用于编码Qwen2.5-Coder和数学的Qwen2.5-Math。
在刚刚召开的“KDDI SUMMIT2024”大会上,OpenAI日本首席执行官長崎忠雄表示,截止至今年8月底,ChatGPT的月活用户数量突破2亿大关,成为史上最快达到这一成就的软件产品。
今年8月19日,科大讯飞发布了星火极速超拟人交互技术,在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现巨大突破。这项技术将于今年8月底在讯飞星火App上全民开放使用,普通用户也能亲自感知。
OpenAI宣布从今天开始到9月23日,免费为4级、5级用户提供GPT-4omini微调服务,帮助开发者打造特定业务用例的生成式AI应用。
据机器之心报道,刚刚,OpenAI 突然宣布了「Mini」版本的 GPT-4o 模型。该公司表示,新的轻量级版本旨在让更多公司和项目能够获得最先进的技术。
微软Azure首席技术官Mark Russinovich在官网分享了新型大模型入侵技术——“Skeleton Key”(万能钥匙)。
OpenAI 公司宣布和 Color Health 合作,借助 AI 开发造福癌症患者的新方法。双方探索使用 GPT-4o 模型创建 AI 工具 Cancer Copilot,帮助医生根据患者数据(包括个人风险因素和家族史)制定筛查和治疗计划。
-------------没有了-------------