最近,富士通正式发布了名为 “Takane” 的大型语言模型(LLM),这款模型特别为企业用户打造,旨在满足安全私密环境下的需求。
MetaAI的NLLB-200登上Nature,「不让任何一门语言掉队」,能翻译200种语言的大模型获得Nature社论的盛赞——复兴了濒临灭绝的语言,但是Nature研究人员也郑重提醒Meta,必须将使用这些语言的社区也纳入进来,才会真正减缓语言
由微软支持、估值高达60亿美元的法国人工智能初创公司Mistral近日发布了其首个用于编码的生成式人工智能模型——Codestral。
Mistral AI 推出了其首个代码生成模型Codestral,这是一个功能强大的工具,旨在帮助开发者提高编码效率和质量。
谷歌推出了一款名为PaliGemma的开源视觉语言模型,该模型结合了图像处理和语言理解的能力,旨在支持多种视觉语言任务,如图像和短视频字幕生成、视觉问答、图像文本理解、物体检测、文件图表解读以及图像分割等。
iOS版本 ChatGPT 今日凌晨发布 1.2024.129 版本更新,新增支持 App 首选语言设置中文,此前为其他语言。
MyShell TTS 开发的OpenVoice是一项创新的声音克隆技术,它能够通过仅使用一小段参考发言者的音频片段来复制其声音,并生成多种语言的语音。
据谷歌官方消息,该公司旗下的 Google Research 将与 Fitbit 团队合作,共同开发一款"个人健康大语言模型"(Personal Health Large Language Model)。
初创公司 Cognition 近日发布公告,宣布推出全球首个 AI 软件工程师 Devin,并号称会彻底改变人类构建软件的方式。
大语言模型(LLM)在生成文本内容方面非常强,但在理解、生成视频、图像等方面略显不足。尤其是在Sora一夜爆红之后,让人们意识到未来主流模型一定是文本+音频+图像+视频的多模态生成、理解功能。
2月4日 消息:随着近年来大型语言模型(LLMs)在语言处理领域的显著进展,研究人员尝试将这些模型应用于药物发现,以优化相关任务。
1月17日 消息:新一代200亿「书生·浦语2.0」是一款开源的大语言模型。它支持200K超长上下文,且20B版本在数学推理方面的性能超越了ChatGPT。该模型使用了第三代数据清洗过滤技术,大幅提升了模型训练效率。
AMBER项目是针对多模式语言模型(Multi-Modal Language Models,MLLM)的一个新基准,旨在评估和降低模型中的幻觉问题。
谷歌研究院和DeepMind研究人员推出最新PaLI-3视觉语言模型(VLM),模型以更小、更快、更强的特点获得大部分研究人员青睐,在诸多任务中达到SOTA。
OpenLM是一个旨在训练中等规模语言模型的PyTorch代码库,它强调了最大化GPU利用率和训练速度的设计。
备受关注的大语言模型,核心是自然语言的理解与文本内容的生成,对于此,你是否好奇过它们究竟是如何理解自然语言并生成内容的,其工作原理又是什么呢?
新语言Mojo最近开放了编译器和集成开发环境的本地下载,这在开发社区引起了轰动。Mojo的语法简单明了,类似于Python,但运行速度可达到Python的68000倍之多。
FreeSubtitles.AI 是一个免费的在线字幕生成服务,可以将任何语言的任何内容转录成任何语言,旨在消除语言障碍。免费用户可上传最大300MB,最长30分钟的文件,付费用户可上传最大10GB,最长10小时的文件。
最近,阿里巴巴达摩院发布的一个名为 POLYLM 的多语言大型语言模型引起了人们的兴趣。与其他多语言模型不同的是,PolyLM能够在理解、推理和生成自然语言指令方面表现出显著的能力,该模型拥有1.7B和13B两种参数版本可选。
-------------没有了-------------