在最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型(LLM)所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理过程。
Generative Large Language Models (LLMs) 在各种自然语言处理任务中取得了显著成功,包括问答和对话系统。然而,大多数模型是在英文数据上训练的,缺乏在提供中文答案方面的强大泛化能力。
近日,一位在GitHub上使用“luijait”别名的西班牙渗透测试人员发布了一个名为“DarkGPT”的AI OSINT工具,旨在帮助检测泄露的数据库。
根据 Recognise 最近的 CIO 调查,分享了一些有趣的发现。Recognise CIO 调查系列是在美国与250-500位首席信息官进行的定期调查。
据消息人士透露,苹果公司正在与谷歌进行深入讨论,计划将谷歌的Gemini模型引入iPhone,以提升其人工智能技术支持。
月之暗面近日宣布,其智能助手KimiChat已开放200万字上下文的内测申请,引发了广大用户的热烈关注。作为Moonshot AI公司的产品,KimiChat以其超大的内存和强大的功能吸引了众多用户的目光。
光锥智能获取最新独家消息,继2023年8月首发后,今年4月,字节跳动旗下的大语言模型云雀大模型即将迎来重要版本的升级更新。
OpenRouter是一个创新性的项目,它为大语言模型(LLM)和其他AI模型提供了一个统一的接口。通过这个接口,用户可以直接访问和使用几十种AI模型,包括GPT、LLama、Claude、Command-R等80多个模型,未来还将扩展到数百种。
OpenAI首席技术官米拉·穆拉蒂(Mira Murati)在接受采访时透露,Sora文生视频工具计划在今年内正式推向公众。此外,OpenAI还计划为Sora加入音频生成功能,进一步丰富视频的场景和情感表达。
苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。
-------------没有了-------------