零一万物(01-AI)近日发布了其模型家族的新成员——Yi-1.5(6B、9B、34B),并宣布这些模型均采用 Apache2.0许可开源。Yi-1.5是 Yi 模型的升级版,它在编码、数学、推理和指令遵循能力方面展现出更强的性能,同时保持了在语言
研究人员来自伊利诺伊大学厄巴纳 - 香槟分校和微软提出了一种名为 FastGen 的高效技术,通过使用轻量级模型分析和自适应键值缓来提高 LLM 的推理效率,而不会降低可见质量。FastGen 通过自适应的键值缓存构造来减少生成
AI 功能早已进入手机,比如拍摄优化、面部识别、语音助手等。2024年被手机厂商宣称为“AI手机元年”,主要是指AI大模型进入手机,可能引起交互与体验的变革,如语音交互能否取代触屏,个人智能助理成为重要的用户价值等。
OpenAI正在为其流行的语言模型ChatGPT部署一项特别的新功能,该功能将使其能够进行类似电话通话的交互。这一更新预计将在周一的某个活动中公布。
随着ChatGPT、Midjourney等大模型产品的影响力、应用场景越来越多,为了确保输出的内容安全、可靠,对齐成为开发人员的关注重点和难点。
IBM 最近发布了一组名为 "Granite Code" 的开源型,旨在帮助企业完成各种软件开发任务,并在基准测试中表现出色。这些模型不仅过了一些较大的开源竞争对手,而且在编程任务中展现出了强大的性能。
由多方企业和机构组成的日本联合研究团队昨日发布了 Fugaku-LLM 大模型。该模型的最大特色就是其是在 Arm 架构超算“富岳”上训练的。
Lumina-T2X 是一个创新的内容生成系列模型,它采用了统一的 DiT(Diffusion Model)架构,能够通过文本生成图像、视频、多视角3D 对象以及音频剪辑。
近期,来自伦敦帝国理工学院和戴尔的研究团队推出了 StyleMamba,这是一种有效的框架,用于转移图片风格,通过使用文本来指导风格化过程,同时保持原始图像内容。
2023下半年起,以谷歌、三星、OPPO为代表的厂商将大模型内置于智能手机中,完成从云端AI向终端AI的转变,AI手机浪潮正式开启。
SiriUltra是一款由大型语言模型(LLMs)支持的智能助手,它能够与iPhone上的快捷命令集成,实现包括Llama3、GPT等模型在内的对话功能。用户现在可以享受实时语音交互和联网搜索的便利。
Phi-3WebGPU是一款由Xenova提供的AI模型,它在Hugging Face Space中推出,允许用户直接在浏览器中本地运行AI模型。这一创新工具结合了Transformers.js和onnxruntime-web,为用户提供了一个私密且高效的AI体验。
5月9日,阿里云正式发布通义千问 2.5,这是其旗下的通义大模型系列的最新版本。与此同时,阿里云还开源通义千问 1100 亿参数模型。
近日,百度创始人、董事长兼首席执行官李彦宏在一场盛大的内部颁奖活动中,向在场的获奖团队和个人致以热烈的祝贺,并深刻阐述了百度对技术的坚定信仰和对未来的美好展望。
最近,GeminiAI助手宣布了一项新的功能,即将支持播放YouTube Music中的音乐。这一更新将极大地提升用户的体验,让音乐播放变得更加简单和流畅。
在百度文心一言、商汤日日新等当下国内主流大模型,陆续产品迭代升级至“全面对标GPT-4Turbo”之后,阿里云也入场了。
OpenBuddy团队发布了基于 MetaLlama370B的最新成果:OpenBuddy-Llama3-70B-v21.1-8k,这是他们首次在 Llama370B 基座上的中文跨语言训练尝试。
KreaAI 正式发布了其最新的视频生成功能,这一更新包括了自定义视频首尾帧和为每张图片定义提示词的能力。
由GoogleDeepMind与Isomorphic Labs联合研发的新一代人工智能模型AlphaFold 3,登上了权威科学期刊Nature。
人工智能生成的对话代理(CAs)如 Alexa 和 Siri 旨在回答问题、提供建议,甚至展现同情心。然而,最新研究发现,在解释和探索用户体验方面,它们与人类相比表现不佳。
-------------没有了-------------