据 Meta AI 的首席人工智能科学家 Yann LeCun 透露,未来10至15年内,智能手机将被增强现实眼镜和手环所取代。LeCun 表示:“我们最后可能需要的是智能虚拟助手,帮助我们在日常生活中。
2024年开年,AIPC就成了流行词。虽然PC厂商都在不遗余力地吆喝各家AIPC产品的卖点,但AIPC是什么,它和传统的PC有什么不一样?可能很多人只是停留在一些零星的了解上,而就连业界对它也没有一个统一明确的定义。
科大讯飞的星火大模型V3.5春季上新,一句话声音复刻功能让科技更有温度;推出星火智能体平台,助企业解决大模型应用落地“最后一公里”难题;确定6月27日正式发布讯飞星火V4.0……
最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。
近日,微软研究人员提出的 LongRoPE 方法首次将预训练的大型语言模型(LLM)的上下文窗口扩展至2048k 个 token,实现了8倍的扩展同时保持原始短上下文窗口的性能,而无需进行架构变化和复杂微调。
近日,第135届广交会正在火热进行,记者获悉,支付宝小程序云助力合作伙伴田螺云厨,在烹饪机器人上开始用上大模型技术。
国内著名大模型开源公司潞晨科技,对其开源文生视频模型Open-Sora进行了大更新,现在可生成16秒,分辨率高达720P的视频。
AI音乐工具通过模拟音乐创作过程,使用人工智能技术自动生成旋律、和声和节奏,服务于音乐制作、视频配乐、游戏音效等应用场景。
a16z 团队开发的 AI 小镇是一个创新的虚拟城镇项目,现在可以通过Llama3完全在本地运行。
LobeChat是一个创新的网页平台,它支持通过网页版直接调用 Ollama 本地模型。这项服务的推出,为用户提供了一种便捷的方式,通过网页界面直接利用开源大模型的能力。
据央视新闻报道,针对汽车行业全面走向“人工智能+”的趋势和行业需求,中国信息通信研究院今天(28 日)发布了国内首个汽车大模型标准。
近日,阿里巴巴宣布开源其最新的 Qwen1.5系列语言模型 - Qwen1.5-110B。这是 Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。
GitHub 上的 fofr/cog-become-image 项目是一个创新的图像转换工具,它能够将任意人物的面部图像转换成另一种风格的图片。这项技术的应用范围非常广泛,包括但不限于艺术创作、媒体制作和娱乐行业。
Meta公司最新发布了LayerSkip,这是一款端到端的解决方案,专门设计用于提升大型语言模型(LLM)的推理速度。
KimiChat 移动端应用迎来了重要的更新,版本1.2.1对用户界面(UI)进行了全面的重构,并引入了“月之亮面”浅色模式,旨在提供更加舒适和直观的用户体验。
LLaVA++项目通过扩展现有的LLaVA模型,成功地为LLaVA++和Llama-3模型赋予了视觉能力。这一改进标志着AI在多模态交互领域的进一步发展。
在软件开发领域,代码文档一直是个大问题。即使人工智能驱动了代码完成解决方案,文档化仍然是一个难题。
生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。
在创建沉浸式虚拟体验时,实现真实物体交互至关重要。然而,针对新型交互合成真实的3D 物体动态仍然是一项重大挑战。
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。
-------------没有了-------------