科技魔方
  • 大模型最新相关新闻
  • Meta AI 首席科学家:未来 10 年智能手机将过时

    据 Meta AI 的首席人工智能科学家 Yann LeCun 透露,未来10至15年内,智能手机将被增强现实眼镜和手环所取代。LeCun 表示:“我们最后可能需要的是智能虚拟助手,帮助我们在日常生活中。

    一两万的AIPC,只是噱头?

    2024年开年,AIPC就成了流行词。虽然PC厂商都在不遗余力地吆喝各家AIPC产品的卖点,但AIPC是什么,它和传统的PC有什么不一样?可能很多人只是停留在一些零星的了解上,而就连业界对它也没有一个统一明确的定义。

  • 定焦公众号 AIPC大模型PC
  • 585 0
  • 讯飞星火焕新,上线“超级知识助手”,跳出“长文本”混战

    科大讯飞的星火大模型V3.5春季上新,一句话声音复刻功能让科技更有温度;推出星火智能体平台,助企业解决大模型应用落地“最后一公里”难题;确定6月27日正式发布讯飞星火V4.0……

  • ​锌刻度公众号 讯飞星火科大讯飞文本大模型
  • 712 0
  • 华为PixArt-Σ放出模型文件 可在Comfyui使用

    最近,华为的4K图像模型PixArt-Σ放出了模型文件,而且diffusers也支持了这个架构,用户可以在Comfyui上尝试。

  • 站长之家 华为图像大模型
  • 550 0
  • 微软LongRoPE方法让LLM上下文窗口突破 200 万 8倍扩展还保持性能

    近日,微软研究人员提出的 LongRoPE 方法首次将预训练的大型语言模型(LLM)的上下文窗口扩展至2048k 个 token,实现了8倍的扩展同时保持原始短上下文窗口的性能,而无需进行架构变化和复杂微调。

  • 站长之家 微软大模型模型
  • 638 0
  • 支付宝小程序云推出新解决方案 烹饪机器人也用上了大模型

    近日,第135届广交会正在火热进行,记者获悉,支付宝小程序云助力合作伙伴田螺云厨,在烹饪机器人上开始用上大模型技术。

    开源Open-Sora大更新:可生成16秒,720P高清视频

    国内著名大模型开源公司潞晨科技,对其开源文生视频模型Open-Sora进行了大更新,现在可生成16秒,分辨率高达720P的视频。

  • AIGC开放社区公众号 开源大模型视频
  • 559 0
  • 2024年你可以使用的4款最好用的免费AI音乐工具

    AI音乐工具通过模拟音乐创作过程,使用人工智能技术自动生成旋律、和声和节奏,服务于音乐制作、视频配乐、游戏音效等应用场景。

    AI小镇现在可以通过Llama3在本地运行 支持Convex、Ollama等服务器

    a16z 团队开发的 AI 小镇是一个创新的虚拟城镇项目,现在可以通过Llama3完全在本地运行。

  • 站长之家 Llama3服务器大模型
  • 573 0
  • 开源多模态LLM InternVL 1.5:具备OCR能力 可解读4K图片

    InternVL 家族的开源套件提供了一种商用多模态模型的可行开源替代方案。

  • 站长之家 开源大模型数据图片
  • 597 0
  • LobeChat支持通过网页版直接调用Ollama 本地模型 体验媲美ChatGPT

    LobeChat是一个创新的网页平台,它支持通过网页版直接调用 Ollama 本地模型。这项服务的推出,为用户提供了一种便捷的方式,通过网页界面直接利用开源大模型的能力。

  • 站长之家 LobeChat大模型ChatGPT
  • 568 0
  • 通义千问开源千亿级参数模型, 性能媲美 Llama3

    通义千问开源 1100 亿参数模型 Qwen1.5-110B,成为全系列首个千亿级参数开源模型,并在多项基准测评中都创下可与 Llama3-70B 媲美的成绩。目前 Qwen1.5 系列已累计开源 10 款大模型,通义千问开源模型下载量超过 700 万。

    全面走向“人工智能+”,国内首个汽车大模型标准发布

    据央视新闻报道,针对汽车行业全面走向“人工智能+”的趋势和行业需求,中国信息通信研究院今天(28 日)发布了国内首个汽车大模型标准。

  • IT之家 人工智能AI大模型
  • 546 0
  • 阿里开源千亿参数模型 Qwen1.5-110B,性能超越 Meta-Llama3-70B

    近日,阿里巴巴宣布开源其最新的 Qwen1.5系列语言模型 - Qwen1.5-110B。这是 Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。

    Cog-Become-Image:将任意人物图像转换成指定风格的图

    GitHub 上的 fofr/cog-become-image 项目是一个创新的图像转换工具,它能够将任意人物的面部图像转换成另一种风格的图片。这项技术的应用范围非常广泛,包括但不限于艺术创作、媒体制作和娱乐行业。

  • 站长之家 图像大模型
  • 600 0
  • Meta推出LayerSkip:提升大语言模型推理速度

    Meta公司最新发布了LayerSkip,这是一款端到端的解决方案,专门设计用于提升大型语言模型(LLM)的推理速度。

  • 站长之家 Meta大模型大语言模型
  • 539 0
  • Kimi Chat移动端UI大幅重构 并上线“月之亮面”模式

    KimiChat 移动端应用迎来了重要的更新,版本1.2.1对用户界面(UI)进行了全面的重构,并引入了“月之亮面”浅色模式,旨在提供更加舒适和直观的用户体验。

  • 站长之家 KimiChat大模型月之亮面
  • 530 0
  • WebLlama:基于Llama-3-8B的智能网页浏览代理

    WebLlama是一款基于Llama-3-8B模型的智能代理,它通过对话与用户互动,执行网页浏览相关的任务。这款工具能够处理连续的对话,理解并执行用户的指令,自动完成网上搜索、导航和信息检索等操作。

    LLaVA++:为Phi-3和Llama-3模型增加视觉处理能力

    LLaVA++项目通过扩展现有的LLaVA模型,成功地为LLaVA++和Llama-3模型赋予了视觉能力。这一改进标志着AI在多模态交互领域的进一步发展。

  • 站长之家 模型大模型AI
  • 673 0
  • Mutable AI发布Auto Wiki v2:将代码转换为类似于维基百科风格的文章

    在软件开发领域,代码文档一直是个大问题。即使人工智能驱动了代码完成解决方案,文档化仍然是一个难题。

    清华团队国产Sora火了 背后创业公司已融资数亿元

    Sora爆火后,掀起了全球竞逐AI视频生成的热潮。近日,国内一支AI生成的视频短片引发关注。该视频来自生数科技联合清华大学最新发布的视频大模型Vidu。

    清华团队发布视频大模型Vidu 可生成16 秒、1080P 视频

    生数科技与清华大学在中关村论坛未来人工智能先锋论坛上共同发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu。

  • 站长之家 清华大模型视频
  • 976 0
  • PhysDreamer:让3D物体符合物理规律动起来

    在创建沉浸式虚拟体验时,实现真实物体交互至关重要。然而,针对新型交互合成真实的3D 物体动态仍然是一项重大挑战。

  • 站长之家 PhysDreamer3D大模型
  • 671 0
  • 中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频

    4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。

  • AIGC开放社区公众号 Sora大模型文本视频
  • 540 0
  • -------------没有了-------------

    图赏更多>