科技魔方
  • 开源最新相关新闻
  • Deepseek V3开源!多语言编程能力飙升,力压Claude3.5Sonnet V2

    备受期待的Deepseek V3终于开源,展现出卓越的多语言编程能力,超越了Claude3.5Sonnet V2等竞争对手。

  • 科技魔方 DeepseekV3开源大模型编程
  • 693 0
  • 字节开源 Midscene.js:AI驱动的E2E测试框架迎来突破

    随着人工智能技术的迅猛发展,E2E测试领域正经历着一场创新的革命。

  • 科技魔方 字节开源大模型
  • 651 0
  • AI终于迈过这道槛!Livekit 开源模型精准识别“你是否说完”!

    在语音助手和客服机器人领域,如何准确判断用户是否说完一直是个难题。

    14万亿token训练量加持:Falcon3挑战主流开源AI模型

    阿布扎比技术创新研究院(TII)发布的新一代开源AI模型Falcon3,凭借14万亿token的训练量和优化的架构设计,在消费级硬件上表现出色,创下新纪录。

  • 科技魔方 Falcon大模型开源AI模型
  • 705 0
  • Meta 推出开源AI试衣模型 Leffa:保留更多细节

    Meta最近推出了Leffa,一个开源的AI虚拟试穿框架,旨在通过生成新图像提升用户的穿衣体验。

  • 科技魔方 MetaAI开源
  • 603 0
  • 图森未来发布图生视频开源大模型“Ruyi”:RTX 4090就能运行,可生成5秒内容

    图森未来今日发布“Ruyi”图生视频大模型,并将 Ruyi-Mini-7B 版本开源,用户可以从 huggingface 上下载使用。

    无问芯穹发布首个端侧全模态理解开源模型Megrez-3B-Omni

    无问芯穹在AI领域取得了重要进展,推出了全球首个端侧全模态理解开源AI模型Megrez-3B-Omni,标志着其在技术创新上的领先地位。

    阿里通义实验室语音生成大模型CosyVoice升级2.0版本

    阿里巴巴通义实验室语音团队宣布,其开源的语音生成大模型CosyVoice已升级至2.0版本,这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。

    去除背景噪声 阿里通义实验室开源语音处理技术ClearerVoice-Studio

    阿里巴巴达摩院的通义实验室推出了ClearerVoice-Studio,这是一项开源的语音处理技术,旨在提升语音质量与可懂度。

    迄今最大视频开源模型!腾讯混元文生视频上线:一句话生成视频

    今日,腾讯混元大模型宣布文生视频功能上线,一句话就能生成视频。

    Kimi开源底层推理框架,1小时GitHub揽星1.2k

    逐步开源高性能KVCache多级缓存Mooncake Store的实现,同时针对各类推理引擎和底层存储/传输资源进行兼容。

  • 量子位公众号 Kimi开源大模型
  • 694 0
  • Kimi联手清华开源大模型推理架构Mooncake 提升AI推理效率

    在人工智能快速发展的背景下,Kimi公司与清华大学MADSys实验室合作推出了基于KVCache的Mooncake推理系统,旨在解决高推理负载和降低推理成本的问题。

  • 科技魔方 Kimi开源大模型
  • 595 0
  • 阿里图像生成模型Qwen2vl-Flux开源,支持图像融合和风格转移等

    阿里开源了其最新研发的图像生成模型Qwen2vl-Flux,具备强大的图像生成和编辑能力。

  • 科技魔方 阿里大模型模型开源
  • 544 0
  • 成本降低1000倍!微软将开源超强RAG— LazyGraphRAG

    今年7月,微软首次开源了超大知识索引GraphRAG,仅4个多月的时间在Github已超过19000颗星,成为目前最火的RAG框架之一。

  • AIGC开放社区公众号 微软开源大模型智能体
  • 612 0
  • Lightricks开源实时视频生成模型LTX-Video 生成一个视频只要4秒

    Lightricks 推出了名为 LTX Video 的开源视频生成模型,具有20亿参数。

  • 科技魔方 Lightricks开源大模型视频
  • 692 0
  • 首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

    Meta最近开源了一个7B尺寸的Spirit LM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务,还能捕捉和再现语音中的情感和风格。

  • 新智元公众号 Meta大模型开源
  • 641 0
  • 阿里发布超100个开源模型 超30万家企业接入通义大模型

    在 2024 年世界互联网大会上,阿里巴巴首席执行官吴泳铭强调人工智能对互联网行业的深远影响,介绍了阿里发布的 100 多个开源模型及 30 万家企业接入通义大模型的情况。

    GPT-4o升级到最新版本1120,重回榜首,API同步更新

    以全面提升的创意写作、技术支持和文件处理能力,再次夺回 Chatbot Arena 的榜首宝座。

  • AI小岛公众号 GPT-4o大模型开源模型
  • 522 0
  • 新开源 “人生搜索引擎” Pensieve,可记录并回忆电脑屏幕内容

    Pensieve 是一款创新的开源软件,旨在帮助用户轻松记录和回忆电脑上的活动。

  • 科技魔方 开源大模型电脑
  • 710 0
  • 人生搜索引擎免费用,开源版哈利波特“冥想盆”登GitHub热榜,支持中文

    一个以隐私为中心的被动录制项目。它可以自动记录屏幕内容,构建智能索引,并提供方便的网页界面以检索历史记录。

  • 量子位公众号 搜索引擎搜索开源
  • 699 0
  • 超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large!

    今天凌晨,法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——Pixtral Large。

  • AIGC开放社区公众号 GPT-4o大模型开源模型
  • 585 0
  • 开源AI语言模型Ultravox v0.4.1:让AI实时对话更流畅、更智能

    在人工智能的应用中,如何实现与 AI 的实时互动一直是开发者和研究人员面临的重大挑战。这其中,整合多模态信息(如文本、图像和音频)以形成一个连贯的对话系统显得尤为复杂。

  • AIbase基地 开源AI大模型模型AI
  • 625 0
  • Exo Labs让Mac M4电脑也能本地运行强大开源AI模型

    在生成式人工智能领域,Exo Labs利用Apple M4芯片成功在本地计算集群上运行强大的开源AI模型,为用户提供了降低成本、提高隐私安全的解决方案,避免对云服务的依赖。

    人形机器人“天工”面向行业开源开放

    国家地方共建具身智能机器人创新中心昨天宣布启动“天工开源计划”,对外公布创新中心成立一年以来取得的建设成就。

    通义千问开源Qwen2.5-Coder全系列 代码能力追平 GPT-4o

    通义千问团队最新开源Qwen2.5-Coder全系列,旨在推动Open Code LLMs的发展。

     256    1 2 3 4 5 6 7 8 9 10 下一页 尾页

    -------------没有了-------------

    图赏更多>