科技魔方

大模型公司对标:零一万物

更多动态

2024年11月13日

  公司档案

  北京零一万物科技有限公司(以下简称“零一万物”)成立于2023年5月,是由创新工场董事长兼CEO李开复创立的AI大模型公司,企业坚持“AI Infra+模型+应用”三位一体全栈式布局,以TC-PMF(Technology-Cost Product-Market-Fit,技术成本*产品市场契合度)为核心追求目标,推动AI 2.0时代大模型技术的快速迭代及多领域落地应用。2023年11月,发布首款开源预训练大模型Yi-34B,成功登顶Hugging Face全球开源模型排行榜。2024年5月,发布闭源千亿参数大模型Yi-Large,在国际权威盲测榜单LMSYS中排名世界第七,中国第一。2024年10月,发布全新旗舰大模型Yi-Lightning,在LMSYS榜单中首度实现国产大模型超越OpenAI GPT-4o佳绩,排名世界第六,中国第一。

  图1 零一万物公司发展历程

  AI大模型技术、产品与服务

  1.技术:模基共建,解锁更低模型训推成本

  自研AI Infra:AI Infra指支撑大模型训练和部署的底层基础设施,零一万物自成立初即将自研AI Infra作为发展必经之路,以优化底层训练方式作为出发点,通过底层技术的突破打造模型成本优势。如优化GPU集群,着力提升模型算力利用率,实现千亿参数Yi-Large模型训练成本同比下降一倍之多;自建向量数据库“笛卡尔”,搭载全局多层略缩图导航技术和自适应邻居选择策略等,具备超高精度、超高性能等核心特性,接入后,模型部署成本降至原第三方向量数据库的18%。

  优化模型架构:零一万物持续迭代模型架构,推进模型架构与AI Infra的联合优化。如今年10月发布新旗舰模型Yi-Lightning,采用Mixture of Experts(MoE)混合专家模型架构,并在训练过程中做了新的尝试——引入独特的混合注意力机制、动态Top-P路由机制、多阶段训练方案等,模型性能实现显著提升的同时,推理速度也迎来飞跃,首包时间相较今年5月发布的Yi-Large降低近50%,最高生成速度提速约四成。

  2. 产品与服务:模应一体,推进模型应用并行迭代

  开闭源大模型:一方面,利用开源模型打出品牌效应,推出基座&对话大模型Yi-1.5-6B/9B/34B、多模态大模型Yi-VL-6B/34B、代码大模型Yi-Coder-1.5B/9B等一系列开源大模型,其中,Yi-1.5-34B-Chat发布当月在MMLU-Pro榜单中与Meta-Llama-3-70B-Instruct、DeepSeek V2名列开源模型前三名。另一方面,通过闭源模型开展商业探索,推出全球SOTA千亿参数大模型Yi-Large、新旗舰模型Yi-Lightning等,其中,Yi-Lightning在国际权威盲测榜单LMSYS中排名全球第六、中国第一,创造出国产大模型首次在全球舞台超越OpenAI GPT-4o的最佳成绩。

  AI-First应用:面向海外市场,聚焦生产力工具、社交娱乐领域开发应用,推出集AI聊天/阅读/写作/创作等工作需求于一体的一站式个人AI工作空间PopAi、提供虚拟角色陪伴服务的Monaland、主打熟人间社交游戏的Shado、针对年轻人的下一代交友软件Bingo.AI等多款ToC应用,快速收获超千万海外用户量。面向国内市场,上线符合国内职场特性的一站式AI工作平台“万知”,能够提供会议纪要、周报撰写、财报/论文解读、PPT创作等功能,据万知团队观察,用户使用万知后个人工作效率平均提升50%以上。

  API开放平台:推出Yi大模型API开放平台,发布包含最新模型Yi-Lightning、Yi-Large、Yi-Medium、Yi-Spark、Yi-Vision等多种尺寸大模型的API接口,方便用户根据实际使用需求,灵活选择体验更好、成本更优的模型或服务。此外,平台API与OpenAI API完全兼容,用户仅需修改少量代码,即可实现平滑迁移。

  3.商业模式:海外主抓C端市场,国内重心由C端转向B端

  海外C端产品以订阅付费为主。零一万物将ToC主战场定在商业化较成熟的海外,以收入目标为核心做产品增长,采用会员订阅制付费模式,且在产品上线第一天即开启收费模式。目前,海外生产力应用PopAi的ROI(Return On Investment,投入产出比)已达1,2024年预期营收过亿人民币,初步摆脱烧钱获客,验证了C端订阅制商业模式的可行性。

  国内计划深耕B端市场,以API调用服务、“能赚钱”的解决方案为主。由于国内用户付费意愿相对较低,零一万物国内ToC应用“万知”目前完全免费,且暂不考虑推新。2024年下半年,零一万物将国内发展策略调整为主抓B端,一方面提供性价比极高的大模型API服务,最新模型Yi-Lightning的推理成本是每百万token收费14美分(0.99元人民币),仅为OpenAI较小模型o1-mini推理成本的54%;另一方面专注于企业用户的重大需求痛点和盈利点,走出高度定制化、重交付的商业模式陷阱,寻找能够按照使用情况收费的高价值场景,提供有利润的解决方案。

  AI大模型市场拓展

  先期瞄定海外市场,优质成果本土化落地。在国内众多大模型厂商普遍处于场景探索阶段时,零一万物选择海外先行,在应用落地步伐较快的海外市场中定位大模型真正刚需场景。公司在新加坡成立全资子公司INAI PTE. LTD.和YOURFRIEND PTE. LTD.,推出面向C端用户的多款应用产品。在快速抢占海外市场份额的同时,将经过验证的取得明显阶段性成果的ToC产品能力,复用至国内ToC甚至ToB产品研发中。

  采用“一横一纵”打法,推动大模型解决方案落地全行业。首先在单个行业中纵向做深做透,选取全员积极拥抱新概念的企业作为目标客户,深入实际业务场景设计解决方案。进而借助Yi系列基座模型优秀的横向泛化能力,结合SFT(Supervised Fine-tuning,监督式微调)技术及行业积累,为广泛B端客户提供“标准化+垂直精细化”的全行业ToB整体解决方案。

  AI大模型组织与运营

  打造专业AI Infra团队,建立底层基础设施护卫军。零一万物以来自阿里、华为、微软、商汤等头部大厂的行业高级技术专家为班底,由前华为云AI CTO及技术创新部长、前阿里达摩院AI Infra总监戴宗宏担任负责人,组建了一支顶尖AI Infra团队。团队集结后的短短两个月内,便高效完成数千张最新GPU集群和配套高性能分布式存储服务的设计、选型、施工、交付和验收工作,成功支撑起Yi系列模型的研发与训练。

  AI Infra、模型、应用三大团队高度共建,实现团队间紧密协作。零一万物打破团队间壁垒,将三大团队对接到一起,形成一体化One Team,提升整体工作效率。如应用团队能够摸清模型能力边界,从而精准定位产品功能范围;模型团队能够充分了解产品需求,找到模型和实际应用快速一体化迭代的方案;算法团队能够“向下沉淀”,具备底层CUDA算子、通信算子编写能力等。

  AI大模型资本运作

  零一万物AI布局得到资本市场认可,目前已完成三轮融资。去年11月,零一万物获得由阿里云领投的数亿美元融资,公司估值超10亿美元,表明距离成立仅6个月时间,零一万物已跻身AI独角兽行列。阿里云的投资,为零一万物大模型训练提供了强大的云计算平台和算力资源。今年8月,零一万物完成新一轮数亿美元融资,据相关机构评估,零一万物最新估值约为104亿元人民币。

  表1 零一万物融资情况

  AI大模型生态体系

  构建良好开源生态。一是升级开源模型版本,将Yi-34B、Yi-9B和Yi-6B等中小尺寸开源模型升级为Yi-1.5系列,每个升级版本均达同尺寸中的SOTA性能最佳水平。同时,更新Yi系列模型开源许可证,从Yi Series Models Community License Agreement变更为更加宽松的Apache 2.0,给予开发者更高自由度。Yi-1.5系列、Yi-VL、Yi-Coder等模型已在Hugging Face、GitHub、ModelScope等国内外头部开源社区上线,并面向广大开发者开放商用申请。二是重视开发者体验,一方面在开源社区中提供微调代码以及与主流模型兼容的微调框架,帮助开发者轻松上手;另一方面致力于提升社区服务质量,通过建立有效沟通机制,确保开发者反馈得到及时回应。

  API进驻全球市场。在国内,零一万物Yi-Large、Yi-Medium等模型登陆阿里云大模型服务平台“百炼”,借助阿里云丰富的云上算力资源和完备的工具链,面向企业提供API服务,并提供限时免费调用额度。在国际舞台上,零一万物Yi-Large模型上线NVIDIA模型推理微服务平台NIM,成为国产大模型中唯一登录NVIDIA官网的模型;Yi-Large API接入全球头部模型托管平台Fireworks AI,借助平台高效的资源管理和优质的模型推理服务能力,穿透全球市场。作为国内为数不多的以开放API形式入驻海外头部平台的企业,零一万物此举意味着将Yi系列模型置于更为真实且激烈的全球竞争中。

  本文作者

  赵明明

  战略发展研究所

  二级分析师

  硕士,主要研究方向为工业互联网、人工智能、金融科技、产业数字化等领域。

  王晓娣

  战略发展研究所

  助理分析师

  大连理工大学硕士,就职于中国电信研究院,专注于人工智能、工业互联网等领域技术及产业研究工作。

+1

来源:天翼智库

延展资讯