科技魔方

年内狂揽五项第一,“字节系大模型”何以后发先至?

更多场景

2024年09月20日

  作者/琳玉

  “600亿”、“1000亿”、“5000亿”、“1万亿”……

  这不是拍卖会的叫价现场,而是国内大模型的日均Tokens处理量。据各厂商最新消息,这一数据正在不断被刷新。近日,MiniMax再宣布,已达单日超3万亿Tokens处理量。每一步跨越,都是大模型的又一次飞跃。

  然而,随着模型竞赛步入下半场,Tokens处理量已非衡量大模型价值的唯一标尺,行业关于“第一”的较量转向应用落地。其中,素有“卷王”之称的字节,虽然入局大模型仅有不足两年的时间,如今已在行业内成功拿下了多项第一:

  ·一季度,豆包登顶七麦数据《2024年第一季度ios实力AI产品排行榜》

  ·在高考新课标Ⅰ卷全科目大模型测试中,字节豆包以542.5分获得国内大模型排名文科总分第一;

  ·智源研究院发布解读国内外140余个大模型全方位能力评测结果,字节豆包Skylark2位列第一;

  ·Unique Capital报告显示,今年7月,字节旗下CapCut和Doubao在全球人工智能(AI)应用下载超越了OpenAI的ChatGPT,斩获全球第一。

  ·官方数据,当前豆包支持50+下游业务,已成为中国市场用户量最大的AIGC应用。

  上半场低调蓄力,下半场火力全开。当下,字节庞大的大模型帝国仍在不断扩张。作为大模型战场的“后来者”,字节是如何实现逆袭的?背后有哪些关于创新、决心与速度的故事?在当今大模型时代下,值得深思与探讨。

  01

  巨资揽才

  中科系、百度系撑起字节半壁江山

  追溯中国大模型的发展历程,“字节”身影的出现,已在相当靠后的阶段。

  早在2019年,百度凭借其“人工智能研究中心”的技术积累,率先在国内推出文心大模型,这也成为我国在大模型领域的重要里程碑。随后,阿里巴巴“达摩院”与“腾讯研究院”的成立加速了自研大模型的开发。

  2021年,阿里成功发布全球首个10万亿参数的多模态大模型;同一时期,腾讯连续推出多个千亿至万亿参数级别的大模型;为后续更大规模的研发奠定了基础。

  时间来到2023年,国产大模型迎来爆发期。众多大厂及创新型企业纷纷亮出自研大模型产品,阿里通义千问1.0、腾讯混元、360智脑、华为盘古、科大讯飞星火、商汤日日新、百川大模型,以及智谱AI的GLM等均诞生于这一时期。

  国内大模型发展时间线

  当行业发展渐行至深水区,字节才姗姗来迟。

  2024年年度全员会上,字节跳动CEO梁汝波反思字节的技术敏感度不如创业公司:“公司层面直到2023年才开始讨论GPT,而业内做得比较好的大模型创业公司都是在2018年至2021年创立的。”然而,似乎“颠覆传统,又保持一定的秩序”是字节发展的独特风格。一旦入局,就迅速集结精兵强将、光速启程。

  2023年1月,字节正式成立大模型研发团队。据悉,当时最核心的两个小组主要来自内部其他业务线:一个来自原搜索部门,负责开发语言模型;另一个则来自产品研发与工程架构部下的智能创作团队,负责图片模型的开发。

  大模型新部门成立之后,字节在AI大模型方面形成了“三管齐下”的策略:由TiKTok产品技术负责人朱文佳、字节ALLab(人工智能实验室)总监李航、数据-应用机器学习(Data-AML)负责人项亮分别领导三大团队,方向侧重于业务落地、学术研究和介于两者之间的应用研究。

  2023年8月,仅数月之后,大模型研发团队迎来重要进展:自研“云雀”大型模型完成网信办备案工作(后更名“豆包”)。同一时期,字节还推出了一款多模态大型模型——BuboGPT,可见其研发与发展的高效率。

  2023年11月,为进一步推动AI技术的深度应用,字节宣布成立全新部门——“Flow”,直接归属于研发与工程部门(PDI)。据悉,该部门有四个主要业务线:AI教育、国际化、社区和豆包。

  Flow成立时就形成了强大的领导阵容:包括由原大模型团队负责人朱文佳担任业务负责人、字节技术副总裁洪定坤担任技术负责人、字节产品和战略副总裁朱骏担任产品负责人。紧接着,飞书产品副总裁齐俊元、抖音社交负责人陆游也转至该部门,分别负责PC端和移动端产品。随着Flow部门的快速发展,逐渐成为字节大模型业务中主要的活跃部门。

  此后,字节仍持续深化大模型团队架构的优化布局。

  2024年2月初,张楠宣布卸任抖音集团CEO,转战AI生成式视频领域的剪映。

  2024年4月,朱文佳获得了进一步的晋升,直接向CEO梁汝波汇报。据悉,朱文佳领导的AI团队被称为“Seed”,由原来的搜索团队、AILab团队、AML团队强强联合而成。

  随着字节大模型的逐渐成熟,抖音、火山引擎、巨量引擎等业务部门也都开始加入AI探索。抖音负责人韩尚佑、字节跳动商业产品技术负责人刘小兵带领项目组研究AI与抖音、商业化产品的结合;谭待领导的火山引擎发布了大模型服务平台“火山方舟”,为开发者和企业提供模型训练、推理、评测、精调等全方位的平台服务。

  若深入分析字节系大模型团队的核心领导层,不难发现几个显著的特征:

  一是高管团队几乎都拥有国内外顶尖学府的学历背景,其中,中科系贡献突出。此前媒体爆料的豆包大模型关键8人中,有半数来自“中科系”;可以说,清华系撑起了大模型创业企业,而中科院系则撑起了字节大模型。

  二是众多高管成员来自BAT,其中,有百度背景的高管比例显著。

  发展至今,大模型技术已跃升为字节跳动的核心业务支柱。有消息称,字节主要高管将人工智能视为公司“输不起的战役”,已经进入“全力以赴(all in)”状态。想必这也是近期字节持续大手笔招揽人才的原因。

  今年5月,字节启动了针对应届博士生的“Top Seed”校园招聘计划,该计划提供行业内顶级薪资待遇和充足的算力资源支持,重点寻找拥有顶会顶刊论文或专利的学术人才、在国际知名竞赛中取得优异成绩的竞赛人才,以及参与过重大项目,擅长解决难题的实战人才。

  近期,有消息证实原零一万物核心成员黄文灏、原面壁智能核心成员秦禹嘉已加入字节大模型团队,汇报给朱文佳。这也标志着字节在吸引外部高端人才方面迈出了重要一步。

  近期,豆包大模型Vsion团队、Foundation团队、Speech也相继启动热招。脉脉高聘人才智库数据显示,今年上半年,字节成为新发“人工智能岗位”最多的企业。从招聘指数上看,字节跳动以9.53位居第一,大幅领先于其他互联网大厂。

  02

  国产大模型市场:三大势力圈地,各自为营

  如今,国内大模型野蛮生长的时代已经结束,取而代之的是精细布局、抢占先机的跑马圈地新阶段。各大模型厂商正凭借自身独特优势,加速抢占市场高地。随着字节系大模型的崛起,市场也逐步形成三大势力割据的竞争格局:

  首先,大厂阵营,BAT等传统巨头及华为、科大讯飞等科技企业,凭借深厚的资金积累和庞大的数据资源,迅速构建起大模型发展的坚实基础。而国产大模型的竞争战役,也已率先在大厂之间打响。

  在B端,“模型大战”与“Token价格战”轮番上演;两年前,GPT 3.5每百万Token的价格约为60美元,而今天,不少大厂的价格一降再降,甚至开始推出免费模式;在C端,内容生成、AI助手等大模型应用层出不穷。区别在于,各大厂凭借其独特的业务生态与优势业务领域,在大模型的发展道路上自然而然地孵化出了各具特色的应用方向。

  阿里大模型主要在工业、金融、媒体、教育等领域有广泛应用前景。例如,中国科学院国家天文台基于通义千问开源模型开发的“星语3.0”大模型引领中国大模型技术进入天文观测。目前,通义大模型赋能超9万企业,下载量超700万。

  腾讯大模型深度融入腾讯生态,覆盖社交、游戏、内容等场景,已接入700+款产品,包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等。

  百度大模型则覆盖创作、分析、客服等多领域,提供一站式内容解决方案和优质客服体验。例如,在智能内容创作方面,百度大模型可以为企业提供专业的营销内容创作服务,包括素材库对接、AI作图、AI海报等;

  其次,以“大模型五虎”为代表的头部创业公司,拥有行业顶级的技术尖兵与高校智囊团。成为大模型创新的中坚力量。

  与大厂的大模型团队主要来自内部组建不同,创业公司则明星人才云集、依托高校教授技术指导,不仅技术过硬,且具备高度的灵活性和创新力。这类公司往往能迅速捕捉市场趋势,推出差异化的解决方案。

  例如,智谱AI近日宣布清言app公开“视频通话”功能,跨越文本模态、音频模态和视频模态,并具备实时推理的能力。作为国内首个面向C端开放的视频通话功能,迅速收获全网关注。MiniMax在近期推出的abab6.5s系列模型的MOE架构,实现了处理速度比同类模型快3-5倍的速度。

  最后,众多潜力公司正在为行业提出新的解决方案。相比于大厂和巨头,处在长尾阶段的潜力公司倾向于探索垂类模型与应用。

  例如,云启智行专注自动驾驶创新,其大模型技术精准识别路况、规划路径,融合多源传感数据,全面感知环境,推动自动驾驶与智慧城市绿色转型;绿野智能则专注在环保监测领域,其大模型技术助力高效精准监测环境、助力科学决策、促进可持续发展。这些企业的崛起也彰显了大模型行业的多样化活力。

  在三大势力割据的行业竞争格局中,字节凭借模型的稳定性、可靠性,以及强大的应用开发能力,逐渐形成了形成了独有优势:

  1、技术创新与高效性:字节AI实验室推出MegaScale系统,专为万卡集群训练设计。该系统结合Transformer并行化与滑动窗口注意力,提升训练效率与模型精准度,增加吞吐量并降低成本。同时,采用LAMB优化器与16位混合精度训练,减少内存使用,加速计算。

  2、用户基础与市场影响力:凭借多元化的应用推荐策略,字节成功汇聚庞大用户群,稳居国内大模型APP用户规模前列,构建起坚实的用户基石,为未来发展注入动力。

  3、全球化战略与布局:字节系大模型不仅在国内市场稳固根基,更以全球化视野积极拓展海外版图,构建起独特的国际竞争优势。

  4、系统承载力与安全保障:字节利用火山引擎云服务,拥有丰富GPU资源和分钟级千卡扩缩容能力,能够智能调度应对高峰,保障高并发下系统稳定。此外,豆包大模型提供覆盖全生命周期的安全可信解决方案,从数据保护到模型运行,为用户构建坚实的信任防线。

  03

  践行实用主义:字节大模型,如何跳动?

  “无论中国还是美国,大模型今年都开始更务实了。”金沙江创投董事总经理朱啸虎在近期接受媒体采访是如是说到:“大家普遍认为,大模型的技术迭代曲线已经明显放缓,今年中美的AI创业都会更看重如何实现大模型在应用层的落地。”

  知名经济学者盘和林也指出,大模型企业仅靠在To B、To G等方面打转或许难以真正打开市场的。可见,大模型产品商业化正在成为行业升级的关键。字节作为短期内发展起来的企业,其商业模式具有一定的前瞻性和创新性:

  首先,字节正在打造超级AI应用工厂,巩固用户盘。

  伴随团队力量的完善,豆包成为大模型行业的“顶流”。在字节跳动内部上线以来,深度融入公司50多个业务线,其中包括抖音、头条等数亿DAU产品。

  今年5月,火山引擎FORCE原动力大会上,字节正式推出豆包大模型家族、火山方舟2.0以及一系列前沿的AI应用与云基础设施产品。截至目前,豆包大模型家族已扩展至9大产品线,涵盖通用、角色扮演、语音合成、声音复刻、文生图、语音识别、向量化及Function call等多种模型,全方位满足用户与企业的多样化需求。

  字节的AI布局远不止于此。从大模型产品、基础AI开发、到AI社交,再到AIGC创作,字节已构建起一个全面的AI产品生态体系和超级AI应用工厂。

  字节已在国内外推出了包括豆包、扣子、星绘、猫箱、小黄蕉等近6款APP,并且在大模型基座赋能下,还诞生了即梦、小悟空、豆包爱学、即创等基于原生业务的大模型工具应用。覆盖AI智能助手、创作、社交及教育等多个热门赛道。

  这些产品大都来自于上文提到的人工智能应用部门“Flow”,及字节原生业务部门。

  字节系大模型应用布局

  此外,字节大模型还在不断进行产品升级和迭代,以适应市场的变化和客户的需求。

  近日,字节跳动火山引擎再发宣布,豆包大模型将在9月24日发布视频生成模型,并将带来更多模型家族的能力升级。此前有消息称,未来豆包或将涉足体育、点餐等,推出豆包体育、豆包点餐等服务,进一步丰富豆包生态。

  其次,低价策略正在为字节争取来更大的市场份额。

  今年5月份,字节宣布其主力模型在企业市场的定价仅为0.0008元/千Tokens,比行业价格降低了99.3%,这一举措被认为吹响了大厂价格战的号角。对中小企业而言,极大地降低了企业采用AI大模型的门槛,可以大幅提升其业务创新和竞争力。

  极致的低价来自字节良好的成本控制。字节大模型通过持续优化模型结构,如采用混合专家模型(MoE)等技术提高模型性能效率、运用分布式训练加速模型训练过程,从保证效果、降低推理成本。此外,字节还根据各业务流量高峰时段差异,灵活调配大模型推理资源,以降低总成本。如飞书的主要流量高峰在工作时间,抖音则在休闲时段,通过智能管理优化资源利用。

  通过大幅降低价格,字节大模型吸引了大量客户和使用量。有业内消息透露,在国内云计算市场中,火山引擎的采购量尤为显著,其计算卡规模已达数万张。据悉,火山引擎去年与英伟达签订的订单量已超越前一年BAT三家的总和。这也进一步凸显了字节在当前大模型领域的发展势头。

  对此,火山引擎总裁谭待认为:大的使用量能够打磨出更好的模型,而好的模型又会吸引更多人使用,形成良性循环。

  最后,多渠道合作和多样化盈利模式联合增收。

  字节大模型采取了全方位、多维度的推广策略,深度融合线上线下资源,以精准触达并激发目标客户群体的兴趣与需求。包括在B站、小红书、抖音等平台投放广告,以及在一二线主要城市的写字楼、地铁、机场等白领聚集的场所进行宣传。这些推广活动不仅提高了品牌知名度,还吸引了大量潜在客户。

  当前,字节已经建立起与行业领先企业的深度合作。例如,火山方舟已与汽车、手机、金融、食品饮料等领域的龙头企业展开了密切合作,包括吉利汽车、长城汽车、OPPO、vivo、小米、华硕、招商银行、海底捞等。

  此外,字节还探索出了多元化创新的盈利模式:

  1、API接口调用费用:对于B端客户主要通过API接口调用技术来收费。尽管价格大幅降低,但由于使用量的增加,这一收入来源仍然可观。

  2、广告收入:在C端市场,字节大模型可能通过广告模式来回收成本。例如,通过在APP中展示广告或与其他广告商合作,实现盈利。

  3、增值服务与定制化解决方案:除了基础的API调用服务外,字节大模型还提供增值服务和定制化解决方案,以满足客户的特殊需求。这些增值服务可能包括数据分析、智能客服、个性化推荐等。

  当前,“更高、更快、更强”不仅是体育精神,更成为大模型的发力方向。行业正在持续追求更高性价比、更快的运行速度、更强的性能。在国内市场中,字节系以其后发先至的强劲增长态势,成为了业界瞩目的焦点,但放眼国际,国产大模型的发展仍然拥有很多堵点,如技术能力局限、算力供需失衡、数据安全、伦理法规等等。

  在技术创新、政策引导、市场需求等多重因素的共同驱动下,未来国产大模型的发展将是一个多方协同、持续迭代的过程。近期,字节火山方舟大模型服务平台推动共建“多云多模型”生态,接入了包括智谱AI、MiniMax、百川智能、月之暗面、澜舟科技等国内领先的大模型。通过深化合作与资源共享,共同发力,将共同推进国产大模型迈向下一个高峰。

+1

来源:第一新声 作者:琳玉

延展资讯