文 / 七公
出品 / 节点商业组
2023年夏末初秋,这场由ChatGPT催生的大模型热,依然在全球火轮高吐。
但随着越来越多的玩家入场,“百模大战”全面打响,于极度喧嚣和热闹的气氛中,行业也逐渐陷入“冷思考”:过往不乏新技术昙花一现,大模型能否可持续发展?能否走出拼参数、拼数量的“短视主义”,迈向长期的价值成长?
9月5日,2023年百度云智大会上,百度智能云宣布推出千帆大模型平台2.0,为企业提供更加高效、低成本的大模型开发解决方案。
此前8月16日,于2023 WAVE SUMMIT深度学习开发者大会上,百度亦向外界展示了科技创新和产业升级浪潮下,大语言模型文心一言与深度学习平台飞浆如何重塑生产方式、商业链路、业务模式、社会关系和生态底色。
在复盘了百度的所思所悟、所行所向后,关于大模型的价值成长之路,或许可以参透一二。
价值成长——技术力?
对大模型而言,第一关自然就是技术实力。
上个月的WAVE SUMMIT,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰首次对外表示,AI具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能。
为什么这么说,就像在考试时,我们从审题、破题、答题,到最后复核的过程,其实是理解、记忆、逻辑及生成等能力的整体封装和综合运用。
事实是,这条放之四海皆准的道理,也几乎是考核所有大模型的标准。
就拿文心一言和千帆来说,它首先从海量数据和内容的融合学习中,得到预训练的大模型,并采用有监督精调、人类反馈的强化学习和提示等技术,锻造知识增强、检索增强和对话增强等底层力量。
接下来,再通过有深度、有广度、有指向的创新,继续在知识增强、检索增强和对话增强等根柢刨挖、耕作,实现基础模型、精调技术、知识点增强、逻辑推理、原生插件等功能的改进。
比如,推理方面,凭借大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术,文心一言显著精进了逻辑推理、数学计算及代码生成等任务的表现。
在最新版本的3.5中,文心一言提出“知识点增强技术”,旨在让大模型能够更好地利用精细的知识点来拔高理解能力,加强对世界知识的调度和掌握,解决用户更具象、更确切、更多元的需求,
为此,文心一言新增插件机制,包括百度搜索、览卷文档、一镜流影、说图解画、E 言易图五个官方外挂,对应实时抓取准确信息、长文本摘要和润色、文生视频、看图说话和随拍配文、数据洞察和图表制作。
比如,一镜流影依托文心跨模态大模型,集合视觉、语音、文字、影像技术于一体,突破了不同模态之间语义对齐的难题,用户仅需简单输入文字,即可在1分钟内获得完整、高品质的AIGC视频。
再如,E言易图,只需扼要输入数据图表要求或相关数据内容,即可生成可交互图表,协助用户完成数据读取、分析及图表信息的交互演示,从而使大模型与办公、财务、数据统计等领域更为紧密、有针对性的结合。
9月1日,文心一言率先向全社会开放。截至目前,文心一言已经能熟练驾驭200多个创作体裁,内容丰富度是发布初期的1.6倍,思维链长度是发布初期的2.1倍,知识点覆盖也达到了发布初期的8.3倍。
价值成长——共创力?
当下,我们常常听到几个词,构筑生态、正和博弈、打开格局……说的其实都是互利共赢的思维、开放包容的心态,实质是利他利己、普惠众生。
2023 WAVE SUMMIT,百度正式推出星河大模型社区,并现场宣布文心大模型“星河”共创计划,王海峰称,飞桨开发者社区AI Studio中文名“星河社区”,含义是“文心加飞桨,翩然赴星河”,“希望和所有的开发者一起,在飞桨和文心的加持下,共建星河社区,共赴通用人工智能的星辰大海。”
经节点财经了解,飞桨深度学习框架早于2016便对外开源,并伴随技术进步和产业发展,不断扩充资源库,延展能力边界和服务深度,为开发者提供日新月异的沟通、成长环境。
2023 WAVE SUMMIT,飞浆又拿出了诸多“拆掉藩篱、共同灌溉”的实效安排。
首先,飞桨开源框架2.5 版再度进化,联合文心一言,驱驰大模型训练、推理、多硬件适配等能力大幅提升。
比如,在飞浆端到端自适应混合并行训练技术的加持下,叠加压缩、推理、服务部署的协同优化,文心一言的训练速度和推理速度分别达到原来的3倍、30多倍,模型效果提升50%,也使开发者的体验更方便、更敏捷、更易用。
其次,飞浆自身,也完成了重要迭代。
一方面,通过建设基础算子体系和组合算子体系,飞桨将神经网络编译器CINN与主框架耦合打通,借助其优异的编译能力和领先的训推速度,实现了更加通用的性能优化,降低开发门槛。
另一方面,基于高阶自动微分、复数微分、高阶优化器等计算能力,特别是可持续扩展的高阶自动微分,飞桨开源平台自研了一系列用于科学研究的工具组件,包括赛桨PaddleScience、螺旋桨PaddleHelix、量桨Paddle Quantum等,支持复杂外形障碍物绕流、结构应力应变分析、材料分子模拟等丰富算例,广泛支持AI加计算流体力学、生物计算、量子计算等前沿方向的科研探索和产业应用。
由此,飞桨全新的训练架构初步成型,不仅保持了动静统一、一行代码转静态图训练部署的优势,而且通过编译器技术进一步降低了模型性能优化的边际成本。
除此之外,飞桨还与英伟达、寒武纪、华为、Arm等多家公司开展了适配,覆盖云和端侧多种硬件类型,为AI Studio大模型社区引入多元生态算力,共同开发课堂与培训内容,助力开发者向AI纵深处探索。
得益于上述科技平权和分我杯羹的举动,以及飞桨+文心的互相促进,迄今,星河大模型社区已凝聚了609万开发项目,积累超300个大模型创意应用,飞浆生态的开发者数量超过800万,服务22万家企事业单位。
某种程度上,该种举动,也为百度激活生态创新,孕育AI时代现象级产品与应用打下坚实的地基。
价值成长——生产力?
2023年,面对空前兴奋和繁盛的AI,有人高呼这是“iPhone时刻”,有人振臂这是第四次工业革命,也有人惊叹这是新一代的“火”和“电”,但归根结底,它是一项技术。
而技术只有实实在在地转化为生产力才是有意义的,才能行稳致远。
换言之,无论大模型多么先进,它只有走出实验室,走向现实的场景,在千行百业的生产线里发挥作用,才能体现价值,也是其良性循环、长线跑赢的开端。
关于这一点,百度一直在身体力行。作为业内较早推动大模型在产业里落地的厂商,百度携手国家电网、浦发银行、泰康、吉利、深圳燃气、TCL等企业单位,合作发布了11款垂直大模型。
最新升级的千帆大模型平台2.0,更瞄准产业发力,据百度智能云沈抖负责人介绍,千帆大模型数量增至42个,预置了41个高质量有行业特色的数据集,月活企业近万家,覆盖金融、制造、能源、政务、交通等行业的400多个业务场景。
就拿长期受“双十魔咒”平均成本超过10亿美元、研发周期大于10年)医疗行业来说,由于大模型的接入,可能斩获弯道超车的机会,提速商业化进程。
杭州立德百克生物医药采用飞浆文心大模型进行药物发现,仅仅几个小时内,就在780万个化合物的虚拟筛选库中筛选出了110个打分较高的潜在候选分子,不仅大幅缩短工作时长,且有效控制成本费用,降低路径难度,而在过去,新药研发人员想要找到对应的目标分子,其进展的快慢,往往取决于运气。
接着以复杂、庞大的黑巨人——钢铁工业生产为例。
钢铁厂生产钢筋过程中会采用计算机控制技术实现钢筋自动定尺并对钢筋进行切断,这道工序看似简单却极具杀伤力——一旦部分钢筋长度超限,且没有及时处理,就会给后续工序的机械臂造成严重损伤。
针对这一问题,宝武中南钢铁在该智能化项目的负责人引入AI技术手段,根据飞桨图像分割开发套件PaddleSeg打造的“钢筋长度超限监控方案”,于2023年2月上线并在多条产线稳定运行至今。
后续反馈显示,该方案替换了传统的工人师傅人工核查的方式,启动后各项指标效果优异,语义分割评价指标(mIoU)> 99%,异常/正常二分类准确率(Accuracy)大于99.5%,显著提高了生产安全性和生产效率,单条产线成本节省超过50万。
诚然,上面两个例子只是百度大模型不胜枚举事迹中的个别择录,但管中窥豹,我们仍然能感受得到,它是理性和真实的,致力于生产力变革,为产业提“智”增效、活水净水。
亦如沈抖所言,大模型将改变所有行业,三大“智能新基建”将提速。