文| 董二千
编辑|杨旭然
2006年,亚马逊推出云计算服务弹性计算云EC2(Elastic Compute Cloud)。同年8月,在搜索引擎大会上,谷歌前CEO埃里克·施密特提出了“云计算”的概念,正式宣告了现代云计算的到来。
云计算从 AWS 起步时的牛刀小试,到如今已成长为一个巨大的生态体系。比如云计算兴起后,SaaS服务成为诸多企业的标配,Salesforce、Shopify等头部企业均踩中了风口,成为生态链中不可或缺的部分。
十余年后,我们又站在了人工智能原生产品的新起点。正如云计算在过去带来了技术生态系统的巨大变革,重构了软件价值链,人工智能也将成为未来应用的核心组建,而基础大模型正是其核心推动力。
可喜的是,已有一批新兴玩家投身于此。
零假设能够帮助用户将医学文献检索、筛选过滤、内容提取、编辑整理等步骤中设计到的时间成本从数天甚至数周缩短至1天甚至几个小时;幻量科技使得新材料研发速度实现了倍速提升,,使研究人员无需编程经验便轻松应用先进的算法和计算及实验平台进行材料设计与优化;ChatDOC重新定义了阅读方式,用户只需上传文档,和AI进行交互对话,就能立即得到有依据的回答……
为了促进大模型生态的健康发展,百度等龙头企业已率先作出表率。
今年5月百度创始人、董事长兼首席执行官李彦宏宣布,百度将设立10亿元人民币的百度文心投资基金,旨在推动大模型生态繁荣,同时启动"文心杯"创业大赛,最高奖项为价值1000万元早期投资。
9月5日,李彦宏在百度云智大会中表示,AI原生应用要能解决过去解决不了、解决不好的问题,应用才是大模型存在的意义。“模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,卷大模型没有意义,卷应用机会更大。”01 万亿金矿
OpenAI创始人山姆·阿尔特曼在《万物摩尔定律》一文中畅想了AGI(Artificial General Intelligence,通用人工智能)如何改造人类社会,核心就是将人的成本从边际成本变成固定成本,而固定成本则意味着每18个月成本就会减半,最终将无处不在。
举个简单的例子,过去培养一名医生需要大量的学习进修以及临床经验,但AGI可以将医生代码化,让技术顶尖的医生能够服务更多人,且成本也能大幅降低。而这也被称为范式转移,即新的科学革命导致原有科学体系的基本假设被改变甚至颠覆。
创新工场创始人李开复在沙龙上,指着分析师估算的AIGC行业规模2000亿美元,称这个数字“太保守”,就是因为“没有考虑到范式转移”。
先行者们已经走出了AI改造社会的第一步。
2019年,顾飞看了创新药市场的蓬勃发展,于是创办了零假设,定位于打造医药专业知识平台,连接企业和医生的共同需求。成立初期,零假设的知识平台更偏专业领域,主要面向医生和药企内部的专业人员,而非营销人员。
这是由于过去在医学领域,产品的准确性和易用性是无法两全的。医生往往通过专业的论文搜索引擎、数据库等,查询专业知识,但是这往往有较强的门槛;用户能否问一句话就能找到想找的东西,这在大模型出现之前完全做不到。
正是看到了这样的机会,零假设成为了第一批拥抱大模型的企业,其主要调用大模型的语言表达能力,英文部分使用GPT,中文部分使用百度千川大模型平台。如今,零假设的产品易用性已得到大规模提升。
对于大模型平台而言,与不同行业合作伙伴合作,结合各自所拥有的大量丰富的场景,提高模型在行业上的适配性,这也是大模型落地的机制。 02 App Store时刻
2022年底推出的ChatGPT一夜爆火,成为有史以来增长最快的应用。英伟达CEO黄仁勋为此感叹道:“我们正处于 AI 的iPhone 时刻。”
但鲜少被关注的是,苹果于2008年推出的App Store在某种程度上的重要性甚至高于iPhone,因为它重新定义了手机应用的装载逻辑。只有在吸引海量软件供应商入驻后,iPhone才从一个稍微有点用的电子设备变成革命性的智能手机。
大模型同样如此。
一方面,当前的大模型基本是基于广泛的公开文献与网络信息来训练的,数据“噪音”过大,导致大模型的行业针对性与精准性不足。因而,需要零假设等应用层企业做数据训练或精调,才能打造实用性更高的场景服务。
另一方面,大模型的行业落地更在于深入产业的进程,即在具体的产业应用中,需要深层次的行业know-how能力。如在生产管理中,需要将原料特性、排产规则、资源分配规则等数据“喂养”给大模型,这才能使其具备工厂计划员类似的能力。而这同样也需要应用层企业的努力。
如今,百度正驱动着AI的App Store时刻到来。
今年3月,为了降低企业使用大模型的门槛,百度推出“百度智能云千帆大模型平台”,满足不同行业、不同规模、不同开发能力的企业用大模型的需求。
5月,“文心杯”大赛启动,短短时间内就吸引了近1000个项目激烈角逐,超8成项目聚焦大模型应用层落地,创业者积极探索医疗、教育、金融、法律等行业应用的重构与改造,应用场景趋于多元化。百度为决赛入营团队提供了稳定可用的文心大模型API和百度智能云资源。
9月,百度智能云发布千帆大模型平台2.0。升级之后的千帆拥有“四个最”:预置最多的大模型和数据集、有最丰富最全面的工具链、最佳算力效能、最完备的大模型安全方案。
对于“文心杯”的优胜者,李彦宏表示,百度将拿出数千万元投资上述团队,并在技术、产品、发展战略、资本合作等方面长期支持,“我相信文心大模型将成为AI创业者、开发者的首选,越来越多的应用会建立在模型之上,整个生态系统将充满活力。” 03 基础设施
8月31日,首批通过《生成式人工智能服务管理暂行办法》备案的大模型百度文心一言、百川智能等宣布向全社会开放服务。这意味着大模型已经从技术层面进入应用环节,大规模可复制的产业落地或已近在咫尺。
当AI的智力成为未来必备的生产要素时,相应的供应公共产品和服务的企业就一定会出现,而大模型也必将出现基础设施服务商。
然而,大模型的训练成本相当高昂。英伟达曾披露训练一次1750亿参数的GPT-3需要34天,使用1024张A100 GPU芯片,单次训练成本高达1200万美元。为了训练超大规模的AI模型,微软甚至为OpenAI构建的一台排名世界前五的超级计算机。
而大模型一旦商用后,运营成本同样会居高不下。谷歌母公司Alphabet的董事长约翰·汉尼斯表示,基于大型语言模型的搜索的成本可能是标准关键词搜索的10倍。
因此,未来大模型领域势必出现赢家通吃的局面。如李彦宏所判断的那样:“中国会出现至少一个、也可能是两个或三个基础大模型,可以支持人们开发各种AI原生应用。”
百度在这一方面显然有着天然的优势。“百度文心一言应该是目前效果国内效果最好的大模型”, ChatDOC CEO林得苗评价道。
多年以来的积累使得百度的技术能力毋庸置疑。在IDC发布的《AI大模型技术能力评估报告2023》中,百度文心大模型拿下12项指标的7个满分,综合评分第一,尤其是算法模型、通用能力等基础技术领跑全行业,算法模型获得唯一一个满分。
与此同时,百度在数据搜集层面也有着天然的优势。作为第一批向社会开放的大模型。据百度官方数据,文心一言全面放开后的 24 小时内,共计回复网友超 3342 万个问题。
我们除了看到大众沉浸在生成式 AI 的热潮之中,也看到,文心一言的放开全面引领着自然语言处理技术的潮流,更多创业者、开发者深刻意识到生成式 AI 的广阔发展前景。
李彦宏也曾指出:“无论是哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年的坚持和积累,没法速成。”
同时,躬身入局、打造生态也是百度发力的重点。截至目前,百度智能云千帆大模型平台上月活企业数已近万家,覆盖金融、制造、能源、政务、交通等行业的400多个场景。 03 写在最后
虽然早在2006年,云计算就已然出现,但其真正赋能产业却在多年以后,早期拥抱云计算最知名的案例Netflix也在2010年才将业务全面迁移到 AWS。
相较于此,大模型产业融合的觉醒时间已然大幅提前,大模型只是第一步,AI与产业的融合才是更具想象力的未来。AI原生应用要能解决过去解决不了、或解决不好的问题,而绝不仅仅是对移动互联网APP和PC软件的简单重复。
技术奇点时刻或许已然到来。