科技魔方

大模型狂飙一整年后 2024年应关注哪些关键点?

大模型

2023年12月21日

  本文来自于微信公众号 罗超Pro(luochaotmt)。

  2023年接近尾声,AI大模型的热度丝毫不减。

  谷歌刚宣布为开发人员提供新版Gemini大模型并承诺降低使用成本,微软就推出了拥有27亿参数的全新语言模型Phi-2。在头部巨头动作频频时,腰部玩家开始抱团,比如百奥几何与智谱AI开始共建自然语言-生命语言多模态大模型。

  虽然百度等巨头早在2019年前后就已布局大模型技术,但2023年确实算得上是“大模型元年”,几乎所有头部科技大厂都深度参与研发,热钱不断涌入,将“千模大战”推向新的高潮。然而,在大模型“军备竞赛”之余,业内出现了越来越多的冷思考:基础大模型越来越多,能实现产业化落地为何寥寥无几?2024年,AI技术产品化、产业化以及商业化,将是大模型发展的重中之重。“千模大战”高潮迭起 产业化成头号难题

  从参与企业规模、大模型数量与市场规模来看,中国已是仅次于美国的全球第二大大模型产业中心。

  作为国产大模型的“扛旗者”,李彦宏在上个月的西丽湖论坛上提及一组数据:截止今年10月国内发布的大模型多达238个,较6月翻了整整三倍,Hugging Face平台上可供下载的文本生成大模型则接近3万个。按比例划分,美、中两国已上线/在研大模型数量占到全球的80%以上,吊打其他国家或地区。

  据速途网测算,2023年中国大模型市场规模约为147亿元,同比翻了一倍,预计在2028年将突破千亿大关。庞大的市场规模,巨头的高度重视,诱惑着资本不断加大投入;AI对提升生产效率与经济质量有着重要意义,一定程度关系到国家核心竞争力,因此也得到了有关部门高度重视。可以说,大模型狂飙一整年,离不开政策的支持、巨头的重视和资本的热情。

  在大模型技术有序发展上我国走在世界前列,网信办等七部委联合发布的《生成式人工智能服务管理暂行办法》、北京科委发布的《北京市促进通用人工智能创新发展的若干措施(2023-2025)(征求意见稿)》等中央和地方政府扶持措施相继出炉,为大模型的发展扫清障碍,既提供必要资源倾斜,也避免技术无序发展。

  资本方面,百度、阿里、腾讯、字节、科大讯飞、美团、京东、网易等大厂均在布局大模型技术,有实力的初创企业则成了VC们争抢的香馍馍,热钱不断涌入。中国新一代人工智能发展战略研究院的报告显示,截止10月底,国内已有38起大模型投融资事件,现存AI企业已超过2200家。

  而在技术层面,文心大模型、阿里通义、讯飞星火、智谱等国产基础大模型在多个榜单上的评测均位居前列,一定程度上已能与GPT PK。

  大模型行业欣欣向荣,但依然存在一些隐忧——比如困扰大部分从业者的产业化落地问题。任何前沿技术都要转化为产品或者说应用才能为人所用,才能发挥价值。AI大模型当前在基础技术迎头直追的同时,更需要深入到产业端的场景中,在企业的生产经营中,或者用户的生活学习中发挥作用。事实上,后者正是中国AI产业一直以来的优势:相较于下棋、画画、作诗而言,中国科技从业者更接地气,善于将技术应用到场景中,让其为产品、应用或者服务所用——哪怕没那么炫酷也不重要。

  三个标杆案例

  看大模型产业化落地之路

  大模型产业化的难点很多,比如不同行业数字化程度参差不齐,不同规模、不同领域的企业对AI的应用需求、可承担的成本,有显著差别,这里的成本除了资金等经济成本外,还有应用AI技术改造业务的风险、时间与边际成本。正因为此,当前虽然很多企业都在关注大模型技术,但真正做到用大模型技术来改造业务甚至打造AI原生应用的企业,却少之又少。

  不过浪里淘沙,我们也能看到一些大模型技术和产业结合的标杆案例。

  1、度小满轩辕大模型:国内首个开源金融大模型

  数据驱动的金融业是数字化程度较高的产业,数据库、存储、服务器、自动化、信息安全等等数字化基础设施,均是在金融业率先应用普及。在AI技术普及过程中,金融业很早就在积极探索将AI与客服、风控、授信、营销等场景结合,降本增效的同时,提升客户体验。

  2023年,大模型技术爆发。金融科技先锋平台度小满在5月就率先开源了国内首个千亿级中文金融大模型“轩辕”;9月,“轩辕70B”开源开放可被自由下载和使用。作为金融场景而生的行业大模型,轩辕在智能化能力、功能服务以及信息安全上均有很强的针对性。

  这种针对性体现在多个方面:比如轩辕用来训练的数据集包含大量机构研报、专业名词、行情数据等金融行业资料,赋予了其极强的金融信息理解和处理能力。

  在技术实力上,轩辕大模型不遑多让。其已通过注册会计师考试、银行/证券/保险/基金/期货从业资格、理财规划师、经济师等金融领域权威考试。而在清华大学、上海交大和爱丁堡大学联合发布的C-Eval大语言模型测评榜单和微软亚洲研究院、MBZUAI、上海交大联合推出的CMMLU榜单中,轩辕均取得了国内所有开源模型排名第一的成绩。C-Eval和CMMLU是目前较为权威的两大专业榜单,能够同时夺得第一,对轩辕这样的行业大模型来说绝对算得上好成绩了。

  度小满轩辕大模型正在金融场景深入应用。

  在内部,轩辕大模型已深入赋能度小满营销、客服、风控、办公再到研发等场景,并已初见成效。在代码助手方面,用大模型辅助生成的代码,采纳率能够达到42%,帮助公司整体研发效率提升了20%;在客服领域,大模型推动服务效率提升了25%。在智能办公领域,大模型目前的意图识别准确率已达到97%。

  度小满向来都很重视金融科技能力对外输出。度小满CTO许冬亮透露,轩辕在5月开源时就有上百家金融机构发出试用申请。从企业客户的反馈来看,轩辕大模型的专业能力有口皆碑,2.0版本上下文对话长度增加至8K,对“非利息收入增长趋势”等金融业的深度问题也能给出专业解释。

  2、阿里通义千问大模型,在电商行业贯彻“AI驱动”战略。

  2023年阿里巴巴有许多大的变动,“用户为先、AI驱动”成为新的战略方向。4月11日发布通义千问大模型的时候,时任阿里巴巴集团董事长、阿里云智能集团CEO张勇就表示“所有软件都值得用大模型升级改造,阿里所有产品都会接入通义千问。”

  阿里确实说到做到,作为阿里大本营的电商业务就早已全面AI化。以通义千问大模型为基础,淘天集团推出了一系列面向B、C两端的AI工具。

  面向B端的工具包括官方客服机器人、图片智能生成、营销投放自主监测等,今年双11大促期间商家调用后台AI工具的次数超过15亿次;面向C端则推出AI智能助手淘宝问问,上线两个月受邀试用人数突破500万。B端工具可提高商家经营效率、降低流量成本,C端功能则可显著改善用户体验,在电商行业狂卷价格时形成差异化竞争力。

  大模型与电商场景的结合,阿里走得最快也最远,马云在阿里内网回帖中甚至提到了“AI电商”这一让人耳目一新的概念。

  为了进一步强化大模型技术实力,以及深化AI与业务的融合,近日淘天集团被爆暗中组建新的AI团队,高调高薪招聘AI顶尖人才,抓紧时间训练针对电商产业的专属大模型“图灵”。根据淘天集团此前透露的消息,未来一年会向商家发布更多AI工具,包括AI开店、经营咨询、智能周报等,服务范围涉及商家日常经营的方方面面。在阿里的推动下,大模型和电商产业的结合才刚刚开始。可以预见,2024年,头部电商平台均会加码“大模型电商”。

  3、科大讯飞星火大模型:大模型+教育的标杆玩家。

  科大讯飞的第一标签是语音智能,第二标签就是智能教育科技巨头。在大模型技术出现前,科大讯飞在AI技术上就已耕耘多年,其相当一部分营收就来自智能教育服务,如口语评测、教育硬件等教育智能化服务。

  在大模型技术爆发后,星火大模型和教育行业的结合更是轰轰烈烈。今年5月讯飞星火认知大模型1.0版本发布次日,带飞了A股教育科技板块,除了科大讯飞外,学大教育、行动教育、国新文化全跟着涨停,呈现出“星火燎原”之势。

  从1.0到3.0,讯飞星火大模型一直重点攻克代码能力和多模态能力,并基于技术上的突破开发出更多针对学校、教育企业以及教师和学生群体的功能、应用。比如针对学校管理环节的学生及教师信息管理、离校申请审核功能,为教师量身打造的教学课件制作助手,给学生提供的AI一对一启发式对话功能等。与此同时,讯飞在其翻译笔、录音笔、学习机、办公本等教育硬件上也在深入应用大模型技术,强化产品力,巩固在这一品类上的优势。

  金融、电商与教育,三个行业的头部玩家,均能在大模型的改造下获得全新增长点,可见大模型产业化并非痴人说梦,而是必然趋势。

  大模型开卷2024:

  有无产业化秘诀?

  度小满、阿里、科大讯飞们只是开了个好头,大模型产业化程度依然有很大提升空间,特别是历史悠久、数字化程度较低的农业、制造业、物流航运业、能源业等产业,更是亟需拥抱大模型技术提高生产效率,实现从数字化到智能化的跨越。鉴于此,加速AI技术产品化、产业化和商业化将是大模型行业在2024年的头号任务。谁能率先跑通产业化落地路径,谁就可以在“千模大战”中笑到最后。那么,标杆玩家们给大模型产业化带来了什么启示呢?

  第一,不重复发明轮子,有针对性地选择训练参数和设计功能服务。

  基础大模型已经很多了,市面上缺的是能跟抗衡甚至超越GPT的顶尖基础大模型,以及可让千行百业更低成本、更低门槛、更快应用的“产业大模型”。而要做出强大的产业大模型,需要“既懂AI技术又是产业专家”。

  度小满就是一个很好的例子,一边有背靠百度的AI技术底子,另一边有深耕金融科技行业多年积攒下的产业认知、能力、场景、生态等资源。

  据悉,轩辕虽是基于拥有1760亿参数的Bloom大模型训练而成,但也离不开度小满这些年积累的千亿tokens中文预训练数据集,包括银行、保险、基金等行业的基础知识与巨量参数。因为有后者,轩辕大模型才有远超同类竞品和通用大模型的金融信息处理能力,也才可以面向金融业的痛点场景提供针对性的功能服务。

  第二,深入贴合行业需求“定制”大模型功能服务,而不是闭门造车。

  技术类公司容易出现“拿着锤子找钉子”的问题,如果不能贴合真实需求,技术再强大都可能只是自嗨。

  为什么度小满、阿里和科大讯飞可以在大模型产业化上先尝到甜头?因为阿里本身就是电商产业的龙头,度小满从成立之日起一直深度参与国内科技金融行业建设,科大讯飞也深耕智能教育行业十数载,它们对相应行业理解非一般企业所能及。读懂行业运作逻辑和深层次问题,就能洞悉企业、从业者的真正痛点,并给出行之有效的解决方案。

  以度小满为例,基于的理解、生成、逻辑和记忆四个基础能力,轩辕大模型融合金融行业的使用习惯、优化需求,提供了一系列针对性功能。比如个人信贷管理服务,轩辕大模型为银行客户提供客户历史信息管理、用户多层次需求分析功能,给用户提供专业问题自然语言交互问答服务,充分提高双方的处理效率。度小满在服务金融机构和自有客户时洞察了许多需求,才可以做出真正能用、有用、好用的金融大模型产品。

  第三,众人抬柴火焰高,大模型不是独角戏,必须惠及行业参与者。

  中小企业是产业链的主力军,然而因为受限于资金实力与人才资源,往往很难再第一时间应用新技术,特别是门槛很高的新技术。相较于深度学习而言,大模型需要巨量算力、巨量数据和巨量算法,门槛高出了许多,对很多企业来说有些可望不可即。这对头部玩家来说是机遇所在,如果坚持普惠开放路线,既可让大模型技术有“产业化”的落点,也可以在大模型产业化中获取对应价值。

  在度小满和北大光华管理学院联合举办的大模型技术与应用论坛上,度小满CTO许冬亮就发表过类似观点,他认为大模型是中小金融机构突围而出的机会,因为它们可通过应用创新加快数字化、智能化升级进程,继而跨越数字化鸿沟。

  也不难发现,“开放”成了成功落地产业的大模型的最大公约数。度小满的轩辕、阿里的通义千问、科大讯飞的星火走的均是开源开放路线。正如许冬亮所言,将大模型能力开放给金融机构,不仅可以加快技术的推广普及,还能降低使用门槛,是实现技术普惠的必然选择。

  跟区块链等新兴技术的昙花一现不同,大模型的热度不会骤然下降。一方面,大模型技术在2024年将会纵深到更多产业,C端,大模型驱动的爆款现象级应用一定会出现,B端,大模型产业化的案例只会越来越多。另一方面,大模型技术本质是深度学习技术的延续。AI技术已发展10余年,未来几十年都将是科技产业的基础技术。大模型是AI浪潮上最大的一朵浪花,而AI浪潮,将持续澎湃。

+1

来源:微信公众号 罗超Pro

延展资讯