汇聚全球精英,彰显中国智慧。
第六届世界人工智能大会(WAIC 2023)于7月6日在上海世博中心拉开帷幕。本届大会以“智联世界 生成未来”为主题,聚焦通用人工智能发展,紧抓生成式人工智能引发的行业热潮,吸引海内外1400余名重磅嘉宾与400多家AI领先企业共襄盛举。
自年初以来,ChatGPT引爆新一轮机器学习革命,AI大模型持续演进。正如阿里云智能集团CTO周靖人在接受媒体采访时指出,动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现的。大模型的研发是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI和云计算的全栈技术能力。
在AI大模型产业生态中,电信运营商是非常有代表性的群体,因为他们拥有强大的底层算力和网络基础设施,而且在系统性工程技术上不断加大研发投入;但在AI大模型方面,运营商们并没有贪大求全,而是找准了自己的赛道,扬长避短,充分发挥自身的算力网络基础设施优势,更加强调自研大模型与自身业务以及垂直行业应用的结合。
运营商发力AI大模型时代
算力是支撑大模型发展的重要环节,算力网络则是我国实现高效算力资源调度的核心。作为算力网络的主导者,三大运营商积极打造智慧光网,推动建设“东数西算”先行区,对外赋能千行百业,助力大模型跨地域训练;对内运用AI能力实现降本增效,提升服务能力。
展会期间,中国电信数字智能科技分公司正式对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。
电信智科副总经理何忠江表示,中国电信依托云网融合的优势,打造了大语言模型TeleChat。TeleChat使用了大量高质量中英文语料进行预训练,并采用了千万级问答数据进行微调。同时,设计了渐进膨胀注意力机制,用于增加模型的间隔采样,扩大实际感受野;研发了自校准微调技术,将迭代后相关性偏差作为强化学习的监督信号,提升强化学习效果;并且利用知识图谱协同增强策略,增强大模型的预训练和推理能力,减少大模型幻觉现象。
此外,以TeleChat为底座的教育版大模型TeleChat-E在全球大模型综合性考试评测榜单C-Eval上排名第七,前几名包括GP4、ChatGPT等知名大模型。TeleChat-E使用人工收集、标注、整理的高质量领域数据对TeleChat进行持续效果强化。同时,TeleChat-E对Transformer Decoder的损失函数进行改进,使之更加关注题目答案的生成,提高准确率。
在谈到中国移动在AI产业生态的定位时,中国移动副总经理高同庆表示,中国移动将人工智能作为公司战略转型的重要组成部分,以构建面向通用人工智能的“人工智能大平台”作为实现智能服务运营的关键载体,基于泛在的算力网络提供开放、高效、安全、可控的社会级智能化服务,成为通用智能服务的供给者、汇聚者和运营者。
中国移动早在2013年开始人工智能领域战略布局,十年磨一剑,已形成从算法、平台、能力到规模化应用的产业级智能化服务能力,包括了8个平台型产品,超370项各领域AI能力,服务内外部27大领域的830+项应用,年赋能价值已超39亿元,并获科技部批复承建智慧网络国家新一代人工智能开放创新平台,跻身央企“AI国家队”。
在2023年世界人工智能大会“大模型与深度行业智能”创新论坛上,中国移动正式发布人工智能科技创新的最新成果:九天·海算政务大模型和九天·客服大模型。
中国联通董事长刘烈宏表示,大模型是继图形用户界面和触屏手机以来,又一次人机交互领域的颠覆性革命。中国联通积极拥抱智能时代,着力推动AI产业的发展、拓展AI的想象空间,将从三个方面与AI共创、共进。一是构建大算力的平台底座,让AI用得起。二是构建多行业场景模型,让AI用得好。三是构建高可靠的安全体系,让AI用得放心。
中国联通图文大模型——“鸿湖”再次亮相。据悉,该模型训练参数达20亿,支持以文生图、以图生图、视频剪辑等多样化的AI能力。“鸿湖”作为中国联通首个“面向创新业务的大模型”,有效提升了自有业务的创新能力,探索了大模型工程化和赋能应用的可行路径。
找准属于自己的赛道
作为AI产业的盛典,此次WAIC可谓是“百模”斗艳,百度文心、阿里通义、华为盘古、讯飞星火、商汤日日新、中国电信TeleChat、中国移动九天、中国联通等鸿湖等众多海内外大模型先后亮相,技术层、配套设施层、应用层,同时在各个环节同步崛起。
从这些主流玩家的技术与产品布局中,我们也能发现演进路径的差异性。特别时对于基础电信运营商而言,他们更加关注如何把把大模型用起来,强调技术与应用结合。
以中国电信Telechat大模型为例,正在与千行百业的信息化解决方案进行融合,在诸多行业实现商业化落地。展会期间,中国电信重点展示了大模型+数据中台产品、大模型+智能客服产品、大模型+智慧政务产品三大行业应用的赋能产品,展现了在垂直行业的深耕和创新。
政务云是电信运营商云服务的重要落地场景,也是其优势市场。九天·海算政务大模型就是中国移动基于近年来积累的丰富数字政府建设经验所打造的面向政务领域的行业大模型。依托九天·海算政务大模型,政务服务系统将具备强大的政务事项理解能力、多维度的信息关联能力、面向复杂事项和复杂流程的多元交互能力,助力构建高效政务治理体系。
对于拥有超过10亿用户的中国移动而言,客服是个关键话题。九天·客服大模型是基于中国移动在客服领域多年沉淀的海量服务数据、业务知识和服务经验打造,形成“大模型—人工坐席—用户”的三方沟通场,极大提升传统人工客服的工作效率。
在大模型领域,中国联通的思路与中国电信、中国移动是不谋而合的。作为首个面向运营商增值业务的大模型,中国联通鸿湖图文AI大模型1.0目前拥有8亿训练参数和20亿训练参数两个版本,可实现以文生图、视频剪辑、以图生图等功能。
可以说,在大模型这条必经之路上,三大电信运营商避开了通用大模型赛道,而是结合自己的数据优势和用户优势,利用大模型带来的技术变革,有选择地做行业AIGC。我们可以相信,依托自身强大的云网基础设施优势,运营商的大模型之路才刚刚开始,未来各运营商有望持续加大在大模型领域的布局与投入,实现更大突破,打造新的业务增长点。