今年初以来,ChatGPT横空出世,引爆新一轮机器学习革命,大模型成为炙手可热的科技新赛道。据不完全统计,国内已有近百个大模型产品面世。
在大模型产业生态中,运营商没有缺席。运营商拥有强大的底层算力和网络基础设施,而且近年来不断加强研发投入,已有较为充分的技术积累。目前,三大运营商均发布了各自的大模型产品,其中,中国联通在MWC上海2023期间发布了鸿湖图文大模型1.0。
鸿湖图文大模型是首个面向运营商增值业务的大模型,具备以文生图、视频剪辑、以图生图等多种功能。日前,中国联通研究院智能技术研究部大模型项目负责人吴浩然接受媒体采访,对中国联通在大模型领域的布局进行了观点分享。
大模型将成为新一代流量入口
吴浩然首先强调,大模型是人工智能新一轮爆发的转折点,也是AGI(通用人工智能)时代的原点。其泛化能力将AI从过去单一场景适配的方式解放,类似工业革命从小作坊生产发展为工厂批量化生产,这意味着根本性的改变。
同时,随着大模型语言能力的发展以及目前的混合专家系统模式,以自然语言交互大模型做“管家”的模式,很可能会成为下一个时代的主流。如中信智库的报告所言,大模型将成为新一代流量入口。
做流量生意正是运营商的强项。吴浩然表示,从商业价值角度讲,中国联通布局大模型领域是非常必要的。运营商在移动互联网时代未能利用好流量,成为了“管道运营商”,在智能互联时代必须积极尝试转变,成为新时代的“综合数字服务运营商”。
吴浩然还认为,随着大模型技术进一步发展,极有可能成为新时代的操作系统。而美国对我国科技封锁愈加严苛,除芯片外,在大模型方面实际上也在加强打压。为防止重蹈过去很多工业软件被“卡脖子”的覆辙,中国联通和其他运营商作为央企中在AI方向较强的企业,布局大模型也符合国家政府期许,是中国联通积极承担央企责任的体现。
鸿湖图文大模型优势解析
目前,云计算、AI、互联网、游戏等领域企业都在发布大模型产品,市场上已是“百模大战”。那么,中国联通的鸿湖图文大模型,有何差异化优势?
吴浩然表示,鸿湖图文大模型不同于政务、客服等纯语言模型,从一开始就是图文双模态的模型。“其实我们布局大模型相对较早,在2021年即开始了相关技术研究,目前的鸿湖是在2022年即启动研发,当时ChatGPT尚未出现,Midjourney、Stable Diffusion这类文生图模型也还在酝酿。随着5G新通信的功能强化,我们从公众线的增值业务场景出发,瞄准了图文双模态。”
鸿湖图文大模型的差异化优势是特征融合,将不同模态内容对齐到文本,来实现跨模态的内容理解。据介绍,中国联通采取了Encoder-Decoder模式,这种模式在生成任务上灵活性相较Decoder-only弱,但在理解能力上更强,更符合做跨模态理解的需求。
吴浩然表示,鸿湖图文大模型目前是图文,也可以将提取部分改为图声或其他模态提取器,同样进行特征融合和跨模态对比学习后,可以很容易扩展至其他跨模态,最终实现不同模态在文本语义上统一的目标。“松耦合和强扩展性特征,也构成了竞争力的一环。只要我们做好模态融合部分,特征提取就可以时刻选取市面最好的模型来替换,保持我们模型的活力。”
(作者:刘定洲,程唯珈)