科技魔方

大模型公司对标:智谱AI

更多动态

2024年08月16日

  公司档案

  智谱AI由清华大学计算机系知识工程实验室的技术成果转化而来,成立于2019年6月,是中国头部AI大模型厂商之一。2020年6月,OpenAI发布GPT-3,智谱AI意识到大模型是未来发展方向,开始发力大模型,并将OpenAI作为对标对象。2021年9月,设计GLM算法,发布拥有自主知识产权的开源百亿大模型GLM-10B。2022年8月,发布高精度千亿大模型GLM-130B并开源,模型效果对标GPT-3 175B。2023年3月,发布千亿基座的对话模型ChatGLM及其单卡开源版本ChatGLM-6B,全球下载量超过800万。2024年1月,推出新一代基座大模型GLM-4,整体性能相比上一代大幅提升,逼近GPT-4。

  图1 智谱AI公司发展历程

  AI大模型技术、产品与服务

  1.技术:实现大模型生成式AI全链路自主可控

  自研预训练框架GLM:2021年,智谱AI开始自主开发训练框架GLM,该框架集成自回归生成和自回归填空,即将NLU任务构建为包含任务描述的填空题,并通过自回归生成来回答。通过对两种模式优点的结合,单一模型能够处理多个任务,从而以更低的成本支持更多上层任务。基于GLM框架,智谱AI陆续发布GLM-10B、GLM-130B、ChatGLM2、ChatGLM3、GLM-4等一系列基座大模型。

  自建训练平台:与国内高性能文件存储领域领军企业“焱融科技”合作打造高速大模型训练平台,采用焱融全闪一体机F8000X搭建分布式并行文件存储集群,满足千亿参数模型训练推理中高并发、高性能和低延时性能需求,结合NVIDIA计算和Infiniband网络,帮助算法逻辑快速迭代。

  深耕大模型算法:通过多种自研算法来提升模型性能,如提出长上下文对齐方案LongAlign,能够有效扩大LLMs的上下文窗口尺寸,使GLM-4能够处理长上下文文本(高达128K个token);推出ChatGLM-Math方法,利用自我批判而非外部模型或手动标注来进行数据选择,从而提升LLMs数学问题解决能力;开发无需反馈的对齐策略Self-Contrast,利用目标LLM本身来自动生成大量负样本,用于RLHF对齐;提出自动并行自回归(APAR)生成方法,利用指示微调来训练LLMs规划其并行生成过程并执行APAR生成,从而提高LLMs对具有分层结构响应的推理速度。

  开展国产化硬件适配:智谱AI致力于大模型对国产硬件设备的适配,以保证算力安全。自2022年初,GLM系列模型已支持在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。当前其已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU、海飞科、沐曦曦云、算能科技、天数智芯、寒武纪、摩尔线程、百度昆仑芯、灵汐科技、长城超云等。

  2. 产品与服务:布局大模型全栈产品矩阵和服务体系

  智谱AI推出全面对标OpenAI的全模型产品线。

  全系列大模型矩阵:通用大模型是智谱AI核心模型,最新通用大模型为GLM-4系列模型,包括GLM-4、GLM-4-Air、GLM-4-9B等,其中GLM-4整体性能相比GLM3全面提升60%,逼近GPT-4。同时,推出图像大模型CogView、超拟人大模型CharacterGLM、向量大模型Embedding-2、代码大模型CodeGeeX等多类型大模型。

  GLM-4 All Tools:对标GPT-4 All Tools,能够自主根据用户意图,自动理解、规划复杂指令,自动调用网页浏览器、Code Interpreter代码解释器和多模态文生图大模型等在内的多项工具,以协同方式完成复杂任务,方便开发者和用户轻松使用GPT-4模型,无需过多担心提示词选择。

  GLMs及应用商店:对标GPTs及GPT Store,推出GLM个性化智能体定制服务,用户可通过简单prompt指令创建属于自己的GLM智能体,极大降低大模型开发门槛;发布“智能体中心”应用商店,提供分享和交流各种智能体的平台,用户可发布自己创建的智能体,也可以浏览和体验其他用户分享的智能体,从而拓展企业智能体生态。

  大模型开放平台:提供官方开发的调用工具、开箱即用的AI应用开发资源、丰富的模型产品等,帮助用户快速构建和部署AI应用。

  3.商业模式:围绕“模型即服务”、面向不同需求提供差异化商业模式

  API调用服务:将大模型封装成开放平台,提供API给开发者和企业调用,按照API调用量进行收费。

  云端私有化部署:面向有独立数据保障需求、但不希望自己维护算力等基础设施的企业,提供基于云端算力的云端私有化方案,利用云端算力帮助客户开辟专门的大模型专区,在整个服务过程中保持数据与其他客户的相对隔离。

  完全私有化部署:面向有完全私有化需求的企业,如国有企业或对数据安全极其关注、要求数据和系统不能出物理边境的企业,提供完全私有化部署方案,在企业自己的硬件和算力平台上提供大模型基座能力,满足企业开发相关应用及业务发展的需求。

  软硬一体化方案:探索软硬件结合的商业模式,将大模型与国产化信创硬件适配绑定,免除在客户环境中进行部署和实施调试的过程,通过软硬件一体化进行销售和部署。

  AI市场拓展

  B端市场拓展:自成立伊始,智谱AI将关注重点置于B端市场,专注于为企业客户提供定制化人工智能解决方案和服务。秉承“一边研究技术、一边开拓市场”的团队宗旨,在企业发展初期,当研究尚聚焦于数据挖掘与科技情报分析时,智谱AI所服务的客户群体已覆盖国内科研机构、科技型企业、互联网企业以及海外科技公司。截止去年年底,智谱AI商业化团队从最初十几人迅速壮大至上百人,建立起从售前到售后、包括解决方案的完善团队。在销售渠道上,智谱AI一方面依靠自有销售团队、市场团队进行直销,另一方面依赖生态合作伙伴拓展客户群体。

  C端市场布局:以向B端客户展示能力为目的,智谱AI逐步探索C端产品布局,在去年组建C端产品团队,推出基于大模型的C端应用,如智谱清言、写作蛙、代码辅助工具、视频生成工具清影等。以清影为例,该工具可支持文生、图生6秒时长的视频,在PC端、手机App端、小程序端面向所有C端用户免费开放。

  AI大模型组织与运营

  高水平的青年人才队伍:智谱AI团队有400余人,其中七成是研发人员,核心团队从清华大学KEG(知识工程)实验室走出。智谱AI董事长刘德兵师从中国计算机行业专家、中国工程院院士高文;CEO(首席执行官)张鹏和总裁王绍兰则同为清华创新领军工程博士。

  组织架构紧密,注重研究、工程与商业化等多领域并重:智谱AI的团队覆盖内部研究、工程、系统平台、应用和商业化等领域,各部门不以独立实体的形式存在,而是相互协作、信息流畅的整体。这种紧密的团队协作方式减少了信息传递的损失,使团队能够更高效地应对快速变化的市场需求。如在一个重要的商业化项目中,负责人涵盖了项目从研究、开发到最终市场推广整个生命周期,会选择团队中的博士研究员、科学家、分级经理、工程师、系统专家和应用程序开发人员等共同协作。

  专门的数据处理团队:专门对公开数据、团队多年来积累的数据、交换或采购合作伙伴数据进行数据清洗和过滤,对数据进行校准和转化等工作。

  AI大模型资本运作

  智谱AI对外投资并购策略聚焦于构建和完善自身的AI生态圈,倾向于投资具有核心技术实力的AI相关创业公司,特别是那些团队核心成员拥有清华大学背景的企业,以确保技术导向和创新能力。如聆心智能孵化自清华人工智能学院的交互式人工智能课题组(CoAI),核心团队主要由研发人员构成,创办者为清华大学计算机系副教授黄民烈;深言科技和面壁智能则脱胎于清华自然语言处理与社会人文计算实验室(THUNLP)。

  表1 智谱AI的投资布局

  在融资方面,智谱AI获得资本和互联网巨头的广泛认可,获得多轮超亿元融资。有消息称智谱AI 2023年下半年的融资估值超过100亿元,到2024年1月,其正围绕200亿元估值进行新一轮融资。

  表2 智谱AI的融资情况

  AI大模型生态体系

  坚定开源路线,推动技术共享。一方面开源大模型,探索开源商业模式。智谱AI是国内大模型开源的先锋之一。在2022年,当国内对大模型的理解还普遍较弱时,智谱AI就开源了其高精度双语千亿模型GLM-130B,后又继续开源ChatGLM系列模型和GLM-4系列模型。在智谱AI看来,开源是商业化的桥梁,将成果开源的同时,商业版本同样存在。另一方面发起开源基金,促进开源生态繁荣。智谱AI承诺为大模型开源社区提供一千张卡,助力开源开发;提供1000万元的现金用来支持与大模型相关的开源项目;为优秀的开源开发者提供1000亿免费API tokens。

  构建开发平台,降低开发门槛。智谱AI构建了开放平台,集先进AI技术、丰富功能以及卓越性能于一体,致力于为用户提供高效、便捷、个性化的AI服务,助力用户快速构建和部署AI应用。主要能力包括提供功能和定价多样的大模型、模型微调服务、多模态理解能力、自然语言处理与生成能力等。

  与行业企业深度合作,共创大模型行业应用。截至2024年3月,智谱AI已与200多家企业进行深度共创,实现1000+大模型规模化应用,涵盖了广告传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景。如与头部旅行社交平台马蜂窝合作打造“AI小蚂APP”,解决难以针对用户需求的信息筛选、缺乏变现高质量内容手段等痛点;与华泰金融构建财富管理助手“涨乐财富通APP”,解决了传统技术无法对意图进行精准识别、无法与客户之间进行多轮交互的问题;与数字营销领域巨头——分众传媒合作开发 “众智AI” 营销行业大模型,解决广告业务人力成本高、效率低问题。

  本文作者

  赵明明

  战略发展研究所

  二级分析师

  硕士,主要研究方向为工业互联网、人工智能、金融科技、产业数字化等领域。

  赵晔蕾

  战略发展研究所

  二级分析师

  硕士,主要从事工业互联网、大数据产业发展趋势研究,长期专注产业数字化研究。

+1

来源:天翼智库

延展资讯