此前,李开复成立了一家初创公司,名为零一万物(01.AI),旨在为中国市场开发本土大型语言模型(LLM)。日前,李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母,在中国显然存在巨大的需求。与世界其他地方不同,中国无法使用OpenAI和Google,因为这两家公司没有在中国提供他们的产品,因此我认为许多从事LLM的人都在为一个真正需要这一技术的市场创造解决方案。”
与成立仅七个月后,零一万物发布了其首个模型Yi-34B,这是一个双语基础模型,训练参数达到340亿,显著小于其他开源模型,如Falcon-180B和Meta LlaMa2-70B,根据Hugging Face的排名,Yi-34B在预训练LLM模型中名列前茅(https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)。李开复表示,尽管更大的模型需要大量高质量数据的良好训练,但他们仍然相信,训练得当的更大模型将始终明显优于质量和技术相当的较小模型。
虽然李开复没有透露零一万物筹集了多少资金,但他表示,该公司在获得来自创新工场、阿里巴巴云和其他未公开投资者的融资后,估值达到了10亿美元。
零一万物已经发展成超过100名员工的公司,其中超过一半来自跨国和中国科技公司的LLM专家。该公司的技术副总裁是谷歌Bard的早期成员,其首席架构师是TensorFlow的创始成员,曾与谷歌Brain的杰夫·迪恩和萨米·本吉奥一起工作。Yi-34B背后的关键人物是微软亚洲研究部的资深研究员黄文浩和曾在华为和阿里巴巴担任高级AI职位的戴伟。
李开复通过创新工场支持了十多个独角兽,并通过该公司建立了七家公司,他可能是中国最有影响力的投资者和企业家之一。他表示:“自从微软亚洲研究部成立以来已经有25多年了,我所做的一切都是关于获取优秀的人才。”他还强调,公司要付给员工公平的薪水,但更重要的是要让员工相信他们可以产生影响并相信公司能够成功。
值得注意的是,建立LLM模型是一项成本高昂的工作,为了维持高资金消耗的运营,零一万物从一开始就制定了盈利计划。尽管公司将继续开源一些模型,但其目标是构建一个最先进的专有模型,作为各种商业产品的基础。“我们无法开源一切,”李开复表示,“我们非常清楚这些大型语言模型需要大量计算资源,因此非常昂贵。当我们筹集了大量资金后,大部分将用于GPU。鉴于这一点,我们需要尽可能多地获取GPU,这也是我们所做的。”
与中国的其他LLM参与者一样,零一万物积极储备了GPU,以应对美国的制裁;甚至在获得融资之前,他们就借钱购买了处理器。
零一万物的盈利道路在很大程度上取决于其能否找到其昂贵AI模型的产品市场契合点。虽然一流的LLM科学家稀缺,但在中国并不缺乏产品人才。李开复认为:“中国在LLM领域并不领先于美国,但毫无疑问,由于过去12年左右建立的卓越移动互联网生态系统,中国可以构建比美国开发人员更好的应用程序。”
虽然创始人没有透露即将推出的服务的详细信息,但他暗示公司正在尝试与生产力和社交方向的概念,如果零一万物在今年内没有发布应用程序,他将感到“失望”。