大模型市场2024年盘点：站在岔路口，未来将走向何方？

　　2024年，大模型市场可谓热闹非凡，一方面，各大厂商纷纷将目光投向具体应用场景，推动行业定制化的大模型加速落地，这些模型正逐步渗透到金融、医疗、教育等多个关键行业中，为解决专业领域的复杂问题提供了方法。另一方面，关于大模型未来发展路径的讨论持续升温，围绕开源与闭源、大模型与小模型的选择成为业界关注的重点话题。

　　不仅如此，随着大模型技术的日益成熟，其在实际应用中展现出的强大能力也伴随着一些潜在的风险。特别是网络攻击和隐私泄露等安全问题越来越突出，对网络安全环境提出了更高的要求。

　　大模型市场2024年盘点：站在岔路口，未来将走向何方?

　　岁末将至，又到年终盘点时。我们将从路线选择、安全隐患和热门事件三个维度，对2024年大模型市场的关键进展进行总结。

　　一、路线选择

　　在大模型市场，厂商们如同武林中的各大门派，纷纷使出浑身解数，力求在角逐中脱颖而出。这不仅是单纯的技术实力对决，更是一场策略布局的较量。

　　大模型市场2024年盘点：站在岔路口，未来将走向何方?

　　1、开源vs闭源

　　大模型自发展之初，开源与闭源的争议就如影随形。4月16日，百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示，在当今的大模型生态下，开源模型会越来越落后。 5月9日，阿里云首席技术官周靖人在接受媒体采访时表示，开源对全球技术及生态的贡献毋庸置疑，这一点也在全球范围内被多次证明，已经没有再讨论的必要。

　　此番言论，也引发了大模型行业关于开源和闭源孰优孰劣的激烈讨论。从目前来看，选择闭源路线的企业有OpenAI、百度等，倾向于大模型业务快速商业化;选择开源路线的企业有Meta、阿里、360等企业，希望聚合生态力量，实现迭代发展与赶超。

　　除此之外，还有选择闭源与开源并行模式的企业，其共同的特征是在较大模型上选择闭源，在较小模型上选择开源。如谷歌的Gemini是闭源模型，Gemma是开源模型;商汤科技的日日新是闭源模型，书生是开源模型等。

　　实际上，开源、闭源以及开闭源并行，都是企业在面对大模型发展浪潮时可能采取的有效策略。关键在于企业如何根据自身情况和市场环境，作出最符合自身利益的决策，以推动技术的不断进步和产业的繁荣发展。

　　2、大模型vs小模型

　　在过去的几年里，选择小模型还是大模型成为了学术界和产业界热议的话题。

　　大模型凭借其强大的自然语言和多模态信息处理能力，能够更好地理解和生成文本，识别图像，甚至处理音频数据，展现出前所未有的准确性和灵活性。《全球数字经济白皮书(2024年)》显示，全球有3万家人工智能核心企业以及超过1300个人工智能基础大模型。其中，中国大模型数量占比为36%，位居世界第二。

　　然而，大模型的训练和部署面临着高昂的成本和资源需求，不仅包括计算资源的巨大消耗，还有对环境的影响等问题。此外，大模型的维护和调优也相对更加复杂。在这种情况下，小模型以其轻量化、高效能的特点逐渐受到重视。小模型往往具有更快的推理速度和更低的能耗，这使得它们在边缘设备和移动应用中具有明显的优势。值得一提的是，Meta、英伟达、微软、谷歌等科技巨头都已经将目光投向了小模型，积极投身于这一赛道。

　　需要指出的是，大模型与小模型是可以互补共生的关系。大模型擅长处理复杂的任务和跨领域的挑战，适合于那些对精度要求极高且资源充足的场景;而小模型则更适用于对实时性和成本敏感的应用，如物联网设备、智能手机等。

　　微软AI主管Mustafa Suleyman预测，未来几年AI模型将呈现大小模型“齐头并进”的趋势。大模型的规模化竞赛仍将持续，并融入更多模态的数据。另一方面，利用大模型训练小模型的技术将兴起，高效的小模型将在特定场景中发挥巨大作用。

　　二、安全隐患

　　大模型技术的不断成熟，其“双刃剑”效应也在日益凸显。大模型为安全行业注入了强大的AI驱动力，通过提高检测效率、精准度以及响应速度，有效增强了网络安全防护能力。例如，在恶意软件检测、异常行为识别等方面，大模型的应用显著提升了系统的智能化水平，帮助企业和组织更好地抵御网络威胁。

　　大模型市场2024年盘点：站在岔路口，未来将走向何方?

　　但与此同时，由于大模型通常需要大量的数据进行训练，因此可能加剧个人隐私信息的收集和处理风险。并且，由于大模型技术具有强大的文本生成能力，它们可能被用于制造和传播虚假信息，误导公众舆论，对社会造成不良影响。此外，大模型所具备的代码生成能力，使得没有编程经验的攻击者借助大模型自动生成所需的恶意代码。

　　根据网宿安全发布的《2023年互联网安全报告》显示，2023年，网宿安全监测到的全球Web应用程序攻击数量达到7309亿次，同比增长30%，其中，很多网络攻击的增长是由生成式AI技术带来的。同时，IBM的《生成式AI时代的网络安全研究报告》指出，高管们表示，他们2023年的AI网络安全预算比2021年增加了51%，并预计到2025年，这些预算将再增加43%。

　　由此可见，虽然大模型技术为安全行业带来了前所未有的机遇，但也提出了更加严峻的挑战，这需要业界共同努力，平衡好技术创新与安全保护的关系。

　　三、热门事件

　　回顾2024年，大模型市场发生了许多备受关注的重大进展和热点事件，我们列出了十个比较有代表性的标志性事件。

　　1、OpenAI推出Sora模型

　　当地时间2月15日，OpenAI宣布正在测试一款名为Sora的“文本生成视频”模型，只需要文本指令，或将文本与图像相结合就可以创建长达60秒的视频。其中，视频生成包含精细复杂的场景、生动的角色表情以及复杂的镜头运动，同时也接受现有视频扩展或填补缺失的帧。

　　2、英伟达发布全新旗舰AI芯片Blackwell GPU

　　当地时间3月18日，在GPU技术大会(GTC)上，英伟达发布了全新旗舰AI芯片Blackwell GPU，被称为是英伟达史上最成功的产品。英伟达称，Blackwell拥有6项革命性技术，可支持多达10万亿参数的模型进行AI训练和实时大语言模型(LLM)推理。

　　3、OpenAI发布GPT-4o模型

　　当地时间5月13日，OpenAI通过直播展示了产品更新，发布了GPT-4系列新模型GPT-4o。据OpenAI首席技术官Mira Murati介绍，GPT-4o的速度比GPT-4 Turbo快了两倍，但成本仅为其一半。GPT-4o可以实时对文本、音频和图像进行推理，响应时间几乎达到人类水平。

　　4、斯坦福AI团队抄袭中国大模型

　　5月29日，斯坦福AI团队发布名为Llama3-V的多模态大模型，声称只需500美元就能训练出一个性能可与GPT4-V媲美的模型。但随后，该模型很快被网友发现与中国大模型公司“面壁智能”的开源成果MiniCPM-Llama3-V 2.5拥有极为相似的模型架构与代码。6月4日，斯坦福Llama3-V团队的两位作者Siddharth Sharma和Aksh Garg在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉，并表示会将Llama3-V模型悉数撤下。

　　5、夸克升级2024高考信息服务

　　6月13日，夸克App全面升级高考AI搜索、智能志愿工具和独家优质内容等高考信息服务。据了解，夸克2024高考信息服务将继续提升产品体验和数据细节，让志愿推荐的结果更合理。同时，依托夸克在搜索上的优势，用户不仅可以搜大学、查专业，还可以提出个性化的志愿问题，得到由AI整合总结的回答。

　　6、华为云盘古大模型5.0发布

　　6月21日，在华为开发者大会2024(HDC 2024)上，华为正式发布盘古大模型5.0，围绕“全系列、多模态、强思维”进行了全新升级。张平安介绍称，盘古5.0推出适配不同业务场景多种规格模型，并与物理世界结合，加速大模型行业落地。

　　7、OpenAI服务限制引发争议

　　6月25日凌晨，多名用户收到OpenAI的推送邮件，信中称，自今年7月9日起，将开始阻止来自非支持国家和地区的API服务。受影响组织若希望继续使用OpenAI的服务，必须在其支持的国家或地区内访问。在OpenAI给出的“支持访问国家和地区”名单中，中国内地和中国香港未包含其中。针对此次变动，百度、阿里巴巴、腾讯、百川智能、智谱AI等国内大模型厂商迅速作出反应推出迁移方案，以帮助那些受影响的用户顺利过渡到其他可行的服务。

　　8、360安全大模型正式免费

　　7月31日，360集团创始人周鸿祎宣布360安全大模型正式免费。作为国内首个免费安全大模型，360安全大模型由攻击检测、运营处置、追踪溯源、知识管理、数据保护、代码安全等六大专家子模型组成，具备L级“自动驾驶”能力，并实现了对全网安全支持的深度理解，从而做到本地安全大脑在封闭网络下也能使用全网知识的重大突破。

　　9、丰田研究所与波士顿动力宣布合作推进机器人研究

　　10月16日，丰田在官网宣布与波士顿动力联合开发实体大型行为模型(LBM)机器人，以加速Atlas的通用能力和商业化场景。LBM的运行模式与ChatGPT等大模型类似，但LBM不能生成文本、图片等，而是帮助实体机器人能够通过观察人类行为来学习各种物理任务，例如，炒菜、做饭、照顾老人等。

　　10、全球首款AI游戏问世

　　11月2日，两家初创公司Decart和Etched联手打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis，玩家在其中体验到的每一帧都来自扩散模型的实时预测，游戏画面持续以20帧每秒的速度实时渲染，零延迟。

　　写在最后：

　　毫无疑问，大模型市场正处在一个充满机遇和挑战的时代。期待随着技术的不断进步，大模型能够在更多场景中得到应用，为社会发展注入新的活力。同时，也希望各方能够携手合作，共同应对安全问题，确保大模型技术的健康发展。