2024年,大模型市场可谓热闹非凡,一方面,各大厂商纷纷将目光投向具体应用场景,推动行业定制化的大模型加速落地,这些模型正逐步渗透到金融、医疗、教育等多个关键行业中,为解决专业领域的复杂问题提供了方法。另一方面,关于大模型未来发展路径的讨论持续升温,围绕开源与闭源、大模型与小模型的选择成为业界关注的重点话题。
不仅如此,随着大模型技术的日益成熟,其在实际应用中展现出的强大能力也伴随着一些潜在的风险。特别是网络攻击和隐私泄露等安全问题越来越突出,对网络安全环境提出了更高的要求。
大模型市场2024年盘点:站在岔路口,未来将走向何方?
岁末将至,又到年终盘点时。我们将从路线选择、安全隐患和热门事件三个维度,对2024年大模型市场的关键进展进行总结。
一、路线选择
在大模型市场,厂商们如同武林中的各大门派,纷纷使出浑身解数,力求在角逐中脱颖而出。这不仅是单纯的技术实力对决,更是一场策略布局的较量。
大模型市场2024年盘点:站在岔路口,未来将走向何方?
1、开源vs闭源
大模型自发展之初,开源与闭源的争议就如影随形。4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上表示,在当今的大模型生态下,开源模型会越来越落后。 5月9日,阿里云首席技术官周靖人在接受媒体采访时表示,开源对全球技术及生态的贡献毋庸置疑,这一点也在全球范围内被多次证明,已经没有再讨论的必要。
此番言论,也引发了大模型行业关于开源和闭源孰优孰劣的激烈讨论。从目前来看,选择闭源路线的企业有OpenAI、百度等,倾向于大模型业务快速商业化;选择开源路线的企业有Meta、阿里、360等企业,希望聚合生态力量,实现迭代发展与赶超。
除此之外,还有选择闭源与开源并行模式的企业,其共同的特征是在较大模型上选择闭源,在较小模型上选择开源。如谷歌的Gemini是闭源模型,Gemma是开源模型;商汤科技的日日新是闭源模型,书生是开源模型等。
实际上,开源、闭源以及开闭源并行,都是企业在面对大模型发展浪潮时可能采取的有效策略。关键在于企业如何根据自身情况和市场环境,作出最符合自身利益的决策,以推动技术的不断进步和产业的繁荣发展。
2、大模型vs小模型
在过去的几年里,选择小模型还是大模型成为了学术界和产业界热议的话题。
大模型凭借其强大的自然语言和多模态信息处理能力,能够更好地理解和生成文本,识别图像,甚至处理音频数据,展现出前所未有的准确性和灵活性。《全球数字经济白皮书(2024年)》显示,全球有3万家人工智能核心企业以及超过1300个人工智能基础大模型。其中,中国大模型数量占比为36%,位居世界第二。
然而,大模型的训练和部署面临着高昂的成本和资源需求,不仅包括计算资源的巨大消耗,还有对环境的影响等问题。此外,大模型的维护和调优也相对更加复杂。在这种情况下,小模型以其轻量化、高效能的特点逐渐受到重视。小模型往往具有更快的推理速度和更低的能耗,这使得它们在边缘设备和移动应用中具有明显的优势。值得一提的是,Meta、英伟达、微软、谷歌等科技巨头都已经将目光投向了小模型,积极投身于这一赛道。
需要指出的是,大模型与小模型是可以互补共生的关系。大模型擅长处理复杂的任务和跨领域的挑战,适合于那些对精度要求极高且资源充足的场景;而小模型则更适用于对实时性和成本敏感的应用,如物联网设备、智能手机等。
微软AI主管Mustafa Suleyman预测,未来几年AI模型将呈现大小模型“齐头并进”的趋势。大模型的规模化竞赛仍将持续,并融入更多模态的数据。另一方面,利用大模型训练小模型的技术将兴起,高效的小模型将在特定场景中发挥巨大作用。
二、安全隐患
大模型技术的不断成熟,其“双刃剑”效应也在日益凸显。大模型为安全行业注入了强大的AI驱动力,通过提高检测效率、精准度以及响应速度,有效增强了网络安全防护能力。例如,在恶意软件检测、异常行为识别等方面,大模型的应用显著提升了系统的智能化水平,帮助企业和组织更好地抵御网络威胁。
大模型市场2024年盘点:站在岔路口,未来将走向何方?
但与此同时,由于大模型通常需要大量的数据进行训练,因此可能加剧个人隐私信息的收集和处理风险。并且,由于大模型技术具有强大的文本生成能力,它们可能被用于制造和传播虚假信息,误导公众舆论,对社会造成不良影响。此外,大模型所具备的代码生成能力,使得没有编程经验的攻击者借助大模型自动生成所需的恶意代码。
根据网宿安全发布的《2023年互联网安全报告》显示,2023年,网宿安全监测到的全球Web应用程序攻击数量达到7309亿次,同比增长30%,其中,很多网络攻击的增长是由生成式AI技术带来的。同时,IBM的《生成式AI时代的网络安全研究报告》指出,高管们表示,他们2023年的AI网络安全预算比2021年增加了51%,并预计到2025年,这些预算将再增加43%。
由此可见,虽然大模型技术为安全行业带来了前所未有的机遇,但也提出了更加严峻的挑战,这需要业界共同努力,平衡好技术创新与安全保护的关系。
三、热门事件
回顾2024年,大模型市场发生了许多备受关注的重大进展和热点事件,我们列出了十个比较有代表性的标志性事件。
1、OpenAI推出Sora模型
当地时间2月15日,OpenAI宣布正在测试一款名为Sora的“文本生成视频”模型,只需要文本指令,或将文本与图像相结合就可以创建长达60秒的视频。其中,视频生成包含精细复杂的场景、生动的角色表情以及复杂的镜头运动,同时也接受现有视频扩展或填补缺失的帧。
2、英伟达发布全新旗舰AI芯片Blackwell GPU
当地时间3月18日,在GPU技术大会(GTC)上,英伟达发布了全新旗舰AI芯片Blackwell GPU,被称为是英伟达史上最成功的产品。英伟达称,Blackwell拥有6项革命性技术,可支持多达10万亿参数的模型进行AI训练和实时大语言模型(LLM)推理。
3、OpenAI发布GPT-4o模型
当地时间5月13日,OpenAI通过直播展示了产品更新,发布了GPT-4系列新模型GPT-4o。据OpenAI首席技术官Mira Murati介绍,GPT-4o的速度比GPT-4 Turbo快了两倍,但成本仅为其一半。GPT-4o可以实时对文本、音频和图像进行推理,响应时间几乎达到人类水平。
4、斯坦福AI团队抄袭中国大模型
5月29日,斯坦福AI团队发布名为Llama3-V的多模态大模型,声称只需500美元就能训练出一个性能可与GPT4-V媲美的模型。但随后,该模型很快被网友发现与中国大模型公司“面壁智能”的开源成果MiniCPM-Llama3-V 2.5拥有极为相似的模型架构与代码。6月4日,斯坦福Llama3-V团队的两位作者Siddharth Sharma和Aksh Garg在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型悉数撤下。
5、夸克升级2024高考信息服务
6月13日,夸克App全面升级高考AI搜索、智能志愿工具和独家优质内容等高考信息服务。据了解,夸克2024高考信息服务将继续提升产品体验和数据细节,让志愿推荐的结果更合理。同时,依托夸克在搜索上的优势,用户不仅可以搜大学、查专业,还可以提出个性化的志愿问题,得到由AI整合总结的回答。
6、华为云盘古大模型5.0发布
6月21日,在华为开发者大会2024(HDC 2024)上,华为正式发布盘古大模型5.0,围绕“全系列、多模态、强思维”进行了全新升级。张平安介绍称,盘古5.0推出适配不同业务场景多种规格模型,并与物理世界结合,加速大模型行业落地。
7、OpenAI服务限制引发争议
6月25日凌晨,多名用户收到OpenAI的推送邮件,信中称,自今年7月9日起,将开始阻止来自非支持国家和地区的API服务。受影响组织若希望继续使用OpenAI的服务,必须在其支持的国家或地区内访问。在OpenAI给出的“支持访问国家和地区”名单中,中国内地和中国香港未包含其中。针对此次变动,百度、阿里巴巴、腾讯、百川智能、智谱AI等国内大模型厂商迅速作出反应推出迁移方案,以帮助那些受影响的用户顺利过渡到其他可行的服务。
8、360安全大模型正式免费
7月31日,360集团创始人周鸿祎宣布360安全大模型正式免费。作为国内首个免费安全大模型,360安全大模型由攻击检测、运营处置、追踪溯源、知识管理、数据保护、代码安全等六大专家子模型组成,具备L级“自动驾驶”能力,并实现了对全网安全支持的深度理解,从而做到本地安全大脑在封闭网络下也能使用全网知识的重大突破。
9、丰田研究所与波士顿动力宣布合作推进机器人研究
10月16日,丰田在官网宣布与波士顿动力联合开发实体大型行为模型(LBM)机器人,以加速Atlas的通用能力和商业化场景。LBM的运行模式与ChatGPT等大模型类似,但LBM不能生成文本、图片等,而是帮助实体机器人能够通过观察人类行为来学习各种物理任务,例如,炒菜、做饭、照顾老人等。
10、全球首款AI游戏问世
11月2日,两家初创公司Decart和Etched联手打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis,玩家在其中体验到的每一帧都来自扩散模型的实时预测,游戏画面持续以20帧每秒的速度实时渲染,零延迟。
写在最后:
毫无疑问,大模型市场正处在一个充满机遇和挑战的时代。期待随着技术的不断进步,大模型能够在更多场景中得到应用,为社会发展注入新的活力。同时,也希望各方能够携手合作,共同应对安全问题,确保大模型技术的健康发展。