AI 大语言模型 LLM，为啥老被翻译成「法学硕士」？！

　　本文来自微信公众号“极客公园”(ID:geekpark)，作者:靖宇。

　　但凡偷懒一点，喜欢用浏览器或者翻译插件来看英语新闻的同学，估计都免不了在 AI 大模型火热的当下，被满篇的「法学硕士」晃得眼瞎不已。

　　并不是大语言模型LLM(Large Language Model)真的和法学有强关联，而只是一个缩写词的歧义解释而已。

　　为什么大模型掀起的新一波 AI 浪潮已如此汹涌，而浏览器和翻译软件，还是坚持将 LLM 翻译成「法学硕士」?大模型这「硕士帽」什么时候能摘掉?

　　论「LLM 浓度」，

　　大模型还是弟弟

　　首先需要说明的是，「LLM」这个缩写，在英文中既可以指代现在火热的「大语言模型 Large Language Model」;同时，在教育领域，它通常指的是「Legum Magister」或「Master of Laws」，即法学硕士。

　　而对于像 Google 浏览器配备的机器翻译功能，最常见的难题就是歧义和对上下文的理解。

　　机器翻译通常依赖大量的文本数据来学习如何翻译词语和短语。如果大多数「LLM」出现在与法律相关的上下文中，翻译系统可能会学习到「LLM」通常指的是「法学硕士」。除非系统能够识别出特定的技术上下文，否则它可能不会选择「大型语言模型」作为翻译。

　　即便现在大语言模型带动的生成式 AI 如此火热，但其实像 LLM 这类词汇在非技术人群中的普及度不高，这意味着翻译系统在其训练数据中，可能没有足够的实例来学习这种特定的上下文使用。

　　也就是说，LLM 作为「大语言模型」在机器翻译中的重要程度，还没有其作为「法学硕士」的程度高。

　　有图为证。

　　以「AI LLM」(人工智能，大语言模型)和「Law LLM」(法律，法学硕士)为关键词，截取两个关键词过去一年 Google Trends 的对比图，可以轻易看出，AI LLM 这一词从去年11月 ChatGPT 推出后才开始逐渐升温，而此时代表真正的法学硕士的 Law LLM 热度一直在「50分」左右。

　　而在2023年3月中旬，AI LLM 迎来了自己的第一波热度高潮，当时发生了什么?答案是美国当地时间3月14日，OpenAI 正式推出了 ChatGPT-4，彻底引爆了 AI 市场。

　　可以看到此后，只用了2个月时间，到5月末、6月初，代表 AI LLM 的曲线不断上扬，彻底在搜索热度上超过 Law LLM，并且趋势一直延续到现在。

　　通过全球热力图可以看到，对于 AI LLM 的关注，中国网友是相当热情的——生成式 AI 、 OpenAI 和 ChatGPT 等关键词一直处于「飙升」状态。

　　虽然在近期热度上，AI 压制了「法学高材生」，但由于「大语言模型」在绝对数量级上处于下风，依然是「弟弟」，所以机器翻译中还是默认 LLM 为「法学硕士」。

　　还能改吗?怎么改?

　　所以，LLM 大语言模型这个「法学硕士」的帽子，就没办法摘下来了?

　　那倒也未必，不过确实需要一些时日，其中一些关键因素，可能会加快澄清误会的速度:

　　技术术语的普及度

　　如果「大型语言模型」(Large Language Model)这一术语在网页、学术论文、新闻报道和社交媒体中的使用频率显著增加，搜索引擎更有可能学习到这一含义。

　　搜索引擎算法的改进

　　随着搜索引擎算法的不断优化，它们在理解上下文和消除歧义方面的能力也在提高。这可能会加快正确翻译「LLM」这一术语的过程。

　　用户反馈和行为