上周,Axel Springer(拥有 Politico 和 Business Insider 的德国媒体集团)签署了一项价值数千万欧元的「多年许可协议」。
据该公司表示,该协议将「通过添加最新和权威内容的摘要,丰富用户与 ChatGPT 的互动体验。」Axel Springer 的报道文章也将用于训练OpenAI的模型。
这种合作安排表面上看似乎并不陌生。过去十多年里,社交媒体公司和更传统的媒体公司已经尝试了数十种技术与媒体合作模式,成效参差。这并非 OpenAI 与媒体组织之间的首次协议:今年早些时候,美联社(AP)已与该公司合作。然而,Axel Springer 的协议是迄今为止最全面的,可能为未来更多类似合作提供模板。
尽管过去的经验使人们容易将此类协议视为 AI 主导的普遍趋势的一部分,但这些协议应该让 OpenAI 等公司对不可避免性的故事产生更复杂的看法。事实上,这些合作伙伴关系可能有助于解释大型语言模型(LLMs)的实用性,也为过去一年对 AI 公司提起的广泛诉讼提供了一定的合理性。
换句话说,Axel Springer 的协议——类似于 OpenAI 与 AP 的协议,或其与 Twitter 的取消协议——使 OpenAI 能够训练其模型以创建 Axel Springer 作品组合中包含的现代风格内容:德语和英语的直接新闻;杂志特稿;各种主题的突发新闻、调查报道和博客文章;以及关于美国政治的新闻和大量内部新闻。下一个 GPT 模型将更好地模仿此类内容。如果 OpenAI 或其商业客户有实现新闻自动化的雄心——例如,向 AI 工具提供最新报道以进行语境化,或提供故事进行总结——这项协议可能使这种前景变得更加可行。如果像 Axel Springer 这样的公司高管设想他们可能希望使用 OpenAI 软件来降低劳动成本——提高生产力——那么这可能是朝着这个方向迈出的一步。
该交易的真正价值可能在于确保其未来产品不会仅存在于它们自己创造的真空中。
一些 OpenAI 的主要竞争对手,除了可以访问由其用户产生的大量训练数据外,还可以访问实时或至少最新更新的关于世界及其客户的信息和媒体:谷歌通过其搜索引擎拥有网络的大部分内容,更不用说 Gmail、Docs 和 YouTube;Meta 拥有 Instagram 和 Facebook;至于 Elon Musk 的 xAI 拥有 X。
OpenAI 产品和其竞争对手一样,可以访问网络,这意味着各种相关和最新内容,包括新闻。但随着 AI 公司变得更加强大,拥有网站的企业——包括新闻出版商——正在更有策略地决定如何提供其内容。今年 10 月,BBC采取措施阻止 OpenAI 抓取其内容,加入了纽约时报、CNN 和路透社的行列。
OpenAI 与出版商的交易是对一种情景的对冲,即抓取变得更困难和法律风险更大,训练材料更昂贵,实时数据更稀缺的情景——在这种情景下,付费 ChatGPT 用户可能会询问新闻,而 ChatGPT 可能无法访问可信的最新来源进行链接、总结或以其他方式传达。
换句话说,Axel Springer 的交易实际上是对 OpenAI 认为自己可能在未来几年面临的挑战的一种相当具体的预测,以及它在新闻领域看到的机会。
但这项交易也提出了另一个问题:如果网络将被只给予垃圾邮件回报的公司收割,而像 Axel Springer 这样的公司注定要成为自动化新闻聚合器的通讯社——如果 OpenAI 希望像之前的社交平台「合作伙伴」一样,抓住并自动化新闻分发的赚钱部分,同时将媒体制作的昂贵、困难和风险部分留给其合作伙伴——那么大型媒体公司是否应该要求更多?