Tumblr 和 WordPress.com 的所有者 Automattic 正与 AI 公司 Midjourney 和 OpenAI 就提供用户帖子的训练数据进行谈判。
据报道,Automattic 计划推出一个新设置,允许用户选择退出与第三方(包括 AI 公司)的数据共享。此举可能为该网站提供新的收入来源。然而,有报道称,公司意外地收集了包含2014年至2023年所有 Tumblr 公开帖子内容的 “初始数据转储”,其中可能还包括一些不应公开可见的内容。目前尚不清楚这些数据的用途以及是否已将数据发送给 Midjourney 和 OpenAI。
OpenAI 和 Midjourney 尚未就此事发表评论。Automattic 则在404的报道后发布了一份公开声明。声明提到了与未具名的 AI 公司的合作伙伴关系,表示只会分享未选择退出的托管在 WordPress.com 和 Tumblr 上的公开内容。该公司表示,“只要他们的计划与我们的社区关心的事项相一致:归因、选择退出和控制,我们也将直接与一些 AI 公司合作。”
除了 Automattic 之外,其他公司也已与 AI 工具制造商达成协议,提供训练数据。然而,这一做法引发了一些创作者和写作者的抗议,他们反对自己的作品被用于训练。公司们在满足用户需求和尝试新 AI 工具之间难以取得平衡,这导致了一些在线空间如 DeviantArt 等尝试与技术接轨时遭到了抵制。
Automattic 目前主要以基于开源 WordPress 软件的 WordPress.com 和 WordPress VIP 为基础的长期网页托管业务。然而,该公司在如何获取 Tumblr 的收益方面一直存在困难,并且去年宣布将削减对该网站的雄心。
Automattic 与 AI 公司 Midjourney 和 OpenAI 之间的合作引发了一些关注和争议,尤其是在用户数据隐私和创作者权益方面的考量。该行为也反映了 AI 技术在如何利用公开数据进行训练上的伦理和合规问题。