OpenAI 的另一位高管在被问及 Sora 视频生成器是否使用了 YouTube 数据时,同样陷入了困境。在最近举行的 Bloomberg 科技峰会上,OpenAI 席运营官 Brad Lightcap 在回答记者 Shirin Ghaffary 的问题时,以迂回冗长的方式回应,没有给出明确答案。
"你能否说出 Sora 是否使用了 YouTube 数据?" Ghaffary 问道。Lightcap 的回答是一段冗长的话语,试图转移对 Sora 训练数据的质疑。
"嗯,我是说,关于数据的讨论非常重要," Lightcap 说道。"我们显然需要道数据的来源。"
在对未来的 "AI 内容识别系统" 进行详细描述后,这位高管似乎比 OpenAI 的首席技术官 Mira Murati 更接近承认 Sora 是使用了 YouTube 数据进行训练。
"是的,我们正在研究这个问题," Lightcap 说道。"这确实非常困难。"他接着说,虽然 OpenAI 对这个 "困难" 问题还没有 "所有答案",但可能会在2026年之前找到。
那么,对于 YouTube 的答案呢?"Ghaffary 反问道。" 暂时没有答案。"
Lightcap 在镜头前的这个失态引起了人们对于 Murati 在三月份类似尴尬回答的回忆当时,在接受华尔街日报采访时,这位首席技术官在被直接问及 Sora 是否使用了 YouTube 数据时也犯了同样的错误。
"我们使用了公开可获得的数据和授权数据," Murati 说道。
"那YouTube 上的视频呢?" 华尔街日报的 Joanna Stern 追问道。
"对此我其实不确定," 这位首席技术官回答道,并在一段长时间的追问后试图解释自己,称虽她认为这些数据是 "公开可获得的",但对此并不确定。
在尴尬的交流之后,Murati 向该报纸证实使用了 Shutterstock 的视频,但关于 Sora 训练数据是否还包括 YouTube 视频,仍然存在争。然而,正如一位财经记者开玩笑所说,Lightcap 的回应几乎可以肯定 Sora 确实使用了 YouTube 数据。
"这是 AI 界的肯定回答," Sherwood News 的 Rani Molla 在推特写道,随后补充说 " 这个回答比肯定还要糟糕。
Sora 是 OpenAI 的视频生成器,该公司之前进行的展示被揭露为并非由 Sora 生成。Sora 被怀疑使用了大量 YouTube 数据进行训练,而 OpenAI 的高管们一直回避承认这一事实。这一事件引发了人们对于 AI 训练数据的透明度和道德问题的广泛讨论。