OpenAI 称《纽约时报》的版权诉讼毫无根据

《纽约时报》曾于去年 12 月起诉 OpenAI 和微软公司,称这两家公司非法使用其受版权保护的材料来训练 AI 模型。时至今日,OpenAI 公开回击并发表了一篇博文称:“我们支持新闻业,与新闻机构合作,并认为《纽约时报》的诉讼毫无根据。”

该公司在博文中重申了以下四点立场:

OpenAI 方面表示,其目标是支持健康的新闻生态系统、成为良好的合作伙伴、创造互利的机会;考虑到这一点,该公司一直在寻求与新闻机构建立合作伙伴关系。通过与美联社、Axel Springer、American Journalism Project 和纽约大学的早期合作,他们已经对相关方法有了初步了解。

该公司认为,一些已经普遍被接受的先例表明,使用公开可用的互联网资料训练 AI 模型是属于合理使用范畴。“我们认为这一原则对创造者是公平的,对创新者是必要的,对美国的竞争力也是至关重要的。”

而关于“反刍”问题,OpenAI 则解释道,他们已经采取了措施来限制非故意记忆,并防止大模型输出中的反刍现象。并指出,如果训练数据来自单一来源(如《纽约时报》),则反刍的可能性较小;同时也敦促用户"act responsibly",避免故意促使其模型反刍。“故意操纵我们的模型进行反刍不是对我们技术的适当使用,也违反了我们的使用条款”。“反刍”是指特定内容在大模型的训练数据中多次出现的一种现象。

OpenAI 透露与《纽约时报》的最后一次沟通是在 2023 年 12 月 19 日,“我们与《纽约时报》的讨论似乎取得了建设性进展……我们向《纽约时报》解释说,与任何单一来源一样,他们的内容对我们现有模型的训练没有任何有意义的贡献,也不会对未来的训练产生足够的影响。但他们于 12 月 27 日提起了诉讼 —— 我们是也通过《纽约时报》才了解到的 —— 这令我们感到惊讶和失望。”

值得一提的是,OpenAI 称《纽约时报》在双方的沟通过程中已经发现了一些内容的反刍,但却在 OpenAI 承诺调查和解决任何问题的前提下,一再拒绝分享任何示例。

有趣的是,《纽约时报》提到的反刍似乎来自于多个第三方网站上大量传播的多年前的文章。为了让我们的模型进行反刍,他们似乎有意篡改了提示语,通常包括冗长的文章节选。即使在使用此类提示时,我们的模型通常也不会像《纽约时报》影射的那样,这表明他们要么是指示模型进行反刍,要么是从众多尝试中精心挑选了一些示例。

尽管他们声称,这种误用并非典型或允许的用户行为,也不能替代《纽约时报》。但无论如何,我们都在不断提高系统的抗逆向攻击能力,以避免训练数据被反刍,并在最近的模型中取得了很大进展。

在声明的最后,OpenAI 表示,尽管他们认为《纽约时报》的诉讼毫无根据;但仍然对《纽约时报》保持尊重并希望与其建立建设性的合作伙伴关系。“我们期待与新闻机构继续合作,通过实现 AI 的变革潜力,帮助他们提高生产高质量新闻的能力。”

OpenAI 做出回应之际,围绕生成式 AI 的版权争论正值白热化。一些数据表明,公众更倾向于站在媒体出版商这一方。The AI Policy Institute 最近的一项民意调查结果显示,当得知《纽约时报》起诉 OpenAI 的详情后,59% 的受访者同意 AI 公司不应该被允许使用出版商的内容来训练模型;70% 的受访则表示,如果这些公司想在模型训练中使用受版权保护的材料,就应该向出版商提供补偿。

延伸阅读:


已发布

分类

来自

标签: