OpenAI 称《纽约时报》的版权诉讼毫无根据-岩猫星空网

《纽约时报》曾于去年 12 月起诉 OpenAI 和微软公司，称这两家公司非法使用其受版权保护的材料来训练 AI 模型。时至今日，OpenAI 公开回击并发表了一篇博文称：“我们支持新闻业，与新闻机构合作，并认为《纽约时报》的诉讼毫无根据。”

该公司在博文中重申了以下四点立场：

OpenAI 方面表示，其目标是支持健康的新闻生态系统、成为良好的合作伙伴、创造互利的机会；考虑到这一点，该公司一直在寻求与新闻机构建立合作伙伴关系。通过与美联社、Axel Springer、American Journalism Project 和纽约大学的早期合作，他们已经对相关方法有了初步了解。

该公司认为，一些已经普遍被接受的先例表明，使用公开可用的互联网资料训练 AI 模型是属于合理使用范畴。“我们认为这一原则对创造者是公平的，对创新者是必要的，对美国的竞争力也是至关重要的。”

而关于“反刍”问题，OpenAI 则解释道，他们已经采取了措施来限制非故意记忆，并防止大模型输出中的反刍现象。并指出，如果训练数据来自单一来源（如《纽约时报》），则反刍的可能性较小；同时也敦促用户"act responsibly"，避免故意促使其模型反刍。“故意操纵我们的模型进行反刍不是对我们技术的适当使用，也违反了我们的使用条款”。“反刍”是指特定内容在大模型的训练数据中多次出现的一种现象。

OpenAI 透露与《纽约时报》的最后一次沟通是在 2023 年 12 月 19 日，“我们与《纽约时报》的讨论似乎取得了建设性进展……我们向《纽约时报》解释说，与任何单一来源一样，他们的内容对我们现有模型的训练没有任何有意义的贡献，也不会对未来的训练产生足够的影响。但他们于 12 月 27 日提起了诉讼 —— 我们是也通过《纽约时报》才了解到的 —— 这令我们感到惊讶和失望。”

值得一提的是，OpenAI 称《纽约时报》在双方的沟通过程中已经发现了一些内容的反刍，但却在 OpenAI 承诺调查和解决任何问题的前提下，一再拒绝分享任何示例。

有趣的是，《纽约时报》提到的反刍似乎来自于多个第三方网站上大量传播的多年前的文章。为了让我们的模型进行反刍，他们似乎有意篡改了提示语，通常包括冗长的文章节选。即使在使用此类提示时，我们的模型通常也不会像《纽约时报》影射的那样，这表明他们要么是指示模型进行反刍，要么是从众多尝试中精心挑选了一些示例。

尽管他们声称，这种误用并非典型或允许的用户行为，也不能替代《纽约时报》。但无论如何，我们都在不断提高系统的抗逆向攻击能力，以避免训练数据被反刍，并在最近的模型中取得了很大进展。

在声明的最后，OpenAI 表示，尽管他们认为《纽约时报》的诉讼毫无根据；但仍然对《纽约时报》保持尊重并希望与其建立建设性的合作伙伴关系。“我们期待与新闻机构继续合作，通过实现 AI 的变革潜力，帮助他们提高生产高质量新闻的能力。”

OpenAI 做出回应之际，围绕生成式 AI 的版权争论正值白热化。一些数据表明，公众更倾向于站在媒体出版商这一方。The AI Policy Institute 最近的一项民意调查结果显示，当得知《纽约时报》起诉 OpenAI 的详情后，59% 的受访者同意 AI 公司不应该被允许使用出版商的内容来训练模型；70% 的受访则表示，如果这些公司想在模型训练中使用受版权保护的材料，就应该向出版商提供补偿。

OpenAI 称《纽约时报》的版权诉讼毫无根据

作者：pu

相关推荐

近期文章

归档

分类