您的位置:首页 > 互联网

OpenAI开撕纽约时报:故意引导ChatGPT得出抄袭结论

发布时间:2024-01-09 19:08:33  来源:互联网     背景:

  • 丰色 发自 凹非寺
    量子位 | 公众号 QbitAI

OpenAI的反击来了。

针对被纽约时报提起史上最受关注的侵权诉讼一案,OpenAI公开发表长文表明立场。

文章直接表示:整个诉讼毫无根据,并指出纽约时报:

  • 存在故意引导ChatGPT之嫌疑
  • 隐瞒信息,没有讲出完整的事情经过



以及OpenAI的总体观点是:

(1)使用版权数据训练合理。没有它们,哪来的当今世界上最先进的模型?
(二)如果你不想被训练?可以退出。单一数据源(包括纽约时报在内)的缺失也不会对模型的表现造成重要影响。

消息一出,吃瓜群众再次火速聚集,吵成一团。

支持OpenAI的直接“虾仁猪心”:

纽约时报退出训练数据集,反而会让模型输出质量更好(Doge)



有人则问了当事模型GPT-4的看法,结果AI也把纽约时报无情嘲讽了一番:



吴恩达也洋洋洒洒写了一大堆,总结来说就是:

同情OpenAI多于纽约时报,后者所说的全文抄袭更可能是RAG机制所致,并且实测OpenAI已经堵住漏洞,质疑纽约时报究竟受到了多少实际损失。



不过,反方网友也毫不留情,直接指着鼻子骂:

OpenAI,你太双标了,什么训练合理,都是为了你的利益最大化罢了。



你才是那个没有讲出完整故事的人。



OpenAI具体回应

霍格沃茨魔法学院在英国的哪里

先来看看OpenAI回应的具体立场,一共包含四个点:

1、非常乐意与新闻机构合作

OpenAI表示,自己在技术设计过程中努力行动支持新闻机构,会见了数十家相关媒体,聆听他们提出的担忧,并提供解决方案。

其本意也是支持健康的新闻生态系统,并实现互利互惠,具体包括:

(1)通过部署他们的产品,来协助新闻从业者完成一些耗时的任务,比如分析大量公共记录和翻译故事,最终让编辑和记者从中受益。

(二)通过对历史、非公开内容进行训练,向他们的AI模型传授世界知识。

(三)在ChatGPT回答中显示带有归属信息的实时内容,为新闻发布者与读者建立联系。

2、训练属于合理使用,提供退出机制

OpenAI此前就在提交给英国上议院的一份意见书中警告称:

如果没有受版权内容的训练,我们的模型就将无法运行。

在此,OpenAI再次表示,使用公开的互联网材料训练AI模型是合理的,既对创作者公平、对创新者必要,也对国家的竞争力至关重要。

并指出这一观点已经在美国得到很多团体、学者的支持,在其他国家和地区例如欧盟、日本、新加坡等甚至有法律支持对受版权保护的内容进行训练。

不过,话锋一转,本着“合法权利对我们来说不如成为好公民重要”,OpenAI表示自己提供了一个简单的退出流程,可以防止他们的AI模型再次访问这些网站数据。

据介绍,纽约时报已经于2023年8月采用这一机制,退出OpenAI的训练。

3、“反流”是罕见错误,希望用户也不要故意引导

所谓“反流”(Regurgitation),其实就是指模型输出和训练数据一模一样的内容。

纽约时报在诉讼中就列出ChatGPT和该家新闻惊人雷同的情况:



对于这一文绉绉的表达,有网友是不满的:不就是抄袭(plagarism)吗?



但不管怎么说,OpenAI的解释是:

当特定内容在训练数据中多次出现时就会出现这种罕见的错误,不过我们已经采取了措施来防止情况出现。

以及,OpenAI也特别劝诫用户:

采取负责任的行为,不要故意操纵模型进行反流,这既是对我们技术的不当使用,也违反了我们的使用条款。

然而,马库斯和一位数字插画家几天前曾联合撰文,列出包括 DALL-E 3在内的AI模型如何在没有明确提示的情况下的不少“反刍数据”,也就是给出一些明显和已有作品场景基本相似的图片等内容。

而这,就使得OpenAI的说法有些矛盾。

最后,在本段末尾,OpenAI还来了一句:

模型是从人类知识的巨大集合中学习的,因此任何一类数据(包括新闻)都只是整体训练数据的一小部分,任何单一数据源(包括纽约时报在内),对于模型的知识学习都并不重要。

4、完整故事被隐藏,收到起诉后惊讶又失望

OpenAI透露,在去年12月19日时,其实已经和纽约时报取得了建设性谈判进展,包括在回答中实时显示来源和跳转等,并和纽约时报解释:

与任何单一来源一样,你们的内容对我们现有模型的训练没有任何有意义的贡献,也不会对未来的训练产生足够的影响。

然而OpenAI表示没想到,12月27号就被直接起诉了,并且还是通过纽约时报的消息才知道——心情整个就是一个既惊讶又失望。

在此,OpenAI指出,对于纽约时报指出的”反流”情况(也就是回答逐字抄写纽约时报新闻),他们很努力解决这个问题,拿出了诚意,并曾要求后者分享示例,但一再遭到拒绝。

更有趣的是,OpenAI发现,所谓的“反流”内容,其实是多年前多个第三方网站上大量传播的文章(即并非来自纽约时报)。

以及纽约时报可能涉嫌故意操纵提示词——放进去大段原文让模型“上当”。

OpenAI表示,按照他们这么操作,模型其实也并没有像纽约时报展示的那样夸张。

这说明:他们要么故意引导模型,要么进行过精挑细选。

综合以上,OpenAI认为:

纽约时报的诉讼毫无根据。

不过缓和的场面话也是有的:

我们仍然希望与其建立合作伙伴关系,毕竟它曾在60年前报道了第一个有效工作的神经网络。

前情回顾

去年12月27日,纽约时报突然一纸状书、220000页附件,递交到地方法院状告OpenAI侵权,当然还包括微软。

诉状中指出,纽约时报的文章构成了Common Crawl中用于训练GPT的最大单个专有数据集。

基于此,他们找到了多达100个铁证,证明ChatGPT输出内容与纽约时报新闻内容几乎一模一样。

并且有时由于幻觉问题,模型还会以纽约时报的名义“造谣”,生成一些假新闻,例如橙汁会导致淋巴癌,这也对他们的名声造成了困扰。

对此,纽约时报的诉求是:

要求OpenAI和微软销毁包含侵权材料的模型和训练数据,并对非法复制和使用《纽约时报》独有价值的作品相关的“数十亿美元的法定和实际损失”负责。

由于证据充足、律师团队强大,网友直呼这是一起“见证AI侵权里程碑式的案件”、“恐怕不能再像之前摆平其他出版商那样三瓜两枣就打发了”。



据了解,去年4月份时,纽约时报就与OpenAI谈判,但没谈妥,OpenAI拒绝达成协议。

原因可能是金额巨大,特别是考虑到OpenAI利润的增长以及类似案例的增多。

有一个大胆猜测是,OpenAI可能想用七至八位数金额(百万美元/千万美元)解决此事,但纽约时报所追求的是更高的赔偿和持续的版税收入。

Ps. OpenAI年收入在16亿美元左右,每年用于买授权文章和材料进行训练的金额在100万美元至500万美元之间。

这次,网友站哪边?

有网友指出,这起案子的关键是“训练是否为合理使用”,而他认为:

模型的输出可能会侵权,但输入不会。



但有人讽刺道:

当你拥有数十亿美元时,一切都是合理使用。



也有人提出:

我同意为合理使用,但前提是你开源。



并有人附和:

确实强调非营利性组织很重要。



此外,对于OpenAI提出的退出机制,有一位作家网友不满的声音也得到了很多支持:

光退出,也就是禁止你们的模型读取我的个人网站还不够,我还需要你仔细检查并从训练数据中完全删除我的内容。



结局究竟会如何?

一项调查显示,有59%的受访者认为,不应允许人工智能公司使用出版商内容来训练模型。

而70%的人表示,如果公司想在模型训练中使用受版权保护的材料,则应向出版商进行补偿。

看起来,舆论似乎是站在纽约时报这一边的。

你觉得这个案子应该怎么判?

参考链接:
[1]https://openai.com/blog/openai-and-journalism
[2]https://x.com/OpenAI/status/1744419710635229424?s=20
[3]https://www.ft.com/content/04861d1e-2e9f-4b92-a294-8d0c223a8287
[4]https://techcrunch.com/2024/01/08/openai-claims-ny-times-copyright-lawsuit-is-without-merit/
[5]https://www.theregister.com/2024/01/08/midjourney_openai_copyright/
[6]https://x.com/AndrewYNg/status/1744433663969022090?s=20
[7]https://x.com/futuristflower/status/1744422698636218807?s=20


返回网站首页

本文评论
chrome91版本_Chrome99稳定版开始推送
  ITBEAR科技资讯3月3日消息,作为市场占有率最大的浏览器,谷歌正式推出了Chrome的最后一个双位数版本Chrome99稳定版。目前,Chrome100已经进入开发版通道,稳定版将于月底开始...
日期:05-26
荣耀X50 GT官宣:1月4日正式发布,最大遗憾曝光
12月28日,荣耀X50 GT正式官宣:满帧战神,强悍芯生。以越级之名,重新定义满帧体验!1月4日19:30,战神现世,不服来战!当亓纪将渲染图分享给网友后,曲面屏成为他们热议的焦点,也应该是目前...
日期:12-29
一头价格不到160元:澳大利亚羊泛滥 农民免费送也不要养了
快科技11月25日消息,据国外媒体报道称,澳大利亚的羊出现了泛滥,一头价格不到160元,以至于不少农民免费送也不愿意饲养。大象 机器人据澳大利亚肉类及畜牧业协会(MLA)数据,今年澳大...
日期:11-25
纽约MTA拟重新更改中央车站租约邀请苹果入驻
纽约市中央车站内景(腾讯科技配图)(马乔)北京时间5月24日消息,据国外媒体报道,纽约城市交通管理局(Metropolitan Transportation Authority, 以下简称“MTA”)计划重新更改位于纽...
日期:07-28
亚运会vi「最智能的一届亚运会,谁吃到了红利?」
图片来源@视觉中国文 | 硅基研究室,作者|山核桃从北京、广州到杭州,33年后,当杭州迎来亚运会时刻,在体育盛事的标签之外,智能化与数字化无疑是本届亚运会最大的亮点之一。 从开幕...
日期:10-05
假如特朗普、马斯克等富豪生在贫民窟会什么样?AI画作告诉你_马斯克特朗普推特上一唱一和
来源:环球时报安卓下载搜狗输入法微博支付宝支付异常【环球时报综合报道】据《印度快报》9日报道,一组名为“贫民窟的亿万富豪”的人工智能(AI)画作在网上发布后,引起了全球关注...
日期:04-11
京东工业 上市「京东拟分拆京东工业、京东产发于港交所主板独立上市」
3月30日晚消息,京东在港交所公告,京东拟分拆京东工业、京东产发于香港联交所主板独立上市。据公告,拟议分拆完成后,公司将继续间接持有京东工业、京东产发50%以上的股权,因此,京东...
日期:03-30
共谋元宇宙发展 | 时空节拍受邀参加第二届【2023日本国际元宇宙大会】
图1第二届日本国际元宇宙大会行业先进专家剑灵洪门武器卖掉了2023年7月26日-27日,第二届日本国际元宇宙大会采取线下+线上的模式,在日本京都隆重举行。本届大会由国际元宇宙协...
日期:07-29
直播电商的2022,出现七大变化
声明:本文来自于微信公众号 电商报Pro(ID:kandianshang),作者:月涯,授权转载发布。告别野蛮生长,直播带货依旧火热2021年底,直播电商巨变。伴随着超头时代的终结,整个2022年直播电...
日期:12-19
吴京带《巨齿鲨》剧组吃淄博烧烤 向国际友人介绍了淄博烧烤的特点
吴京最近在社交媒体上分享了一段感人的视频,视频中他带着《巨齿鲨2》的剧组到山东省淄博市品尝当地特色烧烤,并讲述了淄博烧烤出圈的故事。淄博烧烤是山东淄博市的一道特色美...
日期:06-15
青云科技2023三季度报:布局AI算力,毛利增长147.95%_青云科技盈利
通信世界网消息(CWW)10月31日,企业级云服务商与数字化解决方案提供商青云科技发布了2023年三季度财报。根据财报,青云科技2023年1-9月的总营业收为2.57亿,同比增长10.20%。归母净...
日期:11-01
诺基亚贝尔在PT/Expo刷新《洞见当下,预见未来》趋势报告4.0版本
通信世界网消息(CWW)6月4日,诺基亚贝尔在中国国际信息通信展览会(PT/EXPO 2023)上举办2024-2030趋势发布会,公布了诺基亚最新4.0版本《洞见当下,预见未来(konw,now)》趋势报告。该最新...
日期:06-05
GitHub一项调查显示:92%的程序员正在使用人工智能
6月19日 消息:GitHub 进行了一项调查,旨在了解有多少程序员正在使用 AI 工具。结果显示,500名接受调查在美国工作的开发人员中有92% 的人表示已经将 AI 工具整合到了工作中,而7...
日期:06-19
鲁大师2023年Q1手机报告:OPPO Find X6 Pro刷新性能榜新纪录
  近期,鲁大师发布了 2023 年Q1 季度手机报告,搭载骁龙8 Gen2 芯片手机厂商纷纷发力,推出多款搭载该芯片的手机产品,综合性能榜主要竞争在各家厂商在骁龙8 Gen2 的调校上。最...
日期:04-06
联想平板笔记本电脑可否连接手机「联想平板笔记本电脑」
随着社会的发展和科技的进步,越来越多的人选择电脑作为工作、学习和娱乐的工具。而在各种电脑产品中,平板笔记本电脑作为一个高性价比、轻便易携带的产品越来越受到人们的欢迎...
日期:05-30
广电电视怎么开通_广电总局打开政策闸门 互联网电视盼得合法身份
  在三网融合的政策推动下,一周之内,3张互联网电视牌照相继发出,这也标志着互联网电视终于跨出政策的樊篱,向前迈出了实质性的一步   3张牌照的诞生,让互联网电视名正言顺地...
日期:07-29
高一到高三,zinch一族跨过分数取经
  作为92年的我们,可能有很多的梦想,出国留学估计也是很多孩子的梦想,可是很多同学都受困于自己的学习成绩,很多因为学习成绩不好,就都放弃了自己当初的理想。我是一个比较特...
日期:07-29
努比亚折叠屏手机来了:新骁龙8系U 支持100W快充_努比亚x8g十128g
快科技5月13日消息,据Pricebaba,努比亚新款折叠屏手机Z60 Fold最近被曝光,型号为NX801J。台积电给苹果代工手机芯片据悉,努比亚Z60 Fold采用了一块7.3英寸AMOLED内屏,处理器为尚...
日期:05-14
儿媳妇偷绑婆婆银行卡购买《王者荣耀》皮肤 盗刷1.7万元
7月11日,贵州惠水法院审理了一起盗窃罪案件,儿媳妇竟然偷婆婆的钱买《王者荣耀》游戏里的皮肤,让人大跌眼镜。据了解,2021年8月,儿媳妇在家修养,借助帮婆婆注册微信的机会,拿到了婆...
日期:07-19
快手升级消费者隐私信息加密 仅展示个字「快手消费等级隐藏了怎么打开」
10月9日 消息:日前,快手电商发布消息称,为确保消费者和商家的数据安全,响应国家隐私保护相关法律法规。快手小店10月12日将正式升级对消费者隐私信息进行加密。快手小店后台将...
日期:10-19