您的位置:首页 > 互联网

《纽约时报》的律师们在一个秘密房间里检查OpenAI的源代码_纽约时报案例

发布时间:2024-10-11 22:14:53  来源:互联网     背景:

声明:本文来自于微信公众号 AI新智能,作者:AI新智能,授权转载发布。

OpenAI和微软正面临来自出版商、作家和其他创作者的诉讼,指控他们剽窃了这些创作者的作品。这些诉讼可能会重塑生成式AI行业。

在美国某个地方的一间安全房间里,一台与互联网断开的电脑中存放着ChatGPT的源代码。这是为了让《纽约时报》的律师进行检查。

根据一名联邦法官的命令,这些律师只有出示政府颁发的身份证件给安保人员,才能进入这间房间。他们被禁止携带手机、U盘或任何其他电子设备进入房间。房间内提供了一台同样与互联网断开的电脑,并安装了文字处理软件。每次检查后,他们的笔记可以被下载到另一台电脑上,随后原始笔记的电脑将被清空。

《纽约时报》的律师可以将笔记分享给最多五名外部顾问,以帮助他们理解源代码的功能。如果其中一位律师想在审讯时向OpenAI的首席执行官山姆·阿尔特曼(Sam Altman)展示代码片段以提问,展示后该代码副本必须被销毁。

OpenAI的估值高达1570亿美元,很大程度上归功于ChatGPT的成功。然而,为了打造这个聊天机器人,公司在训练模型时使用了大量的文本,却没有为此支付任何费用。

这些文本包括《纽约时报》的报道、其他出版物的文章,以及大量受版权保护的书籍。对ChatGPT源代码的检查,以及微软使用OpenAI技术构建的人工智能模型的审查,是针对这两家公司版权侵权诉讼的关键。

出版商和艺术家们已经对生成式AI公司提起了大约二十起重大的版权诉讼。他们志在必得,要求分享使OpenAI成为行业巨头、推动微软估值超过3万亿美元的经济成果。这些案件的法官可能会为美国的大型语言模型如何进行训练设定法律边界。

《纽约时报》的一位发言人告诉《商业内幕》:“开发者应该为用于创建和运营其产品的宝贵出版商内容付费。该技术的未来成功不应以新闻机构为代价。”

纽约时报的讣告

这家有着173年历史的媒体公司为此次诉讼聘请了顶级律师事务所Susman Godfrey,该事务所最近刚在Dominion公司对福克斯新闻的巨额诉讼中赢得了7.875亿美元的和解金。其他新闻机构的诉讼,如《纽约每日新闻》和《母亲琼斯》,也加入了这起案件。

Susman Godfrey还代表了一组作家,其中包括乔治·R·R·马丁、乔迪·皮科和塔-内西·科茨,他们在《纽约时报》提起诉讼的几个月前就已经提交了版权索赔。如果法官批准他们的集体诉讼地位,最终的和解或判决可能会影响几乎所有作品被用于训练AI模型的作家和艺术家。

9月12日,数十名来自科技和新闻行业的律师齐聚曼哈顿下城的一位治安法官的法庭,商讨如何分配取证过程的最佳方式,其中包括检查ChatGPT的代码和训练数据。与作家的律师一起,他们仍在决定可以传唤谁,以及如何安排证人作证。

乔治城大学法学院知识产权法教授克里斯特利娅·加西亚表示:“对于从事版权工作的法律教授来说,这已经是最令人兴奋的时刻了。”

1

设置规则

摩托车氙气灯多少瓦合适?

由于国会在人工智能监管方面保持观望,该行业预期法院将会设定规则——或者,他们希望法院不要设定规则。

2

相关故事

许多出版商,包括《商业内幕》的所有者阿克塞尔·施普林格,已经与生成性人工智能公司达成协议,允许他们分享内容用于大型语言模型的训练。

《纽约时报》提起的诉讼范围广泛且资源雄厚,因此很可能成为具有先例意义的最高法院案例。律师们也在关注来自作者的集体诉讼以及音乐产业对Anthropic的案件,认为这些案件值得关注。

纽约律师kevin

“《纽约时报》是一家新闻巨头,”加西亚说。“它体量庞大,内容丰富。更重要的是,它在这些内容背后拥有巨大的市场力量。”

该诉讼指出,OpenAI侵犯了其知识产权,主要有两个方面。首先是“输入”案件,指控该大型语言模型非法收集了超过1000万篇《纽约时报》文章,以训练ChatGPT和微软C0pilot,而未支付任何报酬。其次是“输出”案件——指控当用户提问时,ChatGPT能够输出一篇《纽约时报》文章,读者本来需要为此支付订阅费。

在法庭文件中,律师们多次引用了Napster的案例,该平台非法复制了数百万首歌曲并提供免费下载。《纽约时报》认为,OpenAI同样利用了高质量、经过良好研究、内容翔实的《纽约时报》文章,使得ChatGPT如此出色。

据代表作者提起与《纽约时报》案件平行的集体诉讼的Susman Godfrey律师贾斯廷·尼尔森表示,OpenAI的行为在某种程度上更糟糕。他指出,Napster是由大学生发起的项目,而OpenAI则得到了微软的支持,估值已达数十亿美元。

“这不是孩子们的行为,而是一家成熟的公司,”尼尔森告诉《商业内幕》。他补充说:“他们不是为了个人使用,而是为了商业利益在这样做。”

OpenAI和微软的代表没有回应《商业内幕》的置评请求。在法庭上,他们辩称“合理使用”这一法律原则保护了他们的模型如何获取文章。他们表示,ChatGPT输出的与《纽约时报》文章几乎一模一样的内容是“高度异常”的结果,并不代表该应用的实际使用情况。

Napster被起诉至破产,但它激励了音乐产业采用MP3格式,并最终发展出如今广泛应用于视频游戏和电影的流媒体服务。《Spotify》联合创始人丹尼尔·埃克(Daniel Ek)将Napster视为灵感来源,而Napster的联合创始人肖恩·帕克(Sean Parker)则称赞Spotify是其继承者。

曾在音乐行业工作十年的加西亚预测,来自新闻组织的版权诉讼可能会为所有人工智能生成器设定节奏。他指出,人工智能在生成电影或进行报道方面并不特别出色,但它可以令人信服地模仿新闻报道。

“新闻业就像是煤矿里的金丝雀,”加西亚说。“在Napster时代,音乐就是金丝雀,因为人们可以轻松下载MP3文件。而在那个时候,下载电影却并不容易。”

考虑到涉及的人数众多,作者的诉讼可能会产生更为深远的影响。一个和解或判决可能会改变商业模式。

埃默里大学研究版权法和人工智能的法学教授马修·萨格说:“人们在集体诉讼和解中发挥创造力。”。“你可以削减美国作家的股份或其他东西。”

3

源代码

生成性人工智能技术的本质正是版权争议的核心。那么,当一个大型语言模型“学习”一本书或一篇新闻文章时,实际上发生了什么?当ChatGPT挖掘模型以回答查询时,又会如何?这个过程是否在某种意义上“复制”了内容?还是说训练数据仅仅是一个庞大的零和一的混合体,不再与特定作品有任何实质性相似之处?

律师和顾问们正在深入分析ChatGPT的代码,以试图解答这些问题。他们还在审查大型语言模型的训练数据,并计划在宣誓下询问OpenAI的关键高管和程序员,这些模型究竟是如何运作的。

一旦代码被阅读并进行证词记录,各方将更有能力就“合理使用”进行辩论,这是一项notoriously tricky的法律原则,保护从版权材料中派生出的“变革性”创作。

如果OpenAI真的像Napster那样在复制书籍和新闻文章,那么其训练过程是否足够具备变革性,已被视为“合理使用”?克利夫兰州立大学知识产权法教授克里斯塔·雷瑟表示,全国各地的法官在裁定合理使用版权案件时“各执己见”,这让局势变得更加复杂和不可预测。

“我认为,最终这个问题将会提交到最高法院,”雷瑟对《商业内幕》表示。“关于训练数据、获取和训练的合理使用问题,将是关键所在。”

一个关键的“合理使用”问题是,ChatGPT的创作是否与原始新闻作品相竞争——这是新闻机构面临的紧迫问题。

“新闻出版商首先提起这些重大诉讼,因为他们面临的风险更大,”加西亚说。

要提出版权索赔,原告不能仅仅指向一组用作灵感的作品。必须指向他们认为被复制的具体作品。

在诉讼中,《纽约时报》附上了数以万计的证据,列出了10,553,897篇文章。它声称OpenAI和微软非法侵犯了每一篇文章的版权。

其中包括一篇2001年的报道,正值上诉法院对Napster作出裁决不利于其时,记者向用户询问他们的看法。所有人都一致认为,已经无法回头。

“一旦Napster真的关闭,还有更多的网站会出现,”一位用户告诉记者。“他们可能会关闭一些,但不可能阻止所有的网站。”


返回网站首页

本文评论
月销百亿,这些商家卖疯了_销售破百亿
声明:本文来自于微信公众号 派代公众号(ID:paidaiwang),作者:菠萝蜜,授权转载发布。近日,消息称,抖音生活服务GMV继续保持高速增长,到9月,单月GMV已经超过80亿元,10月更是超过100亿元,...
日期:11-28
今年的五一疯了吗?第一批游客把长沙堵紫了 海底捞门店睡满人致无法用餐
五一假期首日,各地的人流盛况已经让人大开眼界,景区人从众”,高速堪比车展难怪有网友表示今年疯了吗?”而值班的我表示,工作使人快乐。苹果股票市值首次突破3万亿美元在湖南省会...
日期:04-30
2019国家网络安全宣传周校园日:腾讯安全专家披露校园非法网贷隐藏套路
  9月17日上午,2019年国家网络安全宣传周“校园日”专场活动在天津大学正式启动。教育部思想政治司、天津市委网信办、天津市教委通过网络安全倡议书宣读、网络安全现场访...
日期:03-03
小米汽车外观正式曝光,尾标为“北京小米”,有爆料称起售价超30万元
百度总裁李彦宏哪里人出品 | 科技编辑 | 张雅婷11月15日消息,工信部发布《道路机动车辆生产企业及产品公告》(第377批),纯电动轿车小米牌汽车在列。数据显示,小米汽车长宽高为4...
日期:11-16
百度医疗平台_百度健康:建立医患匹配引擎,直连20余国家医疗区域中心
讯 8月15日上午消息,百度健康称其打造了医患匹配引擎,与公立三甲医院和专科合作,通过大数据与AI技术匹配区域内公立三甲医院专科服务。   百度健康方面表示,其一共直连了20余...
日期:08-16
大地教育单季度亏损超全年,留学中介机构还有想象力吗?
图片来源:东方IC   近日,大地教育发布第一季度业绩报告,2023财年第一季度亏损654.7万港元,同比扩大153.66%,超过2022财年全年亏损金额。   营收疲软、连续亏损、成本控制不力...
日期:08-20
换标签续命水果馊了才肯扔 网红店茉酸奶致歉:涉事门店即刻闭店
快科技5月27日消息,今日,网红饮品品牌茉酸奶因被曝换标签续命水果馊了才肯扔”登上热搜,相关话题引发热议。一k等于多少米三星s22上市价格今天下午,针对媒体报道的茉酸奶门店使...
日期:05-28
联想全球调查发现科技会对人类价值观产生积极影响(联想与科学发现)
  近年来,随着云计算、大数据、物联网、移动互联和人工智能的发展,智能科技应用不断落地,逐渐走入了人们的日常生活,“云大物移智” 从经济、文化、政治、能源、教育、价...
日期:04-18
京东健康:今日斥资约2800.34万港元回购61.3万股公司股份_京东持股京东健康
  京东健康9月23日在港交所发布公告称,9月23日斥资约2800.34万港元回购61.3万股公司股份,每股回购价44.8-47.45港元。双十一苹果13降多少虎牙盈利模式分析藏红花能和高丽参...
日期:09-24
240W屠榜级快充来喽 真我GT-Neo5春节后发布_真我gtneo支持快充
不久前,真我推出了240W满级秒充技术,同时宣布全新的真我GT Neo5将首发搭载该技术,将于2月份正式发布。随着发布时间的日益临近,外界关于该机的爆料也更加密集,截至目前已经有非常...
日期:09-20
不明觉厉的AI绘画,对内容创作者来说有什么用?「ai创作的画作」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:卷毛,授权转载发布。AI绘画的发展速度已经超乎我们的想象了。可能不少人会觉得惊讶,两年前AI只能画一些难以辨认的模糊图片,如...
日期:10-04
vivo回应德国诺基亚专利案败诉:正对一审提出上诉「诺基亚卖专利」
4月13日消息,据悉,德国曼海姆地方法院近期在针对vivo的专利案中裁定诺基亚胜诉,该诉讼涉及诺基亚4G 标准必要专利(SEP),或将导致 vivo 产品无法在德国销售。对此,vivo方面表示,遗憾...
日期:04-13
手机会膨胀吗「手机App为何越来越膨胀?网友吐槽128GB手机被火速填满」
你有存储焦虑吗?佳能4K摄像机现在随着各种手机App的功能不断丰富,占用空间的情况也明显扩张,动不动几个GB就没了。甚至大部分人都已经发现,128GB手机完全不够用了,有网友称自己新...
日期:10-18
三次IPO失败后,第四范式再闯港股:累亏近42亿元,腾讯和五大国有银行加持
出品 | 科技作者 | 梁昌均在第三次港股IPO失效后,国内人工智能企业第四范式依然没有放弃,昨晚第四次提交了更新后的招股书。这家公司的上市之路已经走了两年,过程颇为曲折。早...
日期:05-26
火狐 Firefox Lite 浏览器已死,Mozilla 宣布停止开发和支持_Firefox崩溃
  7 月 7 日消息 火狐 Firefox Lite 浏览器是 Mozilla 在 2017 年推出的一款轻量级 Android 浏览器,拥有页面加速、隐私保护、滚动截图、节省流量等功能。   近日,Mozil...
日期:10-23
广东蟑螂已经会发光了 网友:像是举着两根应援棒_广东蟑螂表示很担心你
7月20日消息,提到蟑螂小强”,想必很多人都深恶痛绝,尤其是南方的朋友,毕竟广东的蟑螂不仅身形大,还不怕人,敢往人身上飞,出了名的恐怖。iphone12pro跌破发行价最近广东进入到高温湿...
日期:07-20
力劲集团:全球首件全尺寸整体车身一体化压铸件成功下线,万吨双压射整体底盘技术进入可量产阶段
IT之家 8 月 14 日消息,全球首件全尺寸整体车身一体化压铸件下线仪式上周三在力劲集团(宁波杭州湾新区)压铸机生产基地隆重举行,此举也意味着万吨双压射整体底盘技术进入可量产...
日期:08-19
零食江湖战火再起:老网红遇瓶颈、新网红抢市场「网红零食营销」
声明:本文来自于微信公众号 连线Insight(ID:lxinsight),文/王慧莹,编辑/周晓奇,授权转载发布。洽洽食品曾在一次推广活动上提到:经济越不景气,越需要零食来舒缓压力。原画师能在家...
日期:10-25
一条微博引发的猜测,微信将发视频功能?_微博发视频为什么是小视频
“微信,能发照片的免费短信”,这是腾讯微信刚上线时的广告语,到现在的“微信,让熟悉的声音骚起来”、“微信,最流畅的手机对讲机”。据腾讯官方数据截至5月其微博用户数已超过2...
日期:07-22
土耳其发生6.8级地震 新闻「土耳其两次7.8级强震多地受损 苹果CEO库克宣布向灾区捐款」
据中国地震台网测定,当地时间2月6日4时28分(北京时间9时28分),土耳其发生7.8级地震。震中位于该国中南部的卡赫拉曼马拉什省,震源深度20千米。同一天,当地时间13时24分(北京时间18...
日期:02-07