您的位置:首页 > 互联网

OpenAI要向出版商付费,终究还是没有免费的午餐_openai 入门

发布时间:2024-01-10 15:42:58  来源:互联网     背景:

声明:本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,授权转载发布。

此前在去年年末,OpenAI CEO Sam Altman在社交平台公布了OpenAI的2024年“愿望清单”,下一代人工智能模型GPT-5赫然在列。此前有传言称,GPT-4的参数量达到了1.5万亿,模型规模是GPT-3的数倍,因此也可想而知,未来GPT-5的参数规模必然将会更上一层楼。而这也就意味着,OpenAI训练GPT-5所需的语料也将会达到史无前例的程度。

为此,OpenAI已经开始为GPT购买新的语料。去年12月中旬,OpenAI方面就曾宣布与新闻出版巨头施普林格出版集团(Axel Springer)达成一项史无前例的协议,OpenAI将付费使用施普林格旗下出版物的内容,以填充ChatGPT的答案、并将媒体的内容作为其训练数据。日前OpenAI的知识产权和内容主管Tom Rubin在接受媒体采访时也证实,OpenAI正在积极与传媒行业接触。

Tom Rubin表示,“我们正在与许多出版商进行许多谈判和讨论。他们很活跃,也非常积极,谈判进展得很顺利。你已经看到了我们公开的部分交易,未来还会有更多。”

然而,海外的出版商似乎对于OpenAI给出的价码不太满意。最近与OpenAI进行谈判的两名媒体公司高管就表示,OpenAI仅仅愿意向部分媒体公司提供每年100万至500万美元的授权费用。即使是对小型出版商来说,这也是一个很小的数字,所有有观点认为这可能会让OpenAI很难达成协议。

OpenAI最近开始积极投身于购买版权内容的原因其实很简单,因为已经版权方“盯上”了他们。就在去年12月27日,大名鼎鼎的《纽约时报》就指控OpenAI和微软未经授权使用其数以百万计的报道,以训练ChatGPT等人工智能聊天机器人。

《纽约时报》方面认为,“(OpenAI)试图搭《纽约时报》在新闻领域巨额投资的便车,在未经许可或未付款的情况下利用《纽约时报》的内容来制造替代产品”。

openai 入门

为什么在2023年年末,OpenAI使用未经许可的数据会被拿出说事呢?答案是GPT-4对于数据或者说语料的渴求,使得目前互联网上公开数据源的开源语料库已经无法满足。

比如,训练ChatGPT的45TB数据主要来源于Common Crawl、维基百科、美国专利文件数据库。其中,Common Crawl是一个抓取互联网、并提供数据开源下载的开源数据库,截止2023年4月其一共汇聚了31亿个网页、共有400TB的原始数据,而纽约时报》的域名就是最具代表性的专有来源之一,贡献了超过1600万条内容。

然而Common Crawl、维基百科、美国专利文件数据库不是政府机构、就是非盈利性组织,所以《纽约时报》没法使用版权这个武器,但OpenAI就不一样了,拥有ChatGPT Plus的它已经是一个盈利组织。而《纽约时报》的底气,则源自于OpenAI单单是训练ChatGPT,就已经几乎将互联网一切英语资源一网打尽,GPT-4的训练更是使用了超过13万亿tokens,甚至OpenAI方面自己都承认,训练GPT-4时使用了来自《纽约时报》的版权内容。

为了避免第二个、第三个《纽约时报》出现,OpenAI就只能选择付钱来购买内容。

那么问题就来了,每年100万至500万美元的授权费用,出版商为什么会觉得这笔钱很少呢?因为在出版商看来,向OpenAI授权相关数据几乎就等于“卖出绞死自己的最后一根绞索”。

2021下半年新机曝光这6款值得期待

如果说当年的搜索引擎与出版商是双赢的关系,毕竟前者需要内容源来满足用户的信息需求,出版商则需要搜索引擎将流量引导到自己的网站,并且搜索引擎只提供简介和链接,详情则要用户点开链接到内容提供方的源头去看。可现在的ChatGPT、Bing Chat却是直接在自己的页面中向用户提供内容,这无疑就是对于出版商的釜底抽薪。

换而言之,通过ChatGPT用户可以直接看到由AI整合的新闻,根本就不需要去《纽约时报》官网再去看相关的内容,长此以往,新闻出版机构存在的意义又在哪里呢?

并且由于AI大模型的发展趋势俨然已经势不可挡,正如当年新闻出版行业被迫与搜索引擎、社交网络媾和一样,因此以《纽约时报》为代表的新闻出版商选择以自己手中的版权作为武器,试图在蓬勃发展的AI行业中分到一杯羹。

而OpenAI大张旗鼓地向出版商购买版权,其实也是一个阳谋。现阶段,大模型赛道的现状是资本和技术双密集,算力成本极其昂贵,以至于有相当多的AI初创企业被迫接受拥有算力资源的英伟达的投资,以此来获得更便宜的算力。如果未来数据或者语料也成为大模型行业的成本,无疑就将会劝退一大批竞争者,这对于保持OpenAI竞争力的相对领先,显然是有很大意义的事情。

可是OpenAI训练GPT需要的内容实在太多,以至于即使不缺资金支持,也难以让每一家出版商都满意,这就是当下OpenAI面临的困局。当拥有数据的一方经过了2023年AI大模型领域爆发式的增长后,已经充分认识到了手中的数据是有价值的,已经处于衰退的出版商就必然指望从这些AI企业手获得更多的收益。

因此从某种意义上来说,在OpenAI造出GPT-5、并产生一个能自我生产内容的AI之前,被新闻出版商围猎几乎是必然。


返回网站首页

本文评论
新冠vreo细胞疫苗_新冠疫情下AR眼镜&Teams远程协作方案
  智能AR眼镜,全语音控制、解放双手,配备降噪耳机,与微软的Teams适配应用,可以帮助一线工人在嘈杂危险的环境下安全高效的工作。   发起Teams呼叫   专家或一线工人可以...
日期:10-12
OpenAI首次开发者大会:学习苹果,瞄准每个人类_pingcap开发者大会
美国时间11月6日上午十点,ChatGPT的开发商OpenAI丢出来一颗重磅炸弹,举办了他们的首次开发者大会,发布了一系列的新产品自不必说,更重要的是,OpenAI正式开始构建类似苹果应用商城...
日期:11-09
华为44531模型「4.0将于8月4日发布 或搭载AI大模型技术 华为HarmonyOS」
华为宣布HarmonyOS4.0将于8月4日正式发布。此前,华为已经针对开发者公布了HarmonyOS4.0,以便于开发者提前进行适配,也因此被曝光出了一些新系统的特性。HarmonyOS4.0的流畅性将...
日期:09-19
“唤醒沉睡愚者”登陆多个地标,《诡秘之主》小说完本一周年玩大的
  5月1日,一组主题为“唤醒沉睡愚者”与郑云龙献唱《诡秘之主》同名纪念曲的画面,一同登陆北京王府井大街、西单老佛爷百货、三里屯SOHO、地铁国贸站四处地标,吸引了无数行...
日期:04-11
年货节投影仪怎么选?坚果J10对比当贝F3到底哪款好?(坚果j10和当贝f3评测)
  年货节是春节前最后一次大促,很多朋友都想在这段时间里挑选自己心仪的物品,既作为回家礼物,也可以早早为就地过年做准备。如果今年依旧需要长时间的待在家里,那么一款...
日期:07-10
腾讯短视频创作联盟大师班开课了,《奇遇人生》导演赵琦讲授爆款方法论
  去年,企鹅号在腾讯合作伙伴大会上发布“一拍即合”创作者社群计划,并宣布成立腾讯短视频创作联盟。经过两个月的路演、筛选,100位优秀创作者入驻联盟,成为首席100位成员。2...
日期:06-28
1.0.0.7 BIOS主板固件更新 解决锐龙7000处理器烧毁问题 AMD将推出AGESA
5 月 1 日消息,作为对 Ryzen 7000X3D CPU 烧毁事件的回应,AMD 发布了 AGESA 1.0.0.7 固件,以抢救这些 CPU。目前,华硕等品牌已经发布了适用于 AM5 主板的 BETA BIOS 更新,避免 AM...
日期:09-30
中国信通院宣布成立大模型生态合作共同体「中国信通院 刘默」
7月7日 消息:据新浪科技报道,中国信通院宣布在2023世界人工智能大会期间成立大模型生态合作共同体。该共同体将聚焦于十大维度,包括数据要素、算力服务、基础理论、通用大模型...
日期:07-07
花西子boss是谁「花西子连发数条评论 媒体点评:“发疯式”公关救不了花西子」
9月26日消息,花西子官方微博发文称:我,花西子,6岁半,我有一个梦想,做一个立足本土,走向世界的高端品牌”,并配图好心态,决定花西子一生”!微博发布后,花西子官方号亲自在该条微博评论区...
日期:09-27
马斯克正式通知弃购推特!推特回应「马斯克推特回复」
  讯 北京时间8月30日晚间消息,据报道,Twitter今日回应特斯拉CEO埃隆·马斯克(Elon Musk)发出的“终止函”,称该“终止函”是无效和错误的。摩托罗拉新机曝光proscenic扫地机器...
日期:08-31
突发!苹果iPhone14发布会画面流出 紫色iPhone 14 Pro现场曝光_苹果12紫色发布会视频
近日,海外爆料人抛出了一张苹果iPhone 14发布会录制现场画面,从此前官方发布的预告海报中已经提及今年iPhone 14发布会的地点为苹果总部的乔布斯剧场。而这张iPhone 14发布会...
日期:09-26
rog游戏手机好吗「游戏手机标杆之作!没想到 ROG7这么火爆」
7月28日,ChinaJoy 2023大展在上海新国际博览中心正式开幕,新产品新技术令人眼花缭乱,现场人山人海、观众如织。在这个移动时代,手游成为一种大众化的娱乐方式,尤其是专门设计的游...
日期:07-29
全家吃菌仅女子一人中毒 专家:不食用不认识的菌类_全家吃毒蘑菇中毒花一百万
8月8日消息,随着连绵雨季的到来,又到了一年当中食用野生菌的时节,但是吃菌要注意,部分品种颇具毒性。近日,云南昆明一位女子吃野生菌中毒,家人带起其前往医院治疗。躺在病床上的女...
日期:08-09
机构称全球半导体营收已连续5个季度下滑 英伟达年初开始表现上佳
7月3日消息,据外媒报道,研究机构的报告显示,由于需求不理想,全球半导体行业的营收,已连续5个季度环比下滑,创下自2002年以来的最长下滑记录。丰田新能源电池供应商原神游戏收益从...
日期:07-04
电视剧《庆余年》第二季今日开机!除肖战外 基本原班人马回归_《庆余年》第二季官宣
2019年,《庆余年》凭借神秘离奇的剧情、幽默搞笑的剧风成为一大爆款剧,播出之后好评无数,被誉为2019年观众最喜欢的电视剧。今日,备受观众期待的《庆余年2》终于迎来好消息,庆余...
日期:05-10
华为mate60最新官方消息「黄牛砸手里了!华为Mate 60 Pro已现货:今日18:08开启全款抢购」
快科技9月3日消息,华为官方宣布,今日18:08,华为Mate 60 Pro在华为商城开启全款抢购。目前,华为官方商城用户评论已超过1万条 ,好评率99%,可见华为备货相当充足。与此同时,京东手机...
日期:09-03
特斯拉进入中国商标争议「特斯拉异议“特舒拉”商标成功 此前曾告“特斯拉啤酒”侵权」
因为商标近似”或者擦边”,商标主体间出现不少商标纷争”事件,特斯拉也不例外。近日,天眼查APP显示,第53436164号特舒拉”商标不予注册的商标文书公开。文书显示,特斯拉(上海)有限...
日期:10-28
上海惠普打印机维修_上海惠普打印机维修中心电话地址查询
是指在上海地区对惠普品牌打印机进行维护、维修和保养的服务。惠普公司是全球知名的计算机、打印机、数码相机生产商之一,其产品在市场上广受欢迎。在使用惠普打印机时,有时难...
日期:05-29
比HuggingFace快24倍!伯克利神级LLM推理系统开源,碾压SOTA,让GPU砍半「伯克利l&s」
声明:本文来自于微信公众号 新智元(ID:AI_era),编辑:桃子 好困,授权转载发布。【新智元导读】打「排位赛」的大模型们背后秘密武器曝光!UC伯克利重磅开源神级LLM推理系统——vLL...
日期:06-21
make appropriate changes「Make Startups推出基于AI软件CoFounderOS 提供创业建议、市场分析等」
划重点:iphonese4会是全面屏吗- Make Startups非营利性组织开发了一款数字平台,旨在帮助新创业者在正确的道路上起步并保持稳定发展。sony zv-e10和佳能m50二代- 这个名为CoF...
日期:11-06