您的位置:首页 > 互联网

Reddit要收取API访问费,盯着AI厂商来薅羊毛「reddit网站怎么进入」

发布时间:2023-05-02 10:37:04  来源:互联网     背景:

进入2023年后,或许已经鲜少有网友还没听过ChatGPT这个大名。这一继元宇宙之后出现的“新浪潮”,俨然已经成为了今年科技圈的风口,包括海外市场的微软、谷歌、亚马逊,以及国内的百度、阿里、腾讯、字节跳动在内,几乎但凡有一定技术实力的科技厂商也悉数下场,即便是技术力不够的厂商也是八仙过海各显神通,有诸如知乎这样联手合作伙伴的,也有像“美国贴吧”Reddit这样“卖资源”的。

日前Reddit方面宣布,将开始对使用其应用程序编程接口(API)的企业收费,该接口则提供了下载和处理人与人之间对话的相关数据。事实上,Reddit的API自2008年以来就一直是以免费的方式开放给第三方,对于突然转向收费,Reddit方面的解释,是此举为了限制其API被用于训练人工智能工具,其中包括OpenAI的ChatGPT、谷歌的Bard,以及微软的Bing AI等。

尽管Reddit暂时还没有公布其API的具体收费标准,但官方已经透露,将为“需要额外功能、更高使用限制和更广泛使用权的第三方,引入一个新的高级接入点”。而为了避免被外界指责“吃相难看”,Reddit方面还表示将会对一些访问API的用户免费,而这类用户则主要包括科研机构的研究人员,或是从事非商业目的的研究员。

苹果发布会最新消息

Reddit为何敢于去收这笔钱呢?其实成立于2005年的Reddit,已经是全球互联网中历史最悠久、同时也最有活力的社区之一。截止2021年10月,也就是Reddit官方最后一次披露的用户数据表明,其拥有5300万DAU和超过4.3亿MAU。而来自Statista的数据显示,Reddit是全美访问量第六大的社交媒体,月活水平与Instagram、Twitter几乎持平。

如此海量的用户也造就了Reddit的活跃社区总数超过了14万个,帖子总量超过3.66亿,评论总数为23亿,这也代表着沉淀在Reddit的内容已然成为了一个极为惊人的语料库。而在AI领域,语料(Corpus)通常是一定数量和规模的文本资源集合,作为一个以论坛为形式展开业务的平台,Reddit显然是当下英语互联网中最潮流、最日新月异的语料库。例如OpenAI开发的ChatGPT以及最新的GPT-4,就有很多训练数据被证实是来源于Reddit。

reddit网站怎么进入

iphone12为什么加价

就像数据之于算法一样,语料则是ChatGPT这类生成式AI更加智慧的基础所在。生成式AI的原理,大概可以总结为通过大量的语料库进行训练,以建立相应的模型,从而使得AI能够对人类的问题作出相应的回答和决策,其核心逻辑就是“猜谜游戏”。经过大量的训练后,AI预测出问题的答案,并不等于拥有智慧,而只是在玩文字游戏,进行一次又一次的概率解谜,本质上与人类玩数独或填字游戏是一样的。

那么ChatGPT为什么会表现得比以往的人工智能产品、比如Siri更聪明呢?其实单纯是因为语料规模更大。例如GPT-3就拥有的1750亿的参数量、45TB的训练数据,以及高达1200万美元的训练费用,这也是OpenAI打造ChatGPT的基础。而ChatGPT聪明的关键就在于涌现能力(Emergent ability)上,指的是在不进行参数更新的情况下,只在输入中加入几个示例,就能让模型进行学习。

红魔5g有线投屏

涌现能力从何而来呢,根据Google&Deepmind联合发布的相关论文显示,模型在没有达到一定规模前,得到的表现较为随机,但在突破规模的临界点后,表现则会大幅度提升。

例如在BIG-Bench上,GPT-3和LaMDA在未达到临界点时,模型的表现都是接近于零。而在GPT-3的规模突破2·10^22training FLOPs (13B参数),LaMDA的规模突破10^23training FLOPs (68B参数)后,表现就开始快速上升。

Pixel Watch

reddit怎么访问

“力大砖飞”就是当下大语言模型的底层逻辑,在这种情况下,语料基本决定了大语言模型的上限。语料虽然是越多越好,但问题是已经没有更多高质量的数据供模型进行训练了。

AI研究团队Epoch在今年年初发表的论文表明,AI不出5年就会把人类所有的高质量语料用光。而且这一结果,则是Epoch将人类语言数据增长率,即全体人类未来5年内出版的书籍、撰稿的论文、编写的代码,都考虑在内预测出的结果。

Epoch团队将语料分为了高质量和低质量两种,其中高质量的语料指的是包括维基百科、新闻网站、GitHub上的代码、出版书籍等,低质量语料则来源于Twitter、Facebook,以及Reddit上的内容。

reddit rss

正常情况下,AI厂商自然更愿意使用高质量的语料,毕竟这能够在最大限度上避免被偏见和歧视性言论“污染”。但问题是,据统计,高质量语料数据的存量只剩下约4.6×10^12~1.7×10^13个单词,相比当前最大的文本数据集大了不到一个数量级。

所以当高质量语料不够用的情况下,低质量语料即便再不好用也得用,不然大语言模型要如何成长。而对于低质量语料,充其量也只是在数据标注和清洗上投入更多成本,所以OpenAI、谷歌、亚马逊等公司相当于就没得选。所以Reddit如今就正是挟语料自重,料定了AI厂商只能硬着头皮买。


返回网站首页

本文评论
炬芯科技周正宇博士获评2022中国IC产业杰出人物!_网易科技(周正宇 炬芯)
(原标题:炬芯科技周正宇博士获评2022中国IC产业杰出人物!) 22年8月17日,"2022 中国 IC 领袖峰会" 在南京顺利召开,炬芯科技股份有...
日期:08-20
东芝X7500_东芝高端旗舰OLED再扩军,X7500系列全新上市
  1月21日,东芝2021年首款OLED高端旗舰“大作”X7500震撼上市。   据介绍,该款65寸的OLED电视,标榜“至美生活,本物原彩OLED”的定位。以东芝独具匠心的工艺、精雕细琢的...
日期:07-10
不满足于人机对话!微软被曝使用ChatGPT训练机器人为人类日常生活服务
2月24日消息,微软与人工智能聊天工具ChatGPT背后开发商OpenAI的合作已经在科技行业掀起追求人工智能的热潮。据外媒报道,微软一个研究团队正在进一步推动人工智能技术,尝试让Ch...
日期:02-25
Q1中国游戏出海收入排行:PUBG Mobile、万国觉醒、荒野行动前三(10月出海手游榜:《荒野行动》收入榜持续领跑)
  5月9日消息 今日,App Annie发布了2020年一季度中国游戏出海收入前十强。收入统计商店包含 iOS 与 Google Play,统计市场为全球除中国大陆以外市场。   榜单前十位分别...
日期:07-14
抢夺央视春晚,快手、抖音、视频号的“三国杀”
2月1日消息,央视春晚已经落下帷幕,仔细观察不难发现,2022年的春节,抖音、快手、微信视频号三家围绕央视春晚进行了一场与直播有关的较量。 除夕夜当晚,有用户发现,微信好友所发布...
日期:08-19
酷6裁员背后:国内视频网站分化进行时
5月18日,中国视频行业可用冰火两重天来形容。凤凰新媒体在上市不到一周内对外宣布,启动凤凰视频“凤鸣计划”即“视频媒体”路线,打造中国最大的视频资讯观看、聚合、分发平台...
日期:07-28
iqoo neo7上市时间「iQOO Neo7新版曝光:处理器换为骁龙8+」
今日消息,博主数码闲聊站暗示,iQOO Neo7系列有骁龙版,搭载高通骁龙8+芯片,同时配备了16GB内存、512GB存储。rtx3070在2k分辨率能60帧吗目前在售的iQOO Neo7搭载的是联发科天玑90...
日期:11-17
iQOO Neo 855版“冰岛极光”配色真机照公布(iqoo neo 855颜色)
  10月24日消息 昨日iQOO官方公布了iQOO Neo 855版“冰岛极光”配色的真机照,采用了上方蓝色、下方淡紫色的渐变设计。   前几日iQOO Neo 855版已经入网工信部,这款手机...
日期:01-14
GPD WIN 3 游戏掌机开启预售:i5-1135G7+16GB 内存,4799 元_gpdwin3开箱
  2 月 26 日消息 根据 GPD 掌机官方的消息,全球首款玩主流 3A 游戏大作的滑盖直板掌机 GPD WIN 3 开启预售。   2020 年 12 月 GPD 宣布了全球首款 Windows 10 直板掌...
日期:07-16
红杉中国创始人沈南鹏以每股186.52港元的均价出售美团210万股(红杉资本沈南鹏持股)
为什么余额宝收益越来越多apple music都有版权吗 查看最新行情   据港交所7月27日披露文件,7月25日,红杉中国创始人沈南鹏以每股186.52港元的均价出售美...
日期:07-31
阿凡达3拍完了吗「阿凡达2回本!卡梅隆确认拍续集:剧透《阿凡达3/4/5》剧情/进度」
《阿凡达2》成为了2022年全球票房冠军,而卡梅隆也已经确认,这部影片开始盈利了。《阿凡达2》目前全球票房已破15亿美元,前几天也超过了媒体曝出的回本线14亿。卡梅隆近日在《Wh...
日期:01-07
软硬件结合提供最优游戏体验 黑鲨4将与更多游戏厂商深度合作(黑鲨4系列软件系统)
  最近的手机市场可谓热闹非凡,伴随着高通新一代旗舰处理器骁龙888的问世,众多新机蓄势待发引起了不少用户的关注与讨论。强悍的性能一直都是游戏手机的标配,黑鲨作为游...
日期:09-10
公众号发布篇数「微信公众号的2022:每1万篇推送产出9篇10w+,1年累计发文超3.98亿篇」
声明:本文来自于微信公众号 新榜(ID:newrankcn),作者:云飞扬,授权转载发布。2022年,微信公众号走到了第10个年头。在抖音、快手、B站、小红书、今日头条等后进者的挑战下,微信公众...
日期:01-16
长沙举报网上逃犯有奖  发现线索可微博报警(长沙网上举报犯罪)
为推动“清网行动”深入开展,长沙市公安局今日出台《关于公民举报网上在逃人员线索的奖励办法》(简称《奖励办法》),鼓励公民举报网上逃犯。长沙警方表示,“清网行动”期间(即...
日期:07-22
“5.11电脑健康日”启动  360称电脑可平均提速25%
  由中国互联网协会、国家互联网应急中心反病毒联盟、360安全中心、海尔、华硕、拉手网、美团网以及国内十多家知名媒体在全国范围内共同发起的“5.11电脑健康日”活动今...
日期:07-27
特斯拉1月国内销量26843辆 出口39208辆_特斯拉在中国市场的销售数据
2月8日消息,乘联会数据显示,2023年1月特斯拉中国销量66,051辆,环比增长18%。其中,国内销量26,843辆,出口39,208辆。具体到车型,1月Model Y销量40,903辆,Model 3销量25,148辆。360董...
日期:02-09
这个高效神器,让你的PPT字体更好看_ppt自带好看的字体
  相信不少小伙伴们都知道,字体对于PPT制作、宣传海报设计而言,重要性不言而喻,字体若是使用得当,便能给你的作品“锦上添花”。   近期影院热映的《哪吒之魔童降世》便是...
日期:08-09
金山办公年会_赋能共赢:2019金山办公开发者大会释放创新动能
  2019年12月19日,以“开放赋能•生态共赢”为主题的2019金山办公开发者大会在武汉光谷隆重召开。本次开发者大会将持续两天,围绕技术开放与集成主题展开深入讨论。   ...
日期:10-12
5g两大运营商_三大运营商确定9月1日5G商用
  据运营商财经网报道,知情人士透露,三大运营商即将于9月1日对5G商用。   报道称,中国移动、中国电信相关人士表示,没有对用户购买5G手机进行补贴的计划。而在近日的中国...
日期:02-02
微软推出IOS/安卓版必应APP 支持语音功能_微软必应下载官网
2月23日消息,美国当地时间周三,微软宣布为iPhone和Android发布新的必应和Edge预览版应用程序,其中包括语音搜索和访问其AI聊天机器人等新功能。小米13 ultra快充90w在必应移动...
日期:02-25