您的位置:首页 > 互联网

AI,正在疯狂污染中文互联网

发布时间:2023-06-19 13:00:07  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:金磊 尚恩,授权转载发布。

AI也反噬了自己

污染中文互联网,AI成了“罪魁祸首”之一。

事情是这样的。

最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题:

象鼻山是否有缆车?

Bing也是有问必答,给出了看似挺靠谱的答案:

在给出肯定的答复之后,Bing还贴心地附带上了票价、营业时间等细节信息。

不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。

此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。

于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!

因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。

甚至能在1分钟之内回答2个问题。

在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……

并且他认为,这就是导致Bing输出错误答案的原因:

这个AI疯狂地污染中文互联网。

“AI污染源”,不止这一个

那么被网友发现的这位AI用户,现在怎么样了?

从目前结果来看,他已经被被知乎“判处”为禁言状态。

但尽管如此,也有其他网友直言不讳地表示:

不止一个。

若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。

例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:

不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签。

然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。

腾讯会被取代吗

事实上,诸如此类的“AI污染源”不止是在这一个平台上有。

就连简单的科普配图这事上,AI也是屡屡犯错。

网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。

甚至各类AI生成的假新闻也是屡见不鲜。

例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。

但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。

无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死亡》假新闻。

具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。

警方均已对他们采取了刑事强制措施。

但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。

程序员问答社区Stack Overflow便是一个例子。

早在去年年底ChatGPT刚火起来的时候,Stack Overflow便突然宣布“临时禁用”。

当时官方给出来的理由是这样的:

(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。

因为从ChatGPT得到错误答案的概率太高了!

Stack Overflow进一步阐述了这种现象。

他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。

但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。

加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此Stack Overflow才选择了禁用。

一言蔽之,AI污染了社区环境。

而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题:

许多用户在这种栏目之下会提出各式各样的问题,ChatGPT bot也是有问必答。

不过,还是老问题,答案的准确性如何,就不得而知了。

但这种现象背后,其实还隐藏着更大的隐患。

滥用AI,也毁了AI

AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。

结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。

很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……

而如此滥用AI,反过来也是一种自噬。

最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion:Training on Generated Data Makes Models Forget》的论文。

探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。

这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。

论文作者,剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言:

正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。

对于虚假信息满天飞的情况,Google Brain的高级研究科学家达芙妮 · 伊波利托(Daphne Ippolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。

假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。

基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。

就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。

那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。

如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?

大众车召回公告

假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。

话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。

一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。

参考链接:

[1]https://www.v2ex.com/t/948487

[2]https://twitter.com/oran_ge/status/1669160826186633219

[3]https://www.qbitai.com/2022/12/40167.html

[4]https://arxiv.org/abs/2305.17493v2

[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250[6]https://futurism.com/ai-generates-fake-news


返回网站首页

本文评论
微软 Edge 比其他浏览器具有更多侵犯隐私的遥测_微软浏览器为什么叫edge
  来自爱尔兰都柏林三一学院的计算机科学与统计学院的Douglas J Leith 团队近期进行了一项研究,分别对六个Web浏览器进行测试,以确定它们phone home的频率和它们共享的数据...
日期:11-07
据监测:2010年逾800万部智能手机染毒_智能手机毒害人类
中国国家互联网应急中心日前在大连发布报告称,2010年新截获手机恶意代码1600余个,累计超过800万部智能终端受到感染。  据监测,“毒媒”木马全年累计感染200万多个用户手机,...
日期:07-22
谷歌拟做强摩托:Android阵营忠诚度受考验
距离苹果、微软和RIM(黑莓)联合团队以45亿美元拿下北电网络6000项专利的时间仅仅一个半月,谷歌就闪电般以125亿美元的价格收购了摩托罗拉移动公司。   海外媒体报道,谷歌CE...
日期:07-22
高通芯片5g_5G手机只是开始,高通实验室正探索未来应用
  花5分钟时间参观一下高通在圣地亚哥的核心工作室(现在更像是实验室),你会发现这里的一切都超越你对工作室的想象。空旷浩大的房间,过去被用于存储办公家具和箱子,而如今已...
日期:01-02
曙光亮相“中国金融第一展”,赋能金融科技创新发展(金融创新时代)
  11月4日,经国家商务部批准,由中国金融电子化公司主办的第二十七届中国国际金融展在深圳会展中心盛大开幕。中国人民银行副行长范一飞、中国证券监督管理委员会信息中心主...
日期:08-08
商汤通用模型组「商汤科技推出大模型体系“日日新”:支持语言、3D模型生成」
快科技4月10日消息,在商汤技术交流日活动上,商汤科技董事长兼首席执行官徐立宣布推出大模型体系商汤日日新大模型”。据了解,日日新”取自《礼记大学》,汤之盘铭:苟日新,日日新,又...
日期:04-10
《原神》揽金260亿后,米哈游如何布局下个时代?_米哈游原神投资多少
声明:本文来自于微信公众号 全天候科技(ID:iawtmt),作者:胡描,授权转载发布。华为mate 50曝光9月28日,开放世界二次元手游《原神》迎来了两周年纪念日。据Sensor Tower商店情报数...
日期:10-02
小红书涨粉4.7万,专业号你要这么玩(6000字一文讲透)「小红书6万粉丝」
声明:本文来自于微信公众号 庄俊(ID:zhuangjunweixin),作者:庄俊,授权转载发布。Beijing X7│前言│专业号涨粉慢一直都是很多小红书运营头疼的问题,而对于公众号账号其实要比其...
日期:10-01
彻底没了!消息称苹果iPhone将抛弃Touch ID功能_iphone6没有touch id
苹果在2017年的iPhone X上使用了Face ID,从而取代了Touch ID功能,但是外界一直有Touch ID回归的传言,但是知道今年的iPhone 14系列,仍然没有见到Touch ID的身影。据知名苹果爆料...
日期:10-05
百度小程序比赛_百度智能小程序创业经营大赛开赛,这些规则要了解
  2021年8月15日,由百度智能小程序主办,百度大脑、百度营销·观星盘、百度智能云、百度云智学院联合主办的“智行 · 创想”创业经营大赛正式启动(报名官网:https://smartpr...
日期:06-10
百度地图:全国范围复工指数已达57.42% ,复工复产按下“加速键”
  随着新冠肺炎疫情得到有效控制,全国多地复工复产按下“加速键”。本周,百度地图大数据持续跟进复工指数,聚焦全国37座重点城市的复工情况。据最新发布数据显示,截至2020年3...
日期:08-11
酷派8013刷机_酷派8737刷机
酷派8013是一款性价比较高的智能手机,但是随着时间的推移,其性能可能会变得越来越慢,用户需要采取一些措施来提高手机的性能。其中一种方法是通过刷机来升级手机系统或更改系统...
日期:05-29
一年一度喜剧大赛 京东「《一年一度喜剧大赛2》幕后:我是如何制造快乐的?」
声明:本文来自微信公众号“刺猬公社”(ID:ciweigongshe),作者:怡晴,,授权转载发布。比起一档好笑的综艺节目,对选手们来说,《一年一度喜剧大赛》(以下简称《喜剧大赛》)更像是一个舞台...
日期:11-01
罕见!三年暴增1800亿!风投大举买进!这个地区电商数钱数到手麻!
声明:本文来自于微信公众号 亿邦动力(ID:iebrun),作者:何洋,授权转载发布。“2022年,几乎整个(中国)创投圈的人都去了新加坡。”一位关注出海市场的资本界人士感叹。这里是通往整个...
日期:02-08
免费的ChatGPT意外断网 国内伪装自主的AI露馅了
ChatGPT是当前最火的AI应用,没有之一,只不过国内使用有一定的门槛,所以最近涌现出很多号称自主研发的国产AI,然而今天下午ChatGPT意外掉线,很多国内的AI应用就露馅了。为什么我买...
日期:03-01
Adobe Flash 11能否战胜HTML5?_adobe flash player or HTML5
  Adobe Systems今天宣布旗下Flash Player 11将定位于竞争日趋激烈的移动多媒体平台。Flash Player 11与 AIR 3正式版将于下月早些时候正式上市,新版本主要侧重3D游戏性能...
日期:07-23
特斯拉上海工厂9月交付量超过8.3万辆「特斯拉上海工厂一季度产量」
10月9日消息,据央视财经消息,9月特斯拉上海超级工厂交付量超过8.3万辆,再次创下月度交付的新纪录。乘联会数据显示,9月份国内新能源车销售依旧保持强劲态势。9月份,新能源乘用车...
日期:10-12
以太坊挖矿厂「官宣!以太坊“合并”9月6日启动,完成后将告别工作量证明挖矿」
  记者/王蕙蓉windows10地图  世界第二大加密货币以太币(ETH)背后的区块链网络以太坊,将在9月6日开始正式“合并”。  当地时间8月24日,以太坊基金会发布博客称:“经过多...
日期:09-06
外交部回应苹果下架香港暴徒帮手App
  10月10日消息 据央视新闻消息,中国外交部发言人耿爽今天表示,近来发生在香港的极端暴力犯罪行为,理应予以反对和抵制,而不是支持和纵容。我们欢迎外国企业到华来投资,当然前...
日期:09-20
无忧出发,千库网唤醒年轻用户群的“方法论”
  近年来,随着社交媒体和电子商务等行业的飞速发展,使得企业和个人对设计的需求剧增。伴随而来的是设计技能难以快速掌握、版权内容应用有待完善等问题。同样,社交媒体和信...
日期:04-26