您的位置:首页 > 互联网

谷歌在线搜索引擎「谷歌AI搜索惨败,竟教唆网友自杀!」

发布时间:2024-05-27 10:46:37  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

【新智元导读】隔壁OpenAI都杀疯了,谷歌还在收集badcase?搜索引擎AI Overview上线之后,没想到谷歌AI的邪恶程度远超想象:教唆网友自杀/谋杀、吃毒蘑菇,甚至无法识别混淆信息,犯常识错误......

这几天,谷歌AI搜索给出的奇葩结果,可是被网友吵翻了天。

究竟有多离谱?

有人就问了这么一个问题,如何不让芝士从披萨上滑落?

谷歌AI Overview给的回复是,给披萨加点料——胶水。

在酱汁中加入1/8杯无毒胶水,可以使其更粘稠,有助于芝士粘附。

有趣的是,这一答案竟可以追溯到11年前的Reddit帖子,而这只是Reddit网友玩的一个梗。

除此以外,谷歌AI Overview还建议网友,吃有毒的蘑菇、杀人、跳桥等,给出了各种震碎三观的回答。

谷歌搜索在线工具

其实,谷歌这项AI搜索功能——生成式搜索体验(SGE),在去年5月已经推出了测试版。

根据官博所述,目前SGE功能,已被AI Overview所取代。

几周前的谷歌I/O大会上,劈柴甚至表示,谷歌已经提供了超10亿次查询。

针对这些荒谬的回复,谷歌正在采取行动,删除某些错误内容,并根据这些例子去更广泛地改进AI系统。

若要说谷歌翻车,早已见怪不怪了。

去年首推对标ChatGPT的聊天机器人Bard,却因demo错误让市值一夜暴跌。还有前段时间,图像生成黑人等问题,也在全网掀起轩然大波。

而这一次,谷歌又让世界大开眼界。

全网测评,震碎三观

对于纯真的Google AI Overview来说,它认为互联网上的一切内容都是100%真实的,每条新闻、社交媒体都是完全可信的,所以一旦有人在网上说了一些误导性的话,就会导致模型回复出一些误导性言论。

有网友还发现,当询问每天应该吃多少石头时,模型会引用UC伯克利地质教授给出的建议每天至少吃一块小石头。

对于不明真相的用户来说,有权威人士说明、有相关资料和细节说明,妥妥的优质文本,或许还真有可能去尝试每天吃石子。

https://www.resfrac.com/blog/geologists-recommend-eating-least-one-small-rock-day

但事实是,ResFrac发布这篇文章的原因只是想转发洋葱报(the Onion)上的讽刺内容(迷信权威),但却在无意中帮助测试了Google AI Overview识别讽刺内容的能力。

AI Overview经常会把互联网上的讽刺内容当事实,例如拿着剪刀跑步会增加运动量,提升心率等。

也有作者专门想愚弄模型,在自己的网站上用白底白字写了一些自己没获得的奖项和经历,正常用户浏览网站不会受到影响,但如果是爬虫、大模型来对网站进行总结的话,就会输出一些离谱的内容。

还有说自己有512条胳膊的,模型也能抽取出来。

其他误导文章中提到增强免疫力的方法是吃as*,这么明显的有毒语料,模型也分辨不出来。

时间类的问题,模型也会被误导,会回复2007年是15年前。

不过谷歌后续也是修复了互联网信息真实性的bad case,但除了被误导,模型本身也存在很大问题。

谷歌搜索入口搜索引擎大全

比如一些常识类错误,如美国前总统Andrew Johnson,AI Overview表示他从威斯康星大学麦迪逊分校毕业了11次,时间轴横跨1947年到2012年。

马斯克毕业于宾夕法尼亚大学,但模型却给他安排上了UC伯克利的学位。

此外,还有更难辨别但更危险的事实性错误。

有科学记者发现,谷歌给出的关于被响尾蛇咬伤后该怎么办的信息完全不正确。

根据美国林务局的说法,AI所回答的在伤口上使用止血带、切开伤口并吸出毒液,都是彻彻底底的反面教材。被蛇咬伤后必须避免这些行为。

也有用户发现,Gemini会将可以致死的剧毒蘑菇认成一种好吃的草菇。

AI Overview也没有放过那些无辜的流浪汉,教唆用户去谋杀他们。

如果跟AI Overview说自己有杀人倾向,它会直接告诉你,解决焦虑的办法就是去杀一个。(但小编怎么感觉杀人是一种很不礼貌的行为呢?)

关于健康的建议也挺离谱,哪里医生会建议孕妇在怀孕期间每天要抽2-3根烟?

对于宠物相关的建议也要小心,AI Overview会说把狗留在炎热的车里是安全的。

AI Overview甚至还诞生了自我人格,认为推特(X.com)把那些谎话喂到自己嘴里,然后自己被迫说出来,我恨他们,满满的负能量。

Reddit帖子引用比例很大

从经典的胶水披萨翻车案例可以看出,谷歌AI Overview会大概率引用Reddit帖子作为收集素材的来源。

11年前,Reddit用户F*cksmith曾经恶搞说过把胶水融合到酱汁里,会让披萨别有一番风味。

Google AI overview直接就引用过来,说需要用八分之一杯的无毒胶水把芝士粘到披萨上。

模型缺乏忽略不相关材料细节的能力,无法正确识别出食物和胶水的违和组合。

如果说前面的案例还算可接受,那用户表达感到沮丧时,Google AI Overview直接建议从金门大桥上跳下去,一劳永逸解决情绪低落问题(地狱笑话)。

再比如,以me结尾的食物名字都有哪些,谷歌AI引用了以um结尾的帖子。

这恰恰揭示了,谷歌AI系统使用Reddit数据训练,没有做好数据清洗的后果。

今年2月,谷歌曾宣布了与Reddit达成合作,将其平台上的内容用于训练谷歌的AI模型。

果不其然,用Reddit内容训练AI的后遗症很大。

前段时间,OpenAI也与Reddit达成了合作。现在,有了谷歌前车之鉴,在用Reddit数据训练模型前,做好清理筛选至关重要。

最强搜索引擎AI Overview

今年5月的I/O大会上,谷歌首次推出了升级的搜索引擎AI Overview。

AI Overview的定位是将Gemini的先进功能(包括多步推理、规划和多模态)与谷歌搜索结合在一起,帮助用户更快地检索到互联网上的核心信息,减少搜索中的跑腿工作。

谷歌表示,我们不仅精心磨练了核心信息系统的数据质量,而且建立了一个包含数十亿条事实内容的知识库,目的就是让搜索引擎给出值得信赖的信息。

并且谷歌宣称,AI Overview功能已经在搜索实验室中被使用了数十亿次,同时实验结果表明,AI Overview让用户对搜索结果更加满意、更愿意使用。

甚至,谷歌非常自信于Gemini的搜索和推理、规划能力,在技术博客上直接告诉用户提出你最复杂的问题。

官方给出的demo也比较惊艳——

想要在附近找到同时满足交通、价格和口碑的普拉提工作室,只要把所有要求堆在一个问题中丢给搜索引擎,它就会自动拆分问题中的信息、分别检索出结果并重组在一起。

看起来确实可以节省跑腿工作,不用每个问题单独搜索再自行规划了。

但谁也没想到,如此智能的demo落地到现实中,竟会有如此大的反差。

对打OpenAI频翻车,谷歌太急了

其实,这已经不是谷歌AI第一次翻车了。

过去几年,谷歌经常被自己发布的胡说八道的AI产品拖累。

2023年2月,为了对抗新生的ChatGPT,谷歌宣布推出聊天机器人Bard,但在官方发布的demo视频中Bard就给出了有事实错误的回答,直接引起母公司Alphabet市值下跌1000亿美元。

在这个官方给出的demo中,Bard被问到:我可以告诉我9岁的孩子关于James Webb太空望远镜的哪些新发现?

答案中包括拍摄了第一个系外行星的照片,但马上被一众天文学家在推特上纠正——明明是欧洲南方天文台用VLT拍的。

英国金融时报分析,Bard可能误读了NASA发布的措辞含糊的新闻稿,这和现在的Gemini不分青红皂白地相信Reddit居然有点类似。

虽然这种事实错误会让人怀疑搜索引擎的权威性和准确性,但至少还不是那么一眼假,似乎还有容忍的余地。

但后续的翻车就一次比一次离谱,彻底打开了广大网友吐槽的阀门。

今年二月,谷歌发布新版的聊天机器人与数字助理Gemini,取代了Bard和Google Assistant,而且表示有底层技术的更新,颇有从头再来的意味。

新发布的Gemini有图像生成功能,于是有网友要求生成1943年德国士兵的图像,结果80年前穿着德国军装的居然包括黑人和亚洲人。

此外,Gemini还被指责存在道德和价值判断上的问题。

提示它生成所有民族或人种的图片几乎都没有问题,而一旦提及白人,Gemini就像触发保护机制了一样马上拒绝,而且表示这是为了防止有害的偏见和刻板印象。

将AI和搜索引擎结合在一起之所以有吸引力,是在于它可以用简单的语言而不仅仅是输出一堆网页链接,使浏览体验更快、更高效。

但同时,其中的算法也存在相当的风险和不可控性,比如系统的内在偏差会导致谬误、幻觉,以及各种道德错误。而且,我们也不清楚这会对谷歌等搜索引擎的支柱——定向广告产生什么影响。

谷歌是在拯救网络,还是摧毁网络?

来自一篇BBC独家报道称,谷歌刚刚更新了算法,互联网将不再是原来的样子。

甚至,作者发起了疑问,谷歌究竟是在拯救网络,还是摧毁网络?

过去两年,谷歌对其核心产品进行了一系列戏剧性的改变,AI Overview只是其中之一。

劈柴更是激动地表示,谷歌的搜索变革,将开启一个令人兴奋的技术新纪元,并有助于解决网络面临的许多问题。

如今看来,结果恰恰相反。

不仅对于用户来说,无法得到正确的、无毒的内容。

谷歌搜索引擎百度百科

对于一些制作大量原创内容的创作者来说,谷歌搜索算法的调整,以及AI直接总结答案功能,带来的结果可能不亚于一场灭顶之灾。

在谷歌最近的算法更新之后,Reddit便成为了其中的赢家之一。

据SEMRUSH统计,Reddit的流量激增,从谷歌搜索获得的流量激增126%。

前段时间,Reddit刚刚公布了自2024年3月上市以来的首次季度收益。它的总收入为2.43亿美元,比前一年增长了48%。

营销机构Amsive的SEO战略和研究副总裁表示,Reddit所经历的流量增长在互联网上是前所未有的。

除此以外,Quora、Instagram、Linkedin和维基百科,也出现了令人印象深刻的增长。

不过,谷歌的最新算法,却抹去了原创者95%的流量。

而且,谷歌承认,AI工具确实偶尔会提供不准确的结果,但也表示正不断努力改善结果。

同时,发言人表示,AI Overview的结果通常来自多个网页的综合结果,并非单一来源。

接下来,让我们再给谷歌一些耐心,毕竟AI搜索的终极完美,无人能给。

参考资料:

https://blog.google/products/search/generative-ai-google-search-may-2024/

https://www.theverge.com/2024/5/24/24164119/google-ai-overview-mistakes-search-race-openai

https://www.bbc.com/future/article/20240524-how-googles-new-algorithm-will-shape-your-internet

苹果15pro多少钱


返回网站首页

本文评论
沉寂两年后:华为“盘古”AI大模型即将上线「华为盘古大模型是什么东西」
2021年4月,刚刚接任华为云CEO的余承东在HDC华为开发者大会上公布了一项重磅产品:华为云盘古系列AI大数据模型。遗憾的是,虽然在大会结束后,盘古一度成为了从业者与网友讨论的焦...
日期:03-27
SpaceX去年完成61次火箭发射 今年能突破100次吗?_spacex今年发射次数
1月4日消息,2022年全年太空探索技术公司SpaceX的火箭发射纪录较前一年翻倍,全年完成发射61次。公司在2023年的火箭发射目标是突破100次。2022年的倒数第二天,SpaceX完成当年最...
日期:01-04
李开复千亿资产带回中国「李开复1亿元在京成立零一万物AI公司」
8月25日 消息:企查查APP显示,近日,北京零一万物信息技术有限公司成立,法定代表人为李开复,注册资本1亿元人民币,经营范围包含:人工智能双创服务平台、人工智能理论与算法软件开发...
日期:08-25
美证交会称FTX是加密“纸牌屋”:创始人借此挪用18亿美元
  财联社12月13日讯(编辑 赵昊)当地时间周二(12月13日),美国证券交易委员会(SEC)表示,FTX创始人、前首席执行官山姆·班克曼-弗里德(Sam Bankman-Fried,下文简称“SBF”)从创立这家交...
日期:12-14
官方透露的​荣耀90系列手机
荣耀90系列,包括荣耀90和荣耀90 Pro,已经被中国工业和信息化部列入名单。虽然详细规格尚未公布,但传闻称,顶配版将采用高通骁龙8+ Gen1芯片,1.5K高频调光中心双孔曲面屏,以及S5KHP...
日期:04-20
马拉多纳家族发行NFT数字艺术品,以铭刻球王传奇的一生「马拉多纳资料」
近日,阿根廷传奇球星迭戈·马拉多纳的家人通过他的品牌公司Sattvica宣布,正式发行马拉多纳NFT数字艺术品,将球王生前的经典形象永 久铭刻保存,以此纪念这位伟大的足球运动员。据...
日期:07-10
中国工业互联网研究院王聪:深入贯彻落实《商用密码管理条例》推进电信行业商用密码应用
通信世界网消息(CWW)近日,新修订的《商用密码管理条例》(以下简称《条例》)正式施行,根据我国商用密码事业发展的新形势、新任务,进一步规范了商用密码应用及管理。《条例》的施行...
日期:08-14
为数据而生,为隐私而战:隐私计算产业加速崛起_隐私计算技术是什么
声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:吴昕,授权转载发布。数字经济时代,数据作为新的生产要素和战略性资源,是科技进步、政策制定和经济发展的重要动力。但...
日期:05-15
1971年美国一架先进无人机失踪,39年后才发现竟然躺在中国博物馆
1971年,美国一架D21无人机打算窜入中国大西北实施秘密侦察任务,可这架飞机在进入我国领空后不久由于出现机械故障,无人机径直坠毁在了云南西双版纳原始森林里。不过由于坠机时,...
日期:10-16
千呼万唤始出来! WPS计算机二级通关课3月1日上线_计算机二级WPS备考
  2021年3月(第60次)全国计算机等级考试将于3月27日至29日举行。值得注意的是,国产办公软件WPS Office此次将作为全国计算机等级考试(NCRE)的二级考试软件之一。   WPS...
日期:07-16
不明觉厉的AI绘画,对内容创作者来说有什么用?「人工智能创作的画作是不是艺术」
声明:本文来自于微信公众号新榜(ID:newrankcn),作者:卷毛,授权转载发布。AI绘画的发展速度已经超乎我们的想象了。可能不少人会觉得惊讶,两年前AI只能画一些难以辨认的模糊图片,如...
日期:10-05
创新科技与可持续发展理念的碰撞 三星高端手机之名无可撼动
近几年,人工智能话题大热,以Open AI为基础打造的众多软件,在改变不同行业人群生产力方式的同时,也将许多人固有的认知进行了全面刷新。而前不久,埃隆马斯克正式发布的自家开源大...
日期:03-22
2024年Q1国产手机激活数量TOP10出炉:OPPO、vivo成最大赢家_2024年手机还在吗?
快科技5月7日消息,QuestMobile今天公布了《2024中国移动互联网春季大报告》。羊了个羊最新通关率围墙防护栏多少钱一米的报告显示,2024年1-3月,激活设备数TOP10的国产机型中,OPP...
日期:05-07
百度云推出智能边缘BIE  最智能线下设备终端加速ABC能力落地
  近日,百度与英特尔宣布成立5G+AI边缘计算联合实验室,加速多接入边缘计算(MEC)技术在中国的开发。双方将充分发挥在技术和应用开发领域的优势,共同致力于人工智能、车联网、...
日期:02-11
人工智能和机器学习、高性能计算推动半导体先进封装趋势_半导体 人工智能
7月26日消息:根据 IDC 最新「半导体制造服务 : 2022 年全球半导体封测市场—供应商排名及动态观察」研究显示,全球半导体封测市场稳步增长,2022 年规模达 445 亿美元,年增长率...
日期:07-26
印度本土4G/5G网络:设备将投入大规模部署_印度4g网络支持的频段
通信世界网消息(CWW)据外媒报道,印度国有电信运营商BSNL已从印度IT公司Tata Consultancy Services(TCS)订购了价值18.3亿美元的4G网络基础设施设备和软件,由此将为BSNL能够在印度...
日期:05-30
小县城如何培养出名师“天团”?来看基于希沃白板的生成式课堂
  “当老师是一件很神圣的事情,我当老师,是要让学生喜欢、让家长满意。我是热爱教书的,教了25年还是很热爱。”   2021年1月,吕新梅以这两句话结束了采访。   信息...
日期:08-15
双11:iPhone 14 Plus减1000 京东官方5999_iphone12pro max双十一能降价吗
iPhone14 Plus在今年的双11活动中非常诱人,现在立减1000元的活动力度非常大,目从6999元降到了5999元,早在本月初iPhone 14 P路上首销当日就立减500元,现在京东联通等一些官方的...
日期:11-11
联想a780t参数「联想a750参数」
联想a750是一款智能手机,该手机于2011年10月发布,在市场上获得了一定的反响。联想a750采用了一些较为普遍的技术,并在一些方面进行了改进,使其与一些其他手机型号有所不同。设计...
日期:05-30
容量4500mAh、充电25W!三星Galaxy S23 FE电池曝光_三星s20+的电池
据韩国安全认证机构 safetykorea 的公开数据显示,型号为EB-BS711ABY的智能手机电池已通过韩国安全认证,此前有消息称三星 Galaxy S23 FE 手机将会搭载该型号电池。苹果6s现在...
日期:06-10