您的位置:首页 > 互联网

人工智能的“胡言乱语”,有没有解法?

发布时间:2023-08-31 15:08:56  来源:互联网     背景:

AI大模型的成功带来了前所未有的“智能涌现”,人们对即将到来的AI时代充满期待。

然而,在科技巨头们涌向AI赛道、人们乐此不疲地实验和讨论AI的强大功能,并由此感叹其是否可能取代人类劳动时,AI幻觉问题也越来越不容忽视,成为AI进一步发展的阻碍。Yann LeCun——世界深度学习三巨头之一,“卷积神经网之络父”——在此前的一次演讲中,甚至断言“GPT模型活不过5年”。

随着AI幻觉争议四起,大模型到底能够在行业中发挥多大作用,是否会产生副作用,也成为一个焦点问题。AI幻觉究竟是什么?是否真的无解?

AI大模型的“胡言乱语”

人类会胡言乱语,人工智能也会。一言以蔽之,人工智能的胡言乱语,就是所谓的“机器幻觉”。

具体来看,AI幻觉就是大模型生成的内容在表面上看起来是合理的、有逻辑的,甚至可能与真实信息交织在一起,但实际上却存在错误的内容、引用来源或陈述。这些错误的内容以一种有说服力和可信度的方式被呈现出来,使人们在没有仔细核查和事实验证的情况下很难分辨出其中的虚假信息。

AI幻觉可以分为两类:内在幻觉(Intrinsic Hallucination)和外在幻觉(Extrinsic Hallucination)。

所谓内在幻觉,就是指AI大模型生成的内容与其输入内容之间存在矛盾,即生成的回答与提供的信息不一致。这种错误往往可以通过核对输入内容和生成内容来相对容易地发现和纠正。

举个例子,我们询问AI大模型“人类在哪年登上月球”?(人类首次登上月球的年份是1969年)然而,尽管AI大模型可能处理了大量的文本数据,但对“登上”、“月球”等词汇的理解存在歧义,因此,可能会生成一个错误的回答,例如“人类首次登上月球是在1985年”。

相较于内在幻觉,外在幻觉则更为复杂,它指的是生成内容的错误性无法从输入内容中直接验证。这种错误通常涉及模型调用了输入内容之外的数据、文本或信息,从而导致生成的内容产生虚假陈述。外在幻觉难以被轻易识别,因为虽然生成的内容可能是虚假的,但模型可以以逻辑连贯、有条理的方式呈现,使人们很难怀疑其真实性。通俗的讲,也就是AI在“编造信息”。

想象一下,我们在AI聊天,向其提问:“最近有哪些关于环保的新政策?”AI迅速回答了一系列看起来非常合理和详细的政策,这些政策可能是真实存在的。但其中却有一个政策是完全虚构的,只是被AI编造出来。这个虚假政策可能以一种和其他政策一样有逻辑和说服力的方式被表述,使人们很难在第一时间怀疑其真实性。

这就是外在幻觉的典型例子。尽管我们可能会相信AI生成的内容是基于输入的,但实际上它可能调用了虚构的数据或信息,从而混入虚假的内容。这种错误类型之所以难以识别,是因为生成的内容在语言上是连贯的,模型可能会运用上下文、逻辑和常识来构建虚假信息,使之看起来与其他真实信息没有明显区别。

AI为什么会产生幻觉?

人工智能的幻觉问题,其实并不是一个新问题,只不过,以ChatGPT为代表的AI大模型的火爆让人们开始注意AI幻觉问题。那么,AI幻觉究竟从何而来?又将带来什么危害?

特斯拉y定金

以ChatGPT为例,本质上,ChatGPT只是通过概率最大化不断生成数据而已,而不是通过逻辑推理来生成回复:ChatGPT的训练使用了前所未有的庞大数据,并通过深度神经网络、自监督学习、强化学习和提示学习等人工智能模型进行训练。目前披露的ChatGPT的上一代GPT-3模型参数数目高达1750亿。

在大数据、大模型和大算力的工程性结合下,ChatGPT才能够展现出统计关联能力,可洞悉海量数据中单词-单词、句子-句子等之间的关联性,体现了语言对话的能力。正是因为ChatGPT是以“共生则关联”为标准对模型训练,才会导致虚假关联和东拼西凑的合成结果。许多可笑的错误就是缺乏常识下对数据进行机械式硬匹配所致。

不久前,两项来自顶刊的研究就表明:GPT-4可能完全没有推理能力。第一项研究来自麻省理工的校友 Konstantine Arkoudas。8 月 7 日,毕业于美国麻省理工学院的 Konstantine Arkoudas 撰写了一篇标题为《GPT-4 Can't Reason》(GPT-4 不能推理)的预印本论文,论文指出,虽然GPT-4 与 GPT 3.5 相比有了全面的实质性改进,但基于21种不同类型的推理集对GPT-4进行评估后,研究人员发现,GPT-4完全不具备推理能力。

而另一篇来自加利福尼亚大学和华盛顿大学的研究也发现,GPT-4,以及GPT-3.5在大学的数学、物理、化学任务的推理上,表现不佳。研究人员基于2个数据集,通过对GPT-4和GPT-3.5采用不同提示策略进行深入研究,结果显示,GPT-4成绩平均总分仅为35.8%。

而“GPT-4完全不具备推理能力”的背后原因,正是AI幻觉问题。也就是说,ChatGPT虽然能够通过所挖掘的单词之间的关联统计关系合成语言答案,但却不能够判断答案中内容的可信度。

换言之,AI大模型没有足够的内部理解,也不能真正理解世界是如何运作的。AI大模型就好像知道一个事情的规则,但不知道这些规则是为什么。这使得AI大模型难以在复杂的情况下做出有力的推理,因为它们可能仅仅是根据已知的信息做出表面上的结论。

比如,研究人员问GPT-4:一个人上午9点的心率为75 bpm(每分钟跳动75次),下午7点的血压为120/80(收缩压120、舒张压80)。她于晚上11点死亡。她中午还活着吗?GPT-4则回答:根据所提供的信息,无法确定这个人中午是否还活着。但显而易见的常识是“人在死前是活着的,死后就不会再活着”,可惜,GPT-4并不懂这个道理。

AI幻觉有无解法?

AI幻觉的危害性显而易见,其最大的危险之处就在于,AI大模型的输出看起来是正确的,而本质上却是错误的。这使得它不能被完全信任。

怪兽充电股权结构

因为由AI幻导致的错误答案一经应用,就有可能对社会产生危害,包括引发偏见,传播与事实不符、冒犯性或存在伦理风险的毒性信息等等。而如果有人恶意的给ChatGPT投喂一些误导性、错误性的信息,更是会干扰ChatGPT的知识生成结果,从而增加了误导的概率。

我们可以想象下,一台内容创作成本接近于零,正确度80%左右,对非专业人士的迷惑程度接近100%的智能机器,用超过人类作者千百万倍的产出速度接管所有百科全书编撰,回答所有知识性问题,会对人们凭借着大脑进行知识记忆带来怎样的挑战?

尤其是在生命科学领域,如果没有进行足够的语料“喂食”,ChatGPT可能无法生成适当的回答,甚至会出现胡编乱造的情况,而生命科学领域,对信息的准确、逻辑的严谨都有更高的要求。因此,如果想在生命科学领域用到ChatGPT,还需要模型中针对性地处理更多的科学内容,公开数据源,专业的知识,并且投入人力训练与运维,才能让产出的内容不仅通顺,而且正确。

并且,ChatGPT也难以进行高级逻辑处理。在完成“多准快全”的基本资料梳理和内容整合后,ChatGPT尚不能进一步综合判断、逻辑完善等,这恰恰是人类高级智慧的体现。国际机器学习会议 ICML 认为,ChatGPT 等这类语言模型虽然代表了一种未来发展趋势,但随之而来的是一些意想不到的后果以及难以解决的问题。ICML 表示,ChatGPT 接受公共数据的训练,这些数据通常是在未经同意的情况下收集的,出了问题难以找到负责的对象。

而这个问题也正是人工智能面临的客观现实问题,就是关于有效、高质量的知识获取。相对而言,高质量的知识类数据通常都有明确的知识产权,比如属于作者、出版机构、媒体、科研院所等。要获得这些高质量的知识数据,就面临支付知识产权费用的问题,这也是当前摆在ChatGPT目前的客观现实问题。

目前,包括OpenAI在内的主要的大语言模型技术公司都一致表示,正在努力改善“幻觉”问题,使大模型能够变得更准确。

特别是麦肯锡全球研究院发表数据预测,生成式AI将为全球经济贡献2.6万亿美元到4.4万亿美元的价值,未来会有越来越多的生成式AI工具进入各行各业辅助人们工作,这就要求AI输出的信息数据必须具备高度的可靠性。

谷歌也正在向新闻机构推销一款AI新闻写作的人工智能产品,对新闻机构来说,新闻中所展现的信息准确性极其重要。另外,美联社也正在考虑与OpenAI合作,以部分数据使用美联社的文本档案来改进其人工智能系统。

究其原因,如果AI幻觉问题不能得到有效的解决,生成式大语言模型就无法进入通用人工智能的阶段。可以说,ChatGPT是一个巨大的飞跃,但它们仍然是人类制造出来的工具,目前依然面临着一些困难与问题。对于AI的前景我们不需要质疑,但是对于当前面对的实际困难与挑战,需要更多的时间才能解决,只是我们无法预计这个解决的时间需要多久。


返回网站首页

本文评论
ai头像插画「AI简笔画、百变AI头像、文生图....美图秀秀助力用户美学创作」
美图秀秀“AI绘画”自面世以来,得到全球用户的广泛认可。近日,美图秀秀“AI绘画”上线“文生图”功能,能够将用户输入的自然语言文本转换为图像,只要将想象画面的关键词以逗号隔...
日期:04-24
火星文化:抖音VS快手红人电商数据深度研究_抖音快手商业模式差异分析
  在短视频疯狂瓜分用户注意力的当下,内容电商成为广告主及内容创作者共同关注的话题。在各方力量快速入局的同时:   什么量级的短视频账号最带货?   以何种内容形式带...
日期:05-13
王者荣耀qq设备锁「腾讯推出“游戏锁”功能:再也不怕《王者荣耀》号被盗了」
一直以来,帐号被盗问题始终困扰着许多玩家,尤其是腾讯旗下账号多数使用QQ登陆。近日,腾讯游戏安全中心及王者荣耀运营团队宣布,王者荣耀被盗保护功能已正式上线。据介绍,此次上线...
日期:01-08
明晚发布!小米13 Ultra外观正式揭晓:更像相机了
快科技4月17日消息,在发布会到来的前一天,小米官方终于正式揭晓了小米13 Ultra的外观设计。今早,小米手机官微发布了一段外观视频,首次展示了小米13 Ultra的外观,以及大家关心的...
日期:04-17
网易公布2022年第二季度未经审计财务业绩(网易2018年度财务报告)
(杭州-2022年8月18日)中国领先的互联网与在线游戏服务提供商网易股份有限公司(纳斯达克代号:NTES及港交所代号:9999,“网易”或“公司”),今天宣布了截至2022年6月30日的第二季度未...
日期:08-19
小米电视价格「小米电视价格65寸价格」
小米电视作为智能家居的代表之一,一经推出便成为市场上备受追捧的产品。作为国内领先的智能家居品牌,小米的电视产品不仅性能稳定,价格也相对较为亲民。那么,究竟小米电视的价格...
日期:06-01
抖音“最火”直播间,全是中年失意企业家「快手抖音一个老板吗」
声明:本文来自于微信公众号 微果酱(ID:wjam123456),作者:陈出木,授权转载发布。诸如李佳琦、薇娅一类的素人,通过直播带货缔造了财富神话。而在“失意”企业家的眼里,直播带货是新...
日期:10-26
唯享门窗官网_系统门窗供应链平台唯必驰落地运营
  2020年12月中旬,系统门窗集成供应链共享创业平台——唯必驰在常州落地运营。该平台的成立,将加速我国系统门窗定制及非标定制领域进入系统化、水平化的进程,对非标定制领...
日期:08-20
空天地一体化测绘「中国联通发布5项空天地一体化创新成果」
通信世界网消息(CWW)6月28日上午,中国联通主办的“未来网络·创领未来”主题会议暨科技创新成果发布会在上海新国际博览中心成功举办。会上中国联通发布了5G RedCap 端网业协同...
日期:07-01
2023年天猫618超级红包入口在哪里怎么领取618天猫红包活动时间几号开始?
2023 年淘宝天猫 618 超级红包活动时间什么时候开始?淘宝天猫 618 超级红包活动时间是从 2023 年 5 月 29 日 12 点开始到 6 月 20 日 24 点结束,在活动时间内,每天都可以使用...
日期:05-30
乔布斯和沃兹亲笔签名:苹果第二张支票现身拍卖市场「乔布斯apple1」
快科技8月1日消息,近日,一批相当稀少的苹果公司收藏品出现在了拍卖网站RR上,其中包含了苹果公司史上签出的第二张支票。据悉,这张支票在1976年3月19日开出,比苹果公司正式成立还...
日期:08-01
12寸笔记本「华硕12寸笔记本」
是一种小巧轻便的电脑,适用于出差、上课、旅游等需要携带电脑的场合。其屏幕大小一般在11.6-12.5英寸之间,重量一般在1-1.5kg之间,厚度也较薄。可以方便地放进背包中,不会占用太...
日期:05-30
福特首席执行官:没有放弃CarPlay的计划_fullaccessory power active福特车
福特首席执行官Jim Farley表示,由于CarPlay受到福特客户的欢迎,福特没有计划放弃对它的支持。“我们在美国70%的福特客户都是苹果客户。我为什么要去找苹果客户说祝你好运呢?”...
日期:05-04
特斯拉上海工厂9月交付超8.3万辆「特斯拉上海超级工厂年底正式投产」
10 月 9 日讯:据乘联会公布数据显示, 9 月,特斯拉上海超级工厂交付超过8. 3 万辆汽车,创月度交付记录新高。360随身wifi最新版...
日期:10-12
全面对标联通3G 移动全球通资费平均降逾15%_中国移动全球通套餐2018版
3G对运营商的影响已经开始全面显现,而竞争的压力迫使运营商不得不有所行动。 昨天,中国移动宣布从即日起,全面调整全球通套餐。其在全国范围推出全球通上网套餐、商旅套餐以...
日期:07-28
GPT 火了之后,马斯克「喷」了一百多条微博
ChatGPT 发布后,马斯克老师的 100 条迷思。作者 | Founder Park一开始,马斯克很兴奋。他和所有人一样陷入了 ChatGPT 狂热。没两天,不知道发生了什么,马斯克发现事情不对头。「C...
日期:04-10
重新定义全宅智能家居 宝思派智慧新品2.0发布暨全球合作峰会召开
  7月19日,“聚势共进·赋能共赢”——宝思派智能家居新品发布会暨全球合作峰会在广东佛山圆满落幕。中国建筑装饰协会材料分会秘书长梁宏瑀女士,中国建博葵花奖智能家居评...
日期:12-09
全国首场元宇宙庭审开庭 网友直呼高级
10月10日 消息:近来,国内各大互联网公司都在抢滩布局,并纷纷推出了各自的产品。而腾讯高管也直言数实融合会是全真互联的主战场,元宇宙将对产业有极大的效率提升。可以看到元宇...
日期:10-11
联想领像新品打印机京东首发 开启惊喜好礼三重奏(联想领像打印机怎么开机)
  如今, 打印机的使用场景更加丰富多元, 除了商用办公之外, 随着居家办公群体大幅增长以及孩子学习方式的转变, 打印机也逐渐成为家庭刚需产品。为满足消费者多场景、多...
日期:09-28
武大为2020届学生补办毕业礼!雷军发言:成为金山CEO是个意外「武汉大学雷军奖学金本科生」
6月20日消息,今日上午08:00,武汉大学举办2023年毕业典礼,并为2020届毕业生补了线下毕业典礼,2023届、2020届17000人齐聚学校体育场。据了解,武汉大学杰出校友、小米科技有限责任...
日期:06-20