您的位置:首页 > 互联网

牛津研究人员利用语义熵来识破 AI“幻觉” 聊天机器人胡言乱语?

发布时间:2024-06-24 11:34:46  来源:互联网     背景:

 6 月 24 日消息,近年来,人工智能蓬勃发展,聊天机器人等应用逐渐普及,人们可以通过简单的指令从这些聊天机器人(例如 ChatGPT)获取信息。然而,这些聊天机器人仍然容易出现“幻觉”问题,即提供错误的答案,有时甚至是危险的信息。

福特野马国内上市时间

造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过,牛津大学的研究人员另辟蹊径,在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法,用于检测大型语言模型 (LLMs) 的“捏造” (即任意生成的不正确信息) 问题。

骁龙870算神u吗

特斯拉马斯克多少股份

LLM 通过在训练数据中寻找特定模式来生成答案。但这种方法并非总是奏效,就像人类能从云朵形状中看到动物一样,AI 机器人也可能找到并不存在的模式。然而,人类知道云朵只是形状而已,天上并没有漂浮的巨型大象。LLM 则可能将此视为真实的,从而“捏造”出并不存在的新科技和其他虚假信息。

牛津大学的研究人员利用语义熵的概念,通过概率来判断 LLM 是否出现“幻觉”。语义熵指的是同一个词语拥有多种含义的情况,例如,“desert”可以指沙漠,也可以表示抛弃某人。当 LLM 使用这类词语时,可能会对表达的含义感到困惑。通过检测语义熵,研究人员旨在判断 LLM 的输出内容是否存在“幻觉”的可能。

利用语义熵的优势在于无需额外的监督或强化学习,即可快速检测 LLM 的“幻觉”问题。由于该方法不依赖于特定任务的数据,因此即使 LLM 面临从未遇到过的新任务,也能加以应用。这将大大提升用户对于 LLM 的信任感,即使是 AI 首次遇到某个问题或指令。

研究团队表示:“我们的方法可以帮助用户理解何时需要对 LLM 的输出保持谨慎,并为原本因不可靠性而受限的 LLM 应用开辟了新天地。”

如果语义熵被证明是一种有效的“幻觉”检测手段,那么我们可以利用这类工具对人工智能的输出进行双重校验,使其成为更加可靠的伙伴。不过IT之家需要提醒的是,就像人类并非无懈可击一样,即使配备了最先进的错误检测工具,LLM 也仍然可能出错。因此,始终对 ChatGPT 等聊天机器人提供的答案进行仔细核查仍然是明智之举。(远洋)


返回网站首页

本文评论
成都交子大道元宇宙街区正式启动_成都交子大道网红店
未来已来,乘上智慧的翅膀新年伊始, 2024 年 1 月 1 日下午 1 点,成都高新区交子大道N2 草坪嘉宾汇聚,交子大道元宇宙街区启动仪式宣告正式启动。成都高投资产经营管理有限公司相...
日期:01-13
弗瑞仕空气消毒机_雪圣孚沃德空气消毒机:医用级可家用的消毒机
  平时好多朋友都有在问:医用空气消毒机是否可用于家中。在回答这个问题前,首先我们要知道目前医用空气消毒机都采用了哪些技术?从大的方面来说,医用空气消毒机主要有两种类...
日期:07-14
天猫双11 2020「2023天猫双11收官:双11全周期累计访问用户数超8亿 创下历史峰值」
快科技11月12日消息,今日零点,2023年天猫双11收官。官方数据显示,截至11月11日零点,共有402个品牌成交破亿,其中有243个是国货品牌,3.8万个品牌成交同比增长超过100%。天猫表示,今...
日期:11-12
Redmi Note 11T Pro新版本今天开始预约:8+256GB售价2099元_红米note10 pro首发价格
9月28日消息,今天Redmi Note 11T Pro新版本:8+256GB的开始预约,售价2099元。这款手机搭载的是LCD屏幕,是目前为数不多的LCD屏,一直想买LCD屏手机的小伙伴可以预约,9月30日晚上8点...
日期:10-06
荣耀play6+128「荣耀Play6C正式发布 起售价1099元」
中关村在线消息:今日荣耀高性价比机型荣耀 Play6C正式发布,并且已经开启预售,起售价为1099元,将于10月13日正式发布。硬件配置方面,荣耀Play6C配有6.5英寸LCD屏幕,支持90Hz高刷以...
日期:10-10
240W超级闪充要来!realme暗示新机充满电不到10分钟「realme 30w智慧闪充」
为了解决用户对手机续航的焦虑问题,各大手机厂商在快充功率上疯狂内卷。三维家公司简介目前,最新的手机快充技术已经来到200W。realme副总裁徐起今日发文表示:手机电量不到10%...
日期:01-03
VC谈2024年AI发展趋势年:多模态模型主导、GPU短缺等_ai最新发展
**划重点:**当当网发展陷入低谷的原因1....
日期:12-29
湖北暴雪云计算科技有限公司「湖北暴雪司机被困36小时煮雪融水喝:吃喝物资已经耗尽」
2月5日,湖北京山。近日,湖北遭受冰冻雨雪天气,导致多地高速出现拥堵情况。许多司机被迫滞留在高速公路上,面临严重的困境。荣耀平板7和小新pad plus哪个好大车司机康先生告诉媒...
日期:02-05
贾跃亭为梦想窒息9年!法拉第未来宣布1亿美元融资:FF 91产能加速_法拉第未来 贾跃亭 股份
快科技5月10日消息,在法拉第未来(Faraday Future,即FF”)首款车型FF 91 Futurist量产发布会上,贾跃亭表示,为梦想窒息了9年,不被理解的疯魔般的坚持和决绝的付出,才有了今天的量产。...
日期:05-10
苹果2020财年印度业务净利润激增253% 达1.25亿美元(印度2020经济增长)
11月10日消息,据国外媒体报道,商业信息平台Tofler获悉的数据显示,2020财年,科技巨头苹果在印度的收入增长了约29%,达到1375.58亿卢比(约18.58亿美元),净利润达到了92.62亿卢比,同比增...
日期:08-01
操作系统成为客户购买智能手机的关键_操作系统成为客户购买智能手机的关键参数
  市场研究公司Kantar Worldpanel ComTech的研究显示,现在的消费者购买智能手机时,考虑更多的是移动操作系统。这一消息的公布引发了传统上依赖强大的客户忠诚度维持业绩的...
日期:07-24
中概股周四收盘多数下跌 每日优鲜暴跌42% 新东方涨超12%_每日优鲜股票市值
手机游戏软件培训雷诺汽车新任CEO或由大众汽车集团前高管出任12306温馨服务怎么用   北京时间29日凌晨,美股周四收高。最新GDP数据显示美国经济连续第二个季度萎缩,证实美国...
日期:07-31
滴滴云产品线调整 3月31日起不再对外提供公有云服务「滴滴云提供计算服务」
3月28日 消息:滴滴云宣布,由于产品线调整,将于2023年3月31日0:00起不再对外提供公有云服务。通知还显示:如您的账户中仍有资源和余额,请您在2023年6月30日24:00前及时进行资源...
日期:03-29
百度输入法明星皮肤设计大赛启动(百度输入法皮肤)
  10月17日消息,百度输入法(http://shurufa.baidu.com/)推出第一季明星皮肤设计大赛,面向全体网民征集与“明星”相关的输入法皮肤设计。明星粉丝可以用实力去占领百度输入...
日期:07-24
技术驱动革命,全球数据存储迈向新时代_数据驱动的时代
近日,谷歌云的客户、金融服务提供商UniSuper出现了私有云账户被删除的情况,直接导致UniSuper基金的50多万会员整整一周无法访问各自的退休金账户。谷歌云CEO Thomas Kurian称,...
日期:05-22
苹果指控前工程师通过 AirDrop 和 Time Machine 窃取芯片机密
  5 月 3 日消息,苹果起诉了 一家名为 Rivos 的初创公司,理由是它挖走了能接触到公司机密的工程师。根据起诉书,苹果认为,前员工应 Rivos 的要求,在招聘过程中窃取了苹果专有...
日期:04-16
快手“方言麦霸音乐会”线上观看人次超1亿_快手麦霸哥
【】8月22日消息,昨晚,快手“方言麦霸音乐会”顺利落幕。快手数据显示,在快手直播间,该音乐会吸引超过1亿人次观看直播。作为“我的家乡很好听·快手方言麦霸大赛”的收官之秀,本...
日期:09-17
支持动态调整刷新率 「iPhone」-15 Pro系列屏幕供应商敲定_ios15屏幕刷新率
按照惯例,苹果将继续在今年9月举办一年一度的秋季新品发布会,届时全新的iPhone 15系列将正式与大家见面,不出意外的话该系列将继续推出包含iPhone 15、iPhone 15 Plus、iPhone...
日期:09-16
李佳琦,还是国产美妆的“救星”吗?
声明:本文来自于微信公众号 连线Insight(ID:lxinsight),作者:晓阳,授权转载发布。疫情对美妆行业的影响还在持续,在李佳琦、薇娅缺席今年618大促的背景下,美妆赛道终于迎来了双十...
日期:11-01
亚马逊发射首批两颗太空互联网原型卫星 与SpaceX星链竞争
10月7日消息,美国当地时间周五,亚马逊将其首批两颗互联网原型卫星送入轨道,正式将触角伸向太空。这是亚马逊打造太空互联网的关键一步,该网络将由3000多颗卫星组成。亚马逊希望...
日期:10-07