您的位置:首页 > 互联网

麻省理工学院研究:辩论让AI机器人更加聪明

发布时间:2023-09-21 18:27:07  来源:互联网     背景:

文章概要:

1. MIT研究发现,多智能体辩论可以提高AI模型的准确性和推理能力。

apple watch s6芯片性能

2. 辩论方法减少了幻觉,帮助模型增强响应能力。

3. 研究团队发现,让多个AI系统辩论问题的答案比仅使用单个AI系统可以提高响应的准确性。

9月21日 消息:麻省理工学院(MIT)的研究人员发现,相较于仅使用单个AI系统,让多个AI系统辩论问题的答案可以显著提高响应的准确性和推理能力。这一研究成果出现在题为《通过多智能体辩论提高语言模型的真实性和推理能力》的论文中。该研究还得到了Google DeepMind研究员Igor Mordatch的合作。

研究人员将这一方法命名为“多智能体社会(Multiagent Society)”,并发现它可以减少生成输出中的幻觉。最令人兴奋的是,这一方法甚至可以应用于像OpenAI的ChatGPT这样的现有黑盒模型。

这一方法的实施包括多轮回的响应生成和评论。模型首先生成对给定问题的答案,然后整合来自其他智能体的反馈,以更新自己的响应。研究人员发现,这一过程可以改善最终的输出,因为它类似于团队讨论的结果,各个智能体共同贡献答案以达成统一的结论。

此外,这一方法还可以用于结合不同的语言模型,比如将ChatGPT与Google Bard进行对比。虽然这两个模型在示例提示下都生成了不正确的答案,但它们之间可以生成正确的最终答案。

通过多智能体社会方法,MIT团队能够在自然语言处理、数学和解谜等各种基准测试中取得卓越的成绩。例如,在流行的MMLU基准测试中,使用多个智能体的模型准确度得分为71,而仅使用单个智能体的得分为64。

主要研究人员之一,MIT博士生Yilun Du表示:“我们的方法使用了多个AI模型,每个模型都带来了独特的见解来解决问题。尽管它们的初始响应可能会显得缩短或包含错误,但这些模型可以通过审查其同行提供的响应来提炼和改进自己的答案。”

这一研究成果为AI领域的进一步发展提供了新的思路和方法,有望改进现有的语言模型,并提高其真实性和推理能力。


返回网站首页

本文评论
小米14系列外观曝光 直屏曲面都有_小米14t
今年的高通骁龙技术峰会将提前至十月份举行,骁龙8 Gen3处理器将会提前发布。骁龙 8 Gen3的首批机型将会在11月份正式推出。以往的惯例来看,预计小米14将会成为该款处理器的官...
日期:06-15
基于海拉克斯打造 丰田推出首款纯电皮卡原型车 网友:丑到我眼睛了
电动化时代,很多传统车企一下子被新生的造车新势力打得有点找不到北,这其中典型的就是丰田。网站CMS12月17日消息,丰田泰国运营60周年之际,丰田汽车本作向全世界展示了其首款全...
日期:12-18
俄罗斯月球-25号探测器变轨出意外!首次月球南极着陆或被印度截胡
快科技8月20日消息,当时时间8月11日,搭载月球25”号探测器的联盟-2.1b运载火箭从俄罗斯阿穆尔州东方航天发射场升空,该探测器预计8月21日在月球南极着陆,若成功将是人类历史首次...
日期:08-21
微博饭圈健康生态行动公告:清理违规微博 23779 条,禁言 52 个账号
  1 月 1 日消息,微博于 2021 年最后一天,公布了微博饭圈健康生态专项行动系列公告(二十四)。本次微博平台继续组织力量对站内涉“饭圈违规”的信息进行认真排查,以下为处置...
日期:07-17
通用、福特在华销量大滑 福特CEO称要重新思考品牌定位
4月23日消息,在电动汽车加速发展之际,中国汽车制造商给福特和通用等美国汽车制造商带来的竞争压力越来越大。这些公司不得不重新思考自己在中国汽车市场的未来。春节iphone降...
日期:04-23
朋友圈设置三天可见的理由!手机得这么设置才能看_朋友圈设置三天可见,你怎么看
中关村在线消息:11月1日,据相关爆料,朋友圈设置三天可见的理由的登上热搜,可能很多小伙伴的交友软件由于种种原因都设置了三天可见选项,让列表内的朋友仅能看到自己三天的动态。...
日期:11-03
ios15是印度人开发吗「TechInsights 分析师预估iPhone 15提高至10% 「苹果加码“印度制造”」」
 8 月 19 日消息,TechInsights 行业分析师 Abhilash Kumar 昨天在其领英(LinkedIn)上发布研报,预测“印度组装”的 iPhone 15 占比将超过 10%。研报指出 iPhone 15 系列在中国...
日期:09-17
素质堪忧?垃圾站现1000万日元 日本12人前去冒领:最终结果意外_日本垃圾投放点
拾金不昧在任何时候都是值得点赞的美德,但不得不承认的是,人一生也是在跟私欲斗争。据凤凰卫视驻东京首席记者李淼分享,1月底在日本北海道札幌市管辖的一处垃圾站,发现了1000万...
日期:05-02
小米13官网评价超100万、好评率达99.9%「小米好评模板」
7月5日消息,小米13上线也半年了,从官网来看,已经收到了超过一百万条评价,总评分达到99.9%,可谓是小米目前最稳定的手机之一。小米13的起售价为3999元,是一款小尺寸全能旗舰手机,拥...
日期:07-05
综合续航超两天两夜!红魔8S Pro游戏手机官宣搭载6000mAh大电池「红魔8g和12g区别」
红魔8S Pro游戏手机官方宣布将搭载一块容量为6000mAh的大电池,号称综合续航能力超过两天两夜,成为行业中首款具备如此长续航时间的手机。根据预热信息显示,红魔8S Pro手机还将...
日期:06-29
从业十年,参与过2077和原神,她却因为一台冰箱出圈了
声明:本文来自于微信公众号 游戏葡萄(ID:youxiputao),作者:果脯&严锦彦,授权转载发布。任谁都没有想到,苏联题材的科幻游戏《原子之心》会因为一台冰箱而火出圈。如今你在B站搜索...
日期:03-12
宋PLUS冠军版正式上市 比亚迪全年完成300万辆销量目标可期_比亚迪宋plus2020年销量
【智驾派新闻】2022年,作为全球首家停产燃油车的车企,比亚迪累计销量186.35万辆,同比增长208.64%,连续十年稳居中国新能源汽车销量第一宝座,同时也超过了特斯拉131万辆的交付量,问...
日期:06-21
我国互联网普及率达70.4%「我国互联网普及率达76.4%」
通信世界网消息(CWW)中国互联网络信息中心(CNNIC)近日在京发布第52次《中国互联网络发展状况统计报告》(以下简称《报告》)。《报告》显示,截至2023年6月,我国网民规模达10.79亿人,较...
日期:08-31
“AI赋智 绿色赋能”,联想再辟新径,绿色智领算力普慧发展
8 月 18 日, 2023 中国算力(基础设施)大会在“东数西算”的八大枢纽之一——宁夏银川拉开帷幕。在大会首日“智算无限 全栈智能 联想AI算力战略暨AI服务器新品发布会”上,联想集...
日期:08-21
美国云计算软件股纷纷大涨 需求仍强劲_美国云计算市场
家庭客厅投影好还是电视好   讯 北京时间8月15日早间消息,据报道,今年年初,美国云计算软件股纷纷下跌,但现在许多股票的价格已经较低点反弹50%。过去三个月WisdomTree云计算基...
日期:08-16
设备翻新无需物理备份!华为预热实用云翻新功能_华为云真机
快科技7月28日消息,今天,华为终端公司官方宣布,即将推出一项相当实用的新功能:系统云翻新”,该功能将在8月8日上线,首发支持P40与Mate 30系列手机。该功能的推出,有望彻底解决用户...
日期:07-28
估值200亿的AI公司,要干掉谷歌了?_估值200亿的ai公司,要干掉谷歌了吗
声明:本文来自微信公众号“亿欧网”(ID:i-yiou),作者:王鹏,编辑:顾彦,授权转载发布。是什么让全球科技圈都爱上了分享聊天截图?继AI绘画爆火后,又一款AIGC产品刷屏了海内外的社交网...
日期:12-12
李想:理解这张图可以少走很多弯路
快科技6月2日消息,热衷于网上冲浪的理想汽车CEO李想又分享自己的心得体会了。就在今日,其发布了一张图片,并配文称在一个技术变革的大行业里,理解这张图片,可以少走很多弯路,战略...
日期:06-02
华为在世界市场的竞争力_只靠中国市场就能拿下全球第一,华为实力打脸对手
  你知道世界上最神奇的酒是中国的白酒,它跟全球销售的威士忌,伏特加或杜松子酒不一样。白酒只在中国销售,但这单一的市场也足以让它成为世界第一。   同样的,华为在没有进...
日期:08-24
马斯克74岁超模妈妈结束中国行:她说“在中国玩得很开心”_马斯克妈妈自传
4月2日消息,梅耶马斯克(MayeMusk)在社交平台上表示,她结束了此趟中国行的旅程,她多次提及在中国玩得很开心”、每个人都很友善”。iphone15pro潜望式镜头据悉,此趟中国行,梅耶为其7...
日期:04-03