您的位置:首页 > 互联网

GPT-4被证实有人类心智!网友:连AI都可以看出他在嘲讽你了_.gp4

发布时间:2024-05-27 13:14:06  来源:互联网     背景:

5月27日 消息:Nature杂志上发表的最新研究显示,GPT-4在心智理论(Theory of Mind, ToM)方面的表现与人类相当,甚至在某些方面超过了人类。这项研究由James W. A. Strachan等人进行,他们通过一系列测试来评估GPT-4、GPT-3.5、Llama2以及人类参与者的表现,并进行了比较。

以下是研究的主要发现:

华为海外手机能用鸿蒙系统吗

.gp4

  • 心智理论的表现:心智理论是理解他人心理状态的能力,对于社会互动至关重要。GPT-4在心智理论方面的表现与人类无异,甚至在检测讽刺和暗示方面优于人类。

  • 测试项目:研究包括了5个测试项目,分别是错误信念、反讽、失言、暗示和奇怪故事。GPT-4在反讽、暗示和奇怪故事这3项测试中的表现明显优于人类,在错误信念测试中与人类持平,仅在失言测试中表现不如人类。

  • 保守性:GPT-4在失言测试中的低分并非因为它缺乏理解能力,而是因为它采取了保守策略,不轻易给出确定性意见。

  • gpt42

  • 失言可能性测试:在失言可能性测试中,GPT-4展现了完美的性能,表明它能够成功推断说话者的心理状态,并确定无意冒犯的可能性大于故意侮辱。

  • 苹果发布紫色iPhone12售价

  • 能力和表现的分离:研究表明,GPT模型可能具备计算类似心智推理的技术复杂性,但在不确定情况下的表现与人类不同。人类倾向于消除不确定性,而GPT则不会自发地计算推论以减少不确定性。

  • 谨慎行为:GPT-4在失言测试中的保守性可能源于其底层架构中的缓解措施,这些措施旨在提高事实性并避免用户过度依赖模型。

  • vivox23非凡摄影

    .gp4

    这项研究的结果表明,GPT-4在理解人类心理状态方面的能力可能被低估了。研究者呼吁建立“机器心理学”,使用实验心理学的工具和范式来系统地研究大型语言模型的能力和局限性。

    论文地址:https://www.nature.com/articles/s41562-024-01882-z


    返回网站首页

    本文评论
    为什么这届年轻人基本不走亲戚了? 网友:太八卦,徒增压力和负担
    “为什么年轻人开始减少与亲戚的联系”于5月9日成为了微博热门话题,该话题阅读量达到1.6亿,讨论量超过1万,引发了广泛的社会讨论。南京大学社会学院副教授胡小武在2022年发表的...
    日期:05-10
    贾跃亭谈苹果放弃造车 称苹果放弃造车是大错误_如果贾跃亭不造车
    2月29日 消息:今日下午,法拉第未来创始人贾跃亭针对苹果公司放弃造车项目发表长文,表达了自己的失望和看法。贾跃亭认为,尽管库克成功地守护了乔布斯留下的iPhone帝国,但在AI电...
    日期:02-29
    苹果耗费约6年时间自研MicroLED屏幕:未来将用到iPhone上_苹果microled最新进展
    1月16日消息,爆料人Mark Gurman透露,苹果公司花了约6年时间研发MicroLED技术,这将是苹果自己定制设计的首款显示屏,这块屏幕会被应用到2024年发布的Apple Watch Ultra上。Mark G...
    日期:01-16
    百度AI绘画小程序“涂鸦一格”推出“萌宠AI情人”变身功能_ai怎么画百度图标
    2 月 14 日讯:百度宣布,旗下AI绘画小程序“涂鸦一格”推出“萌宠AI情人”变身功能。win10没有深色主题7nm的显卡邮政速递和邮政小包王守义iphone十三香是什么梗...
    日期:02-15
    罗永浩,为什么一直抓着东方甄选不放?_新东方的罗永浩
    “东方甄选可能是直播电商在中国诞生后,我见过的最不公平、最荒唐、最欺负压榨年轻人的现象级公司。”12月16日晚间,俞敏洪和董宇辉一起出面直播后,罗永浩发文炮轰东方甄选。一...
    日期:12-17
    小米MIX Fold 3入网:8月发布_小米mix fold首发
    根据3C认证最新数据显示,型号为“2308CPXD0C”的新机通过认证并支持67W快充。据推测,这款新机很可能是即将发布的小米MIX Fold 3折叠屏旗舰。此前,小米卢伟冰已经透露了小米智...
    日期:07-13
    微软edge浏览器支持avif格式「微软浏览器edgeflash」
    微软正计划在其edge浏览器中增加对avif格式的支持,该浏览器基于与chrome相同的内核. avif是一种基于av1视频编码的图像编码,它可以提供比其他图像格式更有效的编码。edge加入a...
    日期:04-20
    一张图看懂 | 2022年全球100个最有价值品牌_2020年全球最具价值的品牌
    10月28日 消息:确定品牌的财务价值不是一件简单的事情。尽管一个品牌是无形的,但一个强大的品牌在提升公司盈利方面起着重要的作用。考虑到这一点, Brand Finance在其年度全球...
    日期:11-11
    中国移动副总经理李慧镝:数字基建、智创未来 共谱高质量发展新华章
    通信世界网消息(CWW)5月25日,第十七届中国信息港论坛暨首届数字化转型高峰论坛在山东青岛召开。中国移动副总经理李慧镝出席主论坛,并作题为《数字基建、智创未来,共谱高质量发展...
    日期:05-26
    天猫精灵发布全新智能灯光中控屏和无主灯智能芯片 年轻人正在追捧家里变暗?
    3月22日,天猫精灵面向全国照明产业发布了新一代全屋智能灯光方案,包括三款中控屏和一款无主灯智能芯片,成为行业内优先推出“中控屏+Mesh”组合模式的智能化方案服务商。该方案...
    日期:10-06
    欧盟认为人工智能机器人也受法律约束「欧洲议会正式通过人工智能监管法案」
    欧洲议会13日以压倒性票数通过《人工智能法案》,这标志着欧盟扫清了立法监管人工智能的最后障碍。在法国斯特拉斯堡举行的欧洲议会全会上,该法案获得523张赞成票,46张反对票。...
    日期:03-14
    研究称常用AI工作会更孤独 专家:适度限制使用频率_ai最常用的功能
    快科技6月14日消息,人工智能正在引发一场新的技术革命,越来越多的公司使用AI系统为员工提供帮助。苹果不给充电器中国怎么不罚据美国心理学会最新发表的研究,在工作中经常与AI...
    日期:06-14
    返回舱成功着陆!神舟十四号载人飞行任务取得圆满成功「神舟十二号载人飞船返回舱成功着陆」
    (原标题:返回舱成功着陆!神舟十四号载人飞行任务取得圆满成功) 神舟十四号载人飞船返回舱成功着陆 ...
    日期:12-05
    百度输入法 换皮肤_百度输入法圣诞献礼 新增主题换肤功能
    [导读]白雪纷飞,圣诞将至,为了答谢用户的支持与关爱,百度输入法隆重推出了圣诞特别版,为大家送上节日的礼物。百度输入法圣诞版中加入了主题换肤功能,并且内置两款圣诞皮肤主题...
    日期:07-25
    英伟达股价暴涨「9天市值上涨超9000亿元!英伟达迎史上开年最大涨幅」
    快科技1月15日消息,据媒体报道,英伟达迎来了历史上开年市值最大的涨幅,2024年前两周(9个交易日),其市值暴涨了约1280亿美元(约合9179亿元人民币)。报道表示,在2023年股价大涨近240%之...
    日期:01-16
    大四男学生「大四男生实习薪资1万4妈妈仰天大笑 姐姐回应:要在船上写论文」
    据报道,福建福州一位网友晒出妈妈听到弟弟实习工资后乐得仰天大笑的视频。据博主吕女士介绍,弟弟今年23岁,正在大四实习,还要在船上写毕业论文。弟弟的实习工资大概是一个月1万4...
    日期:06-19
    小米13曝有10款颜色:卖到4500_小米11买那个颜色
    小米目前还没有官宣,但有消息称小米13将会在下周发布,而目前产业链公布了小米13手机的外观,配色高达10款,而且还都采用直屏的方案,而小米13Pro则延续上一代的曲面屏方案。我们先...
    日期:11-29
    博物馆辟谣回南天展柜玻璃起雾:未受天气影响_展柜玻璃起雾解决图示
    3月9日消息,据国内多家媒体报道,广东省博物馆辟谣回南天展柜玻璃起雾”,称网传图片非馆内陈设,博物馆未受天气影响。资料显示,回南天是我国南方地区的一种天气现象,通常指每年3月...
    日期:03-10
    宁德时代电池存在重大缺陷,被暂停向特斯拉供货?回应来了
    凤凰网科技讯6月21日消息,市场传闻宁德时代电池存在重大缺陷,已被特斯拉暂停供货。从市场传出的消息来看,此事与特斯拉在美国享受的一则补贴有关。据了解,6月3日Tesla官网更新Mo...
    日期:06-21
    柯南既视感!华为Watch Buds首曝:手表耳机二合一
    11月初,有爆料称,华为还有一款十分科幻的新品,代号柯南”,彼时有网友调侃,柯南的三大招牌分别为:足球、蝴蝶结、手表,华为要出能发射麻醉针的手表?今日,一款名为华为Watch Buds的包装...
    日期:11-25