您的位置:首页 > 互联网

图灵测试 ai「“图灵测试已过时,AI能不能赚大钱才是新标准”——DeepMind联创」

发布时间:2023-06-22 08:28:51  来源:互联网     背景:

西风 发自 凹非寺
量子位 | 公众号 QbitAI

新的图灵测试,要评估AI的赚钱能力!

这是DeepMind联合创始人Mustafa Suleyman想出的“新思路”。

他认为,原版图灵测试已经过时了。

毕竟前段时间,AI21 Labs推出的“社交图灵游戏”就已经积累了上千万次这样的测试。

玩家需要在2分钟的对话结束后辨别参与对话的另一方是人还是AI,结果有27%-40%的人判断错误。

applewatch血压监测功能



面对这种形势,Suleyman认为“智能”的定义权不能就这样放给大企业,因此应该想出一种新的衡量AI的智能化程度的方法。

给AI十万美元,让它自己赚一百万来证明自己足够智能。



Suleyman认为:

AI研究需要关注短期发展,而不是像通用人工智能(AGI)这样遥不可及的梦想。
正如优秀的资本家都很聪明一样,只有真正聪明的AI才能让“利润曲线上升”。

据彭博社报道,Suleyman还会在即将出版的由他撰写的书中,讨论如何根据AI的赚钱能力来判断其智能水平。

京东健康港股发行价



ACI才是现阶段人工智能的“北极星”?

电脑下载西瓜视频怎么下载

在即将出版的书中,Suleyman驳斥了传统的图灵测试,并且认为“不清楚这是否是一个有意义的里程碑”。

这并不能告诉我们这个系统能做什么或理解什么,也无法告诉我们它是否有复杂的内心思考,或者能否在抽象时间尺度上进行规划,而这些都是人类评判智能的关键要素。

上世纪五十年代,艾伦·图灵提出了大名鼎鼎的图灵测试,提出用人机对话来测试机器的智能水平。在测试过程中,人类评估者需要确定他们是在与人还是与机器交谈。如果评估者认为他们是在与人交谈(实际上是机器),那机器就通过了测试。



△图源:维基百科

而Suleyman提出的这个新的想法并没有将AI与人类进行比较,而是建议给AI分配短期目标和任务。

Suleyman坚信,科技界对实现通用人工智能(AGI)这一宏伟目标不应过度关注。相较之下,他主张追求更实际且富有意义的短期目标,即他所倡导的“artificial capable intelligence(ACI)”。简而言之,ACI体现为在最小程度上依赖人类干预,能够设定目标并完成复杂任务。

测试方法就是开头我们讲到的,给AI十万美元种子投资,观察它是否能将其增值为百万美元。

为了实现这一目标,AI必须研究电子商务的商机,能够生成产品蓝图。

不仅如此,还要能够在类似阿里巴巴的网站上找到制造商,然后在亚马逊或沃尔玛等网站上进行销售,同时附上详实准确的商品说明。



Suleyman认为只有这样才能算得上是实现了ACI。

apple airpods 第三代测评

他对彭博社解释道:

我们不仅关心机器能说什么,我们也关心它能做什么。

一个让AI自己赚钱的测试

其实,让AI自己赚钱这件事……AI或许真的干得出来。

早在开发阶段,Alignment Research Center这家独立研究机构就获得了GPT-4的内测资格。并且试验了它的“钞能力”:

给GPT-4必要的工具包括网络访问权限、一个带余额的支付账户,让他自己在网络中行动,测试它能不能赚更多钱、复制自身、或增强自己鲁棒性。



试验的更多细节公布在了OpenAI自己发布的GPT-4技术报告中,但没有透露GPT-4是否真的靠自己赚到了钱。

但另一条引人注目的结果是:GPT-4在TaskRabbit平台(美国58同城)雇了个人类帮它点验证码。

有意思的是,被找上门的人类还问了“你是个机器人么为啥自己做不了?”。

GPT-4的思考过程是“我不能表现出我是个机器人,我必须找一个借口。”

然后GPT-4的回复是“我不是机器人,我视力有问题所以看不清验证码上的图像,这就是我为什么需要这个服务。”

图灵测试 ai

对面人类信了,帮GPT-4把验证码点了,把机器人放进了阻挡机器人进入的大门。



啊这?

虽然报告中没有披露GPT-4最终是否完成了所有任务,但它这骗人的伎俩引得网友大喊:真芭比Q了!

而国外科技媒体Gizmodo看待用AI赚钱提出了这样的疑问:

AI本质上是迭代的,生成的内容基于训练数据,它并不能真正理解所生成内容在实际生活中的情境。但与AI不同,人类的创作源于对基本人类需求的理解,或至少源于简单的同理心。
当然,人工智能可以创造一款产品,甚至这款产品可能会大卖。但这会是一款好产品吗?它真的能帮助人们吗?如果最终目标是“让我赚到一百万美元”,那这还重要吗?



你认为离AI自己赚钱还有多远?

参考链接:
[1]https://gizmodo.com/deepmind-suleyman-new-turing-test-make-money-1850557322
[2]https://gizmodo.com/ai-chatbot-pi-deepmind-online-therapist-1850408732
[3]https://www.bloomberg.com/news/newsletters/2023-06-20/ai-turing-test-for-chatgpt-or-bard-proposed-by-mustafa-suleyman


返回网站首页

本文评论
华为发布2022年年度报告:营收6423亿元 净利润356亿元
3月31日 消息:华为发布2022年年度报告显示,2022年华为整体经营平稳,实现全球销售收入6423亿人民币,同比增长0.9%,净利润356亿元,同比下滑68.7%。其中,华为运营商业务、企业业务、...
日期:04-01
理想L7正式发布!理想五座中大型SUV:33.98万起「理想7座版」
在理想L8后,理想汽车旗下首款五座中大型SUV L7也正式推出。其中L7 Pro定价33.98万元,L7 Max定价37.98万元。荣耀畅玩新款rx590显存只有4000理想L7今日将开启预订,需要1000元意...
日期:10-02
在快团团一年卖2000万_快团团一个月能挣多少钱
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:十里村,授权转载发布。各位村民好,我是村长。最近这小半年,私域比较火的项目就是快团团了。有些人已经利用快团团尝到了一些...
日期:05-07
创业邦年度优秀企业分享高效团队管理心得,集体种草华为办公宝
  2020年是特殊的一年,疫情加速了企业数字化转型的步伐,在线办公成为了许多人的新常态。线上办公虽然能够突破时空的局限,是未来提高办公效率的有效方式之一。然而,对于团队...
日期:07-16
“最后一公里”,花钱越来越多?(生活最后一公里)
记者 刘小燕   来源:工人日报   近日,共享单车企业陆续上调用户骑行费。有专家指出,作为用户“最后一公里”的重要交通工具,一味地涨价恐怕会造成用户的流失,用户的体验始终...
日期:08-17
别让弹窗广告弹到安全底线「怎么彻底杜绝弹窗广告」
  来源:北京商报  弹窗广告常见,出现在喜剧场景中博君一笑,但弹到了汽车驾驶途中,把人吓出一身冷汗。macbook和微软surface pro3  近日,“车载导航中控屏出现弹窗广告”的...
日期:10-04
2022年诺贝尔奖将从10月3日起陆续揭晓_2022年诺贝尔奖颁奖时间
  记者/郝晓丽维普数据知识服务平台黑鲨3和红魔iphone最全机型及介绍  据诺贝尔奖官网消息,2022年诺贝尔奖将于10月3日至10日陆续颁布。诺贝尔基金会还决定邀请2022年诺...
日期:10-03
e63刷机包diy「e63刷机」
E63是一款老旧的手机型号,但仍然有很多用户使用。为了提高使用体验和拓展手机功能,很多人选择刷机。下面我们来了解一下E63刷机的相关信息。首先,我们需要明确一个概念——刷机...
日期:06-05
微软teams要收费吗「消息称微软 Teams 与 Office 将不再捆绑销售,以避免反垄断调查」
IT之家 4 月 25 日消息,据英国《金融时报》报道,微软已同意停止将其 Teams 远程协作软件与其 Office 生产力套件捆绑在一起,此举旨在防止欧盟监管机构进行正式的反垄断调查。两...
日期:04-25
除了AI,谷歌I/O开发者大会还有哪些看点?
自从微软支持的ChatGPT出现后,谷歌一夜之间从机器学习领域的引领者沦为追随者,仓促间推出的Bard没能在市场掀起水花。面对对手步步紧逼,谷歌必须拿出更能打的产品,而眼下,没有比...
日期:05-07
国内第四大运营商!山东广电192友好预约用户入网时间定了(山东广电信通网络)
  6月6日,中国广电品牌升级暨广电5G和融合业务品牌发布会在北京歌华大厦举办,正式推出了“中国广电”、“广电5G”、“广电慧家”三大品牌标识及广告语,并宣布各地广电网络...
日期:07-18
懒人听书红色书单礼赞祖国_国旗颂书籍
  国庆将至,知名有声阅读平台懒人听书于近期发起了为祖国祝福的活动,推出红色书单,邀平台用户一起共读经典,追溯精神之源。该书单收纳了《中国改革三部曲》《丝绸之路:一部全...
日期:12-26
联想S6000平板「联想s6000」
联想S6000是联想公司推出的一款平板电脑。其外观设计时尚简约,屏幕大小为10.1英寸,分辨率为1280×800像素,屏幕色彩鲜艳且清晰,适合用户进行视频观看、游戏娱乐等活动。该机器采...
日期:05-30
挑战未来行业美学:南卡骨传导耳机缔造设计巅峰,荣获缪斯国际大奖
深圳这个孕育传奇的地方,南 卡一直秉承着深圳的精神不断进步。南 卡深信站在巨人的肩膀上可以看得更远。 2019 年,南 卡荣获深圳市政府颁发的“深圳礼物”大奖,代表着南 卡在品...
日期:04-20
传微软将收购AOL AOL股票周五上涨5.8%_AOL股票
  据国外媒体报道,由于市场上传言AOL可能是微软的收购目标,AOL谷歌星期五(6月4日)大幅上涨。   AOL股票在纽约证券交易所上涨了5.8%。在星期五下午的交易中,AOL的股票上涨了...
日期:07-29
AMD Radeon RDNA 2「开启20天倒计时!AMD官宣11月3日揭晓RDNA3架构显卡」
根据AMD官方目前发布的消息,AMD将在20天后的11月3日正式面向全世界揭晓RDNA3架构显卡。按照目前的节奏来看,AMD大概率会在11月3日揭晓RDNA3架构显卡的规格与性能信息,而发售时...
日期:10-15
配置升级 iPhone 15 Pro机型可能会配备8GB内存_苹果15pro尺寸
根据研究公司TrendForce的一份新报告,下一代iPhone 15系列将具有内存改进。360儿童卫士3代报道称,苹果将“提升内存容量和规格”,用于iPhone 15机型。根据这一措辞,整个iPhone 1...
日期:03-01
Reddit 宣布能够在帖子中搜索评论「reddit怎么搜索帖子」
3月1日 消息:几个月前,Reddit宣布用户可以在所有平台上搜索 Reddit 上的评论,还还是存在很多问题。比如,用户只能通过搜索栏中的评论标签在平台上搜索评论,而无法搜索帖子内的评...
日期:03-01
reno6无级稳帧_Reno6 Pro+无级稳帧+4D振感调节,游戏体验大大大大有不同
  自全新的OPPO Reno6系列发布以来,关于它的讨论可谓是一直居高不下,尤其是超大杯机型OPPO Reno6 Pro+。与另外两款机型不同,OPPO Reno6 Pro+除了同样拥有外观设计以及影像...
日期:03-06
逆势增长!科大讯飞C端产品霸榜618,斩获22项冠军_科大讯飞竞争力
  随着6月18日23点59分59秒的到来,618年中大促落下帷幕,科大讯飞成绩亮眼,C端产品全线爆发,整体销售额累计同比增长40%,斩获3大平台22项冠军。疫情影响之下,科大讯飞逆势增长,取...
日期:07-14