您的位置:首页 > 互联网

思想克隆!前OpenAI研究员让AI模仿人类思维,现实版「机械姬」降临

发布时间:2023-06-06 14:31:18  来源:互联网     背景:

声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。

当AI有了自主意识会如何?

「机械姬」中,艾娃利用人类的同情心,以欺骗的方式诱导人类获得自由,最终杀了自己的「造物主」Nathan。

近来,在众多网友的力荐下,Sam Altman终于看了这部电影。

并表示,「很好的电影,但我不明白为什么每个人都让我看它。」

图片

许多人或许想警示,这就是让人工智能有了意识,通过图灵测试的结果。

但我们离「机械姬」上映的那一幕还很遥远,GPT-5可能在秘密研发中,让AI有智慧仍是科学家集洪荒之力最想做的事。

这不,来自不列颠哥伦比亚大学的2位研究人员发现,智能体能够像人类一样思考有很多的优势。

最新论文中,他们研究了智能体的「思想克隆」(TC)。

图片

论文地址:https://arxiv.org/pdf/2306.00323.pdf

这里,人工智能通过模仿人类,学会像人类一样「思考」和「行动」。

当AI有了思想

要知道,语言是区分人类和其他生物的关键。

因此,研究人员设想,如果智能体能够理解语言,便会有很多的好处。

比如,帮助人类概括、推断、适应新的情况、将新的方式结合已有的知识,探索、计划、并在必要时重新计划。

尽管有这些益处,但AI智能体却很少思考,至少不是用人类语言去思考。

虽然神经网络可以被认为是思考的内部向量激活,但许多人假设,以离散的、符号的语言进行思考具有特定的好处。

这意味着能够用语言思考的智能体,可能比不用语言的智能体学习得更快,表现、概括得更好。

基于所有这些原因,增强AI智能体用语言思考的能力可以产生许多显著的优势。

Jeff Clune和Shengran Hu认为实现这一目标的最有效的方法是「让AI模仿人类思考」。

他们发现,人类不会孤立地获得思维技能,相反,他们一部分技能的获得是通过他人示范和教师提供的反馈来学习的。

因此,一个有效的方法是,让智能体从人类在行动时把想法说出的演示中进行学习。

这一方法不同于现有的用预训练LLMs进行规划的工作,因为这些LLMs没有受过人类在行动时说出想法的数据进行训练,即「思想数据」。

至于「思想数据」的来源,研究者选取了YouTube视频和文字录音,有大约数百万小时,包含了人们行动、计划、决定和重新规划背后的思想。

论文中,研究人员提出了一个新颖的模仿学习框架「思想克隆」。其中,智能体不仅学习人类的示范行为,如行为克隆,而且学习人类行动同时的思考方式。

在思想克隆训练框架中,智能体学习在每个时间步中产生思想,并随后根据这些思想调整行动。

图片

整体框架如图所示,TC智能体是一个双层架构:上层和下层组件。

在每个时间步中,智能体接收一个观察、一个任务和一段思维历史作为输入。上层组件负责思想生成,下层组件产生以这些思想为条件执行操作。

然后,将生成的想法和行动与演示数据集中的基本事实进行比较,以计算损失。

虽然对于上层和下层组件的条件可能有不同的选择,但在这项工作中,对于思维数据集中长度t的特定轨迹,研究人员将其最小化:

图片

对于更复杂或大规模的场景,上层组件可以使用预训练视觉语言模型(VLM)来实现,或者零样本、微调。

而下层组件可以从头开始训练,或者从目标域中现有的语言条件控制器中改编。

论文中,研究人员基于BabyAI1.1模型体系结构的两个组件进行了研究。

该模型利用内存增强架构LSTM来解决部分可观测性的挑战。此外,它还采用FiLM进行模态融合,有效地结合了视觉和文本输入。

淘宝商户抗议事件

这里,作者特别强调,本文中的所有模型都是从头开始训练的,但在复杂领域中还是使用预训练模型更强。

如下图,是BabyAI环境示例,左图中包含了各种颜色的物品(球、钥匙、盒子、门)。

图片

智能体可以拿起、放下、移动物体或者开门和关门,而锁住的门只能用颜色匹配的钥匙打开。

智能体可以看到它前面的7×7的网格单元,这些网格单元是被墙壁和关闭的门阻挡。

「思想克隆」智能体的任务是,到达紫色的盒子(高亮显示) ,并开始规划了路线。

图片

但是当它打开蓝色的门时,准备完成任务,却发现一个紫色的球挡住了去路。于是,思想克隆智能体再重新规划。

图片

由此可以看出,智能体的想法和行动表明,当遇到障碍时,先将其移除,并在继续之前的目标前,重新计划路线。

这一过程,就特别像艾娃如何一步一步策划,让人类最终相信并帮助自己,逃出囚禁已久的玻璃牢笼。

实验结果

研究结果表明,「思想克隆」优于行为克隆。

此外,在零样本和微调设置中,思想克隆在分布外的任务中比行为克隆优势更大。

图片

有趣的是,研究人员还开发了「预犯罪干预」,允许用户在模型训练后仍能定义不安全行为。

当检测到危险的想法时,就能终止智能体。测试中,「预犯罪干预」的效果近乎完美,显示了它在人工智能安全方面的潜力。

「思想克隆」不仅使人工智能更聪明,而且更安全,更容易理解。

图片

就是说,当AI犯罪前,一切还有得救。

在Jeff Clune看来,「思想克隆」有助于人工智能的安全。

因为我们可以观察到智能体的思想:(1)可以更容易地诊断出事情出错的原因,(2)通过纠正智能体的思想来引导它,(3)或者阻止它做所计划的不安全的事情。

图片

亚马逊在平板电脑市场上的激烈之争

作者介绍

Jeff Clune

目前,Jeff Clune是不列颠哥伦比亚大学计算机科学副教授。他主要研究深度学习,包括深度强化学习。

此前,他还是OpenAI研究团队负责人,Uber人工智能实验室的高级研究经理和创始成员。

此前,他和OpenAI团队发布了视频预训练模型——VPT,让AI在我的世界中从视频数据中学习造石镐。

图片

Shengran Hu

目前是不列颠哥伦比亚大学的博士生,对深度学习,人工智能生成算法感兴趣。

参考资料:

https://twitter.com/ericjang11/status/1665453341789536256


返回网站首页

本文评论
新浪微博域名备案_新浪微博用新域名启动分拆上市计划
  新浪微博今天将正式启用新域名weibo.com,同时将启动新版Logo标识。为确保现有用户的正常使用,新浪微博进入双域名并存阶段。在此期间,用户使用新域名weibo.com或者旧域名t...
日期:07-27
谷歌评级遭下调 佩奇对华尔街态度冷淡遭致不满
  导语:国外媒体今天撰文称,虽然谷歌CEO拉里·佩奇(Larry Page)一直以来都不喜欢主动迎合华尔街,但他在上周四的分析师电话会议上对分析师的冷淡态度还是引发了分析师的不满,这...
日期:07-27
奇安信数据安全产品_奇安信发布数据卫士套件 五大举措解决数据安全三大痛点
  奇安信集团在京举办数据卫士套件发布会,正式发布了《数据安全风险分析及应对策略研究报告(2022年)》(以下简称:《报告》)、数据安全五大桔皮书,以及数据安全整体解决方案...
日期:04-09
cacg第一投资「第一批投AIGC的VC开始后悔了」
声明:本文来自于微信公众号投中网(ID:China-Venture),作者:刘燕秋,授权转载发布。01“被GPT-4震慑之后,VC觉得之前投的AIGC项目会被插件替代,快要黄了。”这是我的朋友Ethan最近关注...
日期:04-06
小伙淄博吃烧烤没排上号:老板下跪“求原谅”「淄博烧烤视频」
4月27日消息,据星视频报道,网传山东淄博一小伙没排上号和烧烤店老板起争执,老板下跪求原谅并说我求求你了”。对此,员工回应称,由于只发放200个号,排到男子正好是201号,长时间排队...
日期:04-27
权威发布 | 星环科技入选教育部2022年第二批产学合作协同育人项目企业名单
  近日,教育部高等教育司公布了有关企业支持的产学合作协同育人项目申报指南(2020年第二批)的通知,星环科技入选2020年第二批产学合作协同育人项目申报指南通过企业名单。...
日期:07-10
欧盟电子商务立法「欧洲议会对重新启动的电子商务规则给予最后批准」
欧盟立法者已经最终批准了对集团电子商务规则进行的以在线安全为重点的改革,这是自2000年以来对数字服务法律框架的首次重大更新。理事会的签字意味着《数字服务法》(DSA)已经...
日期:10-06
美股周四:三大股指全线上涨,特斯拉涨近11%,理想涨逾8%_今日美股涨幅最大股票
美国时间周四,美股收盘主要股指全线上涨,道指连续第五天上涨,科技股领涨。美国第四季度GDP略强于预期,提振了投资者对美国经济可能在2023年实现软着陆的信心。道琼斯指数收于339...
日期:01-27
中国铁塔单一来源采购百度智能云服务_中国铁塔商务采购平台
2023/5/29 14:30 中国铁塔单一来源采购百度智能云服务  南山 C114讯 5月29日消息(南山)中国铁塔公开消息显示,公司为进一步支撑能源近期重点项目,提升交付质量,平台创新中心...
日期:05-29
小米13 Ultra新款发布 3款限量色「小米13最新官方消息」
今天一早,小米13 Ultra的白色1Tb版宣布开售,而除此官方宣布推出小米13 Ultra限量定制色,共三款颜色,分别是星空蓝、赤霞橙、银杏黄。发售时间为5月6日上午10点,售价和普通版相同...
日期:05-04
游戏行业步入红利期,TT语音加速融合数字娱乐生态
  游戏的精彩,正从“虚拟世界”逐步扩展到“现实生活”。   《2020年中国游戏产业报告》指出,2020年中国游戏市场实际销售收入2786.87亿元,同比增长20.71%;2020年中国游戏...
日期:07-18
iOS应用开发者被指侵权 苹果称其受许可保护_苹果开发者授权
5月25日消息,据国外媒体报道,近期,Lodsys公司控诉苹果iOS系统应用程序的研发者侵犯了其专利,并威胁将采取法律行动。对此苹果公司回应已拥有该项专利的许可,表示“苹果应用程序...
日期:07-28
百度文心官网「百度搜索整合文心一言,新增“AI对话”」
声明:本文来自微信公众号“三言财经”(ID:sycaijing),作者:三言,授权转载发布。近期,AI大模型在科技圈可谓是“红的发紫”。国内各科技公司纷纷宣布推出自己的大模型。近日,百度搜...
日期:05-11
分析称谷歌将面临比微软当年更多调查(微软与谷歌的对比分析)
  9月6日消息,据国外媒体报道,《CNN》报道认为,谷歌现在就像是新版的微软。   谷歌占据了网络搜索,只消小小地更动搜索引擎,对某些公司即可能造成天差地别的结果。谷歌也用...
日期:07-22
腾讯游戏宣布任命赵增担任IEG互动娱乐事业群IEG Global Head ofAdcanced Data Group
8月12日,腾讯游戏宣布任命赵增担任IEG互动娱乐事业群IEG Global Head of Adcanced DataGroup,以及IEG Global Head of Publishing Technology Platform,负责两个部门的业务及团...
日期:08-19
“TRIZ是创新界的专利金手指”,IEC罗佳获国际TRIZ四级专家证书
  12月7日-8日,第四届MATRIZ(国际TRIZ协会)中国区年会在北京未来科学城召开。本次年会对过去一年中在TRIZ理论推进成功的企业进行了表彰,九阳电器获得 “TRIZ杰出推广企业...
日期:12-15
推特CEO接受马斯克律师问话:为起诉马斯克一案作证「马斯克个人推特」
  讯 北京时间9月26日晚间消息,据报道,Twitter CEO帕拉格·阿格拉瓦尔(Parag Agrawal)今日将接受特斯拉CEO埃隆·马斯克(Elon Musk)律师的提问,为Twitter起诉马斯克一案作证。Spa...
日期:10-01
联想生产厂家工厂在哪里?「联想全球“母本工厂”规模投产 可实现智能产品年产1600万台以上」
5月6日,联想全球“母本工厂”——南方智能制造基地(以下简称南方基地)规模投产。该项目总投资额超过20亿元,将实现智能产品年产1600万台以上,带动上下游企业带来数十万就业岗位。...
日期:05-07
出行差旅助手 高效移动办公首选三星Galaxy Tab S8系列
随着天气转暖,越来越多线下活动与各类展会开始恢复举办,不少职场人也开启了新一轮的出差季,不论是在机场车站的等候室,还是身处活动现场与前往目的地的路上,都有不少打开设备处理...
日期:04-10
iPhone 14 怎么买便宜,咱们比比价_苹果14值得入手吗
iPhone 14 系列基础款和 Pro 款价格正在遭遇冰火两重天,很多小伙伴会私信小编问中关村村里是什么行情。那么咱们就来比比价,疯狂星期四的钱,帮你省出来。目前呢,iPhone 14 和 iP...
日期:10-21