您的位置:首页 > 互联网

意念操纵机器人成真!李飞飞团队打造,做家务玩游戏样样能行

发布时间:2023-11-11 07:27:46  来源:互联网     背景:

西风 发自 凹非寺
量子位 | 公众号 QbitAI

斯坦福李飞飞、吴佳俊带队让《阿凡达》意念操控照进了现实!

现在,只需要动动脑子就能操纵机器人。

想吃寿喜锅不用自己动手,切菜备菜、倒入食材,机器人一气呵成:



做饭、烹茶样样都行:



忙完还能顺便把桌面清理了:



你以为这就完了?这个机器人玩起游戏来也是一把好手:



甚至还能帮你熨衣服:



关键是,旁边的操纵者只需要坐在那里“冥想”即可,无需手摇摇杆。



能做到这些,都要得益于研究团队最新开发脑机接口系统——NOIR。

这是一个通用的智能系统,使用者无需佩戴侵入性设备,机器人可以从脑电信号中解码人类意图。

并且它还配有一个“技能库”,可以随意组合各种技能完成人类指令,轻松应对高达20项日常任务。

要知道,常规脑机接口系统一般只专注于一项或几项任务。

目前这项研究已收录于机器人顶会CoRL 2023:



围观网友一口一个哦买噶:

  • 哦买噶,游戏规则改变者!



清华叉院助理教授许华哲也来评论区捧场:

  • 哦买噶,赛博朋克!



这个NOIR系统究竟是什么?机器人为何能完成这么多任务?

redmi note11pro系列5g手机怎么样

20项任务轻松拿下

正如上文所说,这个机器人能干的事儿多着呢。

干酪撒粉这种任务也能轻松完成:



拆包裹、整理桌面这种活就更不在话下:





而其背后的这个NOIR系统,简单来说可以分为两部分:模块化解码管线、有原始技能库的机器人系统。

主打一个让机器人自动学习预测人类意图。



具体来说,模块化管线将解码人类意图过程分为三个模块:

1)选择什么对象?

方法是在屏幕上显示任务场景,利用对象的闪烁刺激产生SSVEP信号;每个对象以不同频率闪烁,人类注视某对象时,脑电信号中该频率成分增强。

然后用Canonical Correlation Analysis(CCA)方法,分析不同频率的相关性,确定人类注视的对象。

2)如何交互?

这部分是通过提示人类想象执行某些技能(左手、右手等)产生运动意象信号,然后使用滤波和Common Spatial Pattern (CSP)算法预处理信号。

最后利用Quadratic Discriminant Analysis (QDA)进行4类识别,确定技能选择。

3)在哪交互?

人类想象控制光标的左右运动来选择技能执行的具体参数。同样通过CSP和QDA处理并解码脑电信号,判断人类是左还是右。

研究人员还设置了安全机制,采用肌肉紧张信号来确认或拒绝脑电信号解码结果,避免解码错误导致的风险。



之后,机器人配备了一系列参数化的基本技能,例如Pick(x,y,z)、Place(x,y,z)、Push(x,y,z,d)。

可以组合使用这些技能来完成人类指定的各种任务。



在这个过程中,解码人类意图既费时又费钱。所以研究团队选择让机器人用基于检索的少样本学习,来学习人类的对象、技能和参数选择。

这样一来,在给定一个新的任务时,机器人会在记忆中找到最相关的经验,并选择相应的技能和对象。



举个例子,假设人类在执行抓取杯子的任务,选择了在杯子的某个特定位置抓取(比如杯子的把手)。机器人会记录下当时的图像,以及人类选择的抓取点。

在之后的任务中,当机器人看到新的杯子图像时,它会首先根据预训练模型来分析这个新图像,提取图像的语义特征。

然后计算新图像的特征和之前记录的训练图像特征之间的相似度,找出最相似的一个点,作为它预测的抓取位置。

通过这种匹配图像特征的方式,机器人只需要人类示范一次参数选择,就可以在未来自己预测参数,而不需要人类每次都完全重新选择一遍。



使用NOIR系统,3名人类参与者完成了上面我们所介绍的20项日常活动任务,其中包括16个桌面操作任务和4个移动操作任务。



在测试中,每个任务平均需要尝试1.8次就能成功,平均完成时间为20.3分钟,这其中主要是人类决策和解码耗时,占总耗时的80%。



实验各阶段的解码准确率和其它脑机接口研究差不多,但使用这种方法可以将对象和技能选择时间降低60%,从45.7秒缩减到18.1秒。



作者简介

除了李飞飞教授、吴佳俊教授带队,论文共同一作有四位,分别是:

Ruohan Zhang



Ruohan Zhang是斯坦福视觉与学习实验室(SVL)博士后研究员,同时也是Wu Tsai Human Performance Alliance研究员。

主要研究方向为机器人技术、人机交互、脑机接口、认知科学和神经科学。

Sharon Lee



Sharon Lee是斯坦福大学视觉与学习实验室(SVL)研究生研究员。

Minjune Hwang



Minjune Hwang是斯坦福大学计算机科学研究生,于加州大学伯克利分校获得计算机科学和统计学本科学位,曾在亚马逊、微软和苹果进行研究。

Ayano Hiranaka

斯坦福大学研究生,本科毕业于伊利诺伊大学香槟分校。

论文链接:https://arxiv.org/abs/2311.0145

参考链接:
[1]https://twitter.com/drjimfan/status/1722674119794434187
[2]https://twitter.com/ruohanzhang76/status/1720525179028406492


返回网站首页

本文评论
小米ultra对比苹果13「小米13 Ultra样片公布,三颗镜头参数出来了」
4月12日消息,小米13 Ultra正式定档4月18日,小米表示,小米13 Ultra是小米徕卡联手打造的又一历史级作品,是小米影像战略升级「第二章」。小米13 Ultra首批样片同期公布,八张样片来...
日期:04-13
大学生下乡务农「10万95后回乡“务农”」
声明:本文来自于微信公众号 字母榜(ID:wujicaijing),作者:彦飞,授权转载发布。在创业失败、背上60多万元外债后,李诗宣决定回乡务农。李诗宣1996年生于山西吕梁文水县的刘胡兰镇,2...
日期:10-04
认领“低碳搭子”乐享数智双节_低碳认证产品目录
通信世界网消息(CWW)当前city walk等低碳环保生活方式成为越来越多人的选择。双节将至,国民出行热情高涨,如何在双节出行中延续低碳环保的消费理念和生活方式?中移互联网创新研发...
日期:09-29
天猫双11波今晚8点开买_今天是不是双11
10 月 31 日消息,天猫双 11 第一波将于今晚 8 点开买。多个第三方机构对双 11 商品进行的价格测评结果显示:今年的天猫双 11 商品到手价普遍在5.5-6. 8 折之间。记者从天猫获...
日期:11-02
天猫调整交易时效规定中部分场景下退款原因描述_天猫退款时长考核
10月9日 消息:日前,天猫平台发布关于调整《天猫交易时效规定》中部分场景下的退款原因描述的公告(以下简称公告)。显卡原封未拆有可能是矿卡吗天猫表示,为了使消费者在天猫平台...
日期:10-16
厚积薄发,新东方智慧教育共建智慧教育行业新业态「新东方教育科技集团发展战略」
我国智慧教育正处于高速发展阶段,不断迈向国际领先水平。在这个过程中,新东方智慧教育作为行业的佼佼者,已经取得了显著的发展成果,赢得了广泛的市场认可。三星s10的边框颜色一...
日期:05-05
宠物险,收割4000万年轻铲屎官
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者: 陈梅希,授权转载发布。溜溜是一只英国短毛猫,来到张家不久,就被诊断出猫传腹。猫传腹,全称猫传染性腹膜炎,是猫咪的重...
日期:09-06
即时物流:一年送出300亿单的中国物流新江湖「2000家物流」
声明:本文来自微信公众号“创业最前线”(ID:chuangyezuiqianxian),作者:代萍,授权转载发布。在即时物流市场内部,一个“新江湖”显露雏形。iPhone14现货开售当天,美团无人机仅耗时...
日期:10-03
谷歌推出Chrome浏览器用户追踪屏蔽广告工具_谷歌浏览器关闭广告拦截器
  北京时间1月25日早间消息,谷歌将推出一款工具,帮助Chrome浏览器用户屏蔽广告主的追踪行为。   广告主经常会通过追踪用户的浏览习惯来发布精准广告,而这款名为“Keep My...
日期:07-26
北京移动宽带优惠套餐「战汛情保宽带!北京移动护航生活入正轨」
通信世界网消息(CWW)台风“杜苏芮”强势来袭,引发了京津冀等地的极端强降雨,北京部分地区洪涝地质灾害严重,防汛形势异常严峻。中国移动北京公司(北京移动)联动铁通公司提前部署,加...
日期:08-07
4699元起!AYANEO 2S掌机发布 能玩大游戏。_aya neo掌机多少钱
AYANEO正式发布了AYANEO 2S和GEEK 1S两款掌上电脑,这两款搭载R7 7840U的新款掌机预定价为4699元起,目前已经开始发货。唯品会和京东联合会员iphone 5g芯片如果电动车续航1000...
日期:06-21
英伟达8月24日发布第二财季财报 预计营收将超过100亿美元
8月17日消息,据外媒报道,在生成式AI带来的高性能GPU需求激增的推动下,英伟达也成为了芯片领域业绩相对乐观的公司,他们在截至4月30日的2024财年第一财季71.92亿美元的营收,同比虽...
日期:08-17
微软 Edge 浏览器 Canary 版现已支持打开 Office 文档_文件已在microsoft edge中打开
  微软 Edge 浏览器正式版目前为 89 版本,每日更新的 Canary 预览版目前已经来到了 90.0.803.0 版。根据外媒 Techreader 消息,这款浏览器已经支持打开多种 Office 文档,此...
日期:07-16
谷歌已完成收购移动广告网络公司AdMob_谷歌是世界上最大的广告商
  5月28日消息,据国外媒体报道,谷歌星期四称,它已经完成了收购移动广告网络公司AdMob的交易并且正在急切地把AdMob的技术集成到谷歌的服务中。   谷歌负责产品管理的副总...
日期:07-29
荣誉价格「荣誉90系列将于29日发布,有四种颜色选择和高端功能」
荣耀90系列将于29日发布,有两款型号,荣耀90和荣耀90 Pro,都采用四曲面屏幕和窄边框。pro版将有一个药丸形的打孔和一个200万像素的主摄像头,3200万像素的长焦人像透镜,3840hz的四...
日期:05-19
中兴Axon Pad官宣:四等宽窄边 支持一触互联
快科技4月8日消息,中兴手机官宣,将在4月12日举行的中兴行业终端峰会上发布中兴Axon Pad平板电脑。从官方海报中可以看出,新款平板采用四等宽窄边设计,配合直角中框,看起来十分轻...
日期:04-08
半年抖音销售额近1个亿,4个品牌背后的4种打法,哪种适合你?_抖音上的销售量是真的吗
声明:本文来自于微信公众号 楠开口(ID:nnvoice),作者:Sally楠,授权转载发布。最近很多小伙伴对于抖音内的投放以及直播间的数据有一些疑问:1、抖音内爆帖的定义是什么?2、怎样判...
日期:11-13
对抖音和腾讯视频达成合作一事的简短评论「抖音和腾讯有合作吗」
声明:本文来自于微信公众号 互联网怪盗团(ID:TMTphantom),作者:裴培,授权转载发布。4月7日,抖音和腾讯视频官方分别宣布,双方已达成合作,“将围绕长短视频联动推广、短视频二次创作...
日期:04-08
女子模仿网红穿搭遭对方粉丝网暴!法院判网红连续15天道歉、赔偿
网络暴力的情况经常出现在我们身边,尤其是网络上不同阵营之间的对立,或者某些人、品牌的粉丝,总是见不得不顺应自己想法的事情,抄起键盘一顿攻击。不过,最近一位网友因为被网暴起...
日期:03-25
马斯克怒赞iPhone15拍照功能:我要买苹果15
9月25日 消息:特斯拉CEO埃隆马斯克在社交媒体上公开赞扬了苹果即将发布的iPhone15的拍摄效果,并在苹果CEO蒂姆库克的帖子下留言表示自己也要购买一部。这个消息引起了广泛的...
日期:09-25