您的位置:首页 > 互联网

中山大学与港中深团队给机器人装上灵巧双手,远程精准复刻人类动作

发布时间:2023-11-08 04:27:18  来源:互联网     背景:

在《铁甲钢拳》里,机器人可以完美地模仿人类的动作,不论是热舞还是打拳,都几乎分毫不差,让人大呼过瘾。

不过在现实中要这样控制机器人还是很困难的。特别是如果控制机器人的操作员不在机器人身边,而是远程控制,那就难上加难了。

困难的事情才有挑战性,而且还很有意义。比如在现实中,手术机器人通常就是由一个外科医生远程控制,让机器人精确地捕捉到人的双手运动信息。然后,将捕捉到的运动信息映射到机器人的运动上,才能实现远程操作。不过,现有的手势捕捉方法有些复杂,主要通过数据手套、腕带和光学标记。这些方法不仅价格昂贵,而且校准起来很费时费力。

说到动作捕捉,有XBOX的玩家可能会问,Kinect能否一战?

答案是不能。

微软的Kinect虽然不错,但它只能捕捉到人体的运动,对精细的手部动作也无能为力。其实也不是Kinect特别拉跨,大多数手机应用程序也都只能估算2D手势。

所以这双手运动捕捉可是个老大难问题,就像在计算机视觉领域里摸黑找路。为什么呢?嗯,因为左右手长得太像了,就像双胞胎一样,让人傻傻分不清楚。再加上手势种类多,每个人的手都不一样,这就让检测和区分双手变得更加困难。

▍还得靠神经网络

那有人就要问啦:“那怎么办呢?”别急,科学家们想出了一个好办法:从单张RGB图像中估计3D手势。但这个方法也不是那么容易实现的,因为手势和手势之间的相似性很高,经常让人眼花缭乱。而且手势还会自遮挡。最最关键的是,图像里缺乏深度信息,要猜出3D手势究竟长什么样,真让人脑壳疼。

为了解决这些问题,中山大学联合香港中文大学(深圳)的科研团队提出了一种方便又便宜的好方法。他们先用视觉传感器捕捉操作员双手的位置和姿势。然后,双手运动信息会映射到仿生双臂机器人的运动上。在这个系统中,包括一种通过视觉的双手运动捕捉方法,该方法由DuHandLocaNet和3DHandPoseNet两个部分组成。

DuHandLocaNet用于检测和定位双手的位置,并分辨左右手,这些信息可以映射到机器人的手上。而3DHandPoseNet可以从所捕捉到的人类手部的图片中估计双手的3D姿态,这些3D手势信息可以映射到五指灵巧机械手上。该研究论文以Dual-Hand Motion Capture by Using Biological Inspiration for Bionic Bimanual Robot Teleoperation为名发表在中国科技期刊卓越行动计划高起点新刊《Cyborg and Bionic Systems》上。

现有新的ios更新可用,请从ios12

除了关注人类操作员的手部动作,这个方法还有一个机智的操作,那就是它也同时捕捉人类身体的位置和动作,用来辅助判断手的姿势和左右手。

对啊,在身体左边的是左手,在身体右边的是右手,之前怎么就没想到呢?!

▍先找到双手的位置

DuHandLocNet 可以在RGB图像上检测双手并区分左右手。它使用并行网络,其中一个子网络用于手部检测,另一个子网络用于身体姿势估计,它通过使用身体正向运动学树(body forward kinematic (FK) tree)来输出所估计的双手位置和手性。

DuHandLocNet的表现:下图中从左到右分别是人类操作员手部动作的原始图像,不同人的手有大有小,所做的手势也不一样。手部检测子网络和身体姿势子网络可以准确地检测出的手部和身体的动作。

▍再估计3D手势

在检测到双手后,定位手部的RGB图像会被送进3DHandPoseNet里,这样就能解析出3D手势了。为了能更准确地估计3D手势,这个网络采用了一种级联结构,还引入了损失函数来衡量模型预测结果和真实结果之间的差距。这个网络是由三个模块组成的:一个是特征提取模块(FEM),负责提取2D手关节点的特征;一个是级联模块(CaM),负责微调2D手关节点的特征;最后一个是3D姿势回归模块(PRM),负责回归3D手势。

有了这一顿操作,3DHandPoseNet就能帮我们准确地解析出3D手势了。

从原始图像、输出的2D手势、从相机视角输出的3D手势和从另一个视角输出的3D手势:

▍给Baxter机器人换上一双巧手

Baxter机器人在双臂机器人里早就是红人了(红色的机器人),它能做的事情还真不少,甚至还会叠起衣服这种软绵绵的东西。

但它人生最大的痛是跟人划拳总是输,谁让它只有两根指头呢。

这就等于输在了起跑线上了,那怎么行啊!可让科学家们操碎了心。所以一直有好事者尝试给它装上像人类一样的手掌和5根指头,好让它享受更多自由(成为合格的打工人):

这不,中山大学团队也一样,给Baxter换上了一双灵巧的小手:

既然都这样了,那啥也别说了,开始搬砖吧:用双手搬运一个大箱子,还有用双手将一个杯子插入另一个杯子,看这架势以后也可以去奶茶店试试运气?

实验效果来看,团队所提出的DuHandLocNet和3DHandPoseNet可以很精确地把人类操作员的动作映射到机器人上,证明了这种方法的有效性。未来他们将继续研究更为精准和稳健的双手运动捕捉方法,通过基于视频的手部检测和手部姿态估计技术来提高整体的运动捕捉精度和鲁棒性,甚至还将引入混合现实和共享控制方法,与仿生双臂机器人遥操作相结合,以增强用户的沉浸感和操作效率。

文章链接:

https://spj.science.org/doi/10.34133/cbsystems.0052


返回网站首页

本文评论
我国新能源汽车连续8年世界第一:出口暴涨 老外爱上国产_中国成为世界新能源汽车产销第一大国
快科技5月14日消息,中国汽车工业协会发布的数据显示,2023年前4个月我国新能源汽车产销量分别达229.1万辆和222.2万辆,同比均增长42.8%。电信战略转型的三大重点举措去年全年中...
日期:05-15
谷歌Q2业绩超预期市值大涨6000亿 任期最长CFO高升_谷歌业绩2020
凤凰网科技讯 北京时间7月26日消息,谷歌母公司Alphabet(NASDAQ: GOOG, GOOGL)今天发布了截至6月30日的2023财年第二季度未经审计财报。财报显示,Alphabet第二季度营收为746.04...
日期:07-26
抖音上线聊天软件_抖音上线聊天软件有哪些
声明:本文来自于微信公众号 电商报Pro(ID:kandianshang),作者:月涯,授权转载发布。抖音聊天上线拼命做社交的抖音,又有大动作。近日,抖音官网上线了一款桌面端聊天软件“抖音聊天...
日期:01-04
手机买回来第一次充电注意事项「手机第一次充电注意事项」
随着智能手机的普及,我们几乎都离不开手机了。首次购买手机时,手机的电量可能并不足够我们使用一天,因此我们必须首先为手机充电。然而,很多人并不知道首次充电时需要注意哪些事...
日期:05-29
ALB专访好丽友法总:上上签电子签名助业务管理革新
张剑君   好丽友集团中国区法务及知识产权负责人,总法律顾问   张剑君先生毕业于北京理工大学法学院、日本东京大学法学政治学研究科、公共政策大学院。现任好丽友...
日期:07-15
斯坦福大学研究人员提出MAPTree算法,改进决策树建模
要点:1. 斯坦福团队在论文中提出了MAPTree算法,这是一种基于贝叶斯决策树理论的决策树归纳方法。2. MAPTree可以评估贝叶斯决策树的后验分布,找到数据的最大后验概率决策树,从...
日期:10-09
小黄人投影仪价格「小黄人投影仪震撼上市,送礼的优选」
10 月 7 日,大眼橙小黄人投影仪正式上市,以其独特的外观设计,迅速吸引了一大波用户的关注,成为了家用投影仪市场的新星。无论是送礼还是自用,这款产品都是优选,毕竟谁能拒绝一个会...
日期:10-12
产业版GPT开新路,中国大模型弯道超车的机会来了!
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。GPT系列大模型诞生后,人工智能对话聊天系统就像平地起春雷,在全球爆火。与之同时,国内互联网大厂纷纷「...
日期:05-10
引爆想象力的实验:600条蚊子幼虫放入盐水,竟有神奇结局!_蚊子幼虫的水有毒吗
在一个寂静的实验室里,放大镜下的小昆虫们正经历着一场奇妙的变迁。600条蚊子幼虫被放入盐水中,仿佛是在一片静谧的湖泊中漂荡。看似平静的水面下,却隐藏着让人难以置信的变化...
日期:11-01
谷歌 Chrome 浏览器推出“隐私沙盒”试验功能,用于阻止第三方 Cookie 跟踪
  6 月 2 日消息 在最新的谷歌 Chrome 浏览器 91.0.4472.77 正式版中,【隐私设置与安全性】选项中已经出现【隐私沙盒】试验功能的开关。   官方描述称:   隐私沙盒是...
日期:02-13
HTC新款平板电脑A103 Plus曝光,配备10.1英寸FHD屏幕_htc a9w
HTC新款平板电脑A103 Plus已成功通过谷歌GMS认证,该款平板电脑配备10.1英寸FHD屏幕,分辨率为1200x1920。同时,该平板电脑配备500像素前置镜头,支持面部识别解锁。iphone14pro搭...
日期:06-20
特斯拉上海工厂开始安装车间设备,变电站也在建设中_马斯克称特斯拉加州工厂已满负荷运行,考虑大幅扩建
  3 月 3 日消息,据国外媒体报道,特斯拉 CEO 伊隆・马斯克当地时间周三在他活跃的社交媒体上表示,特斯拉位于加州的工厂已经满负荷运行,他们在考虑大幅扩建。   在社交媒...
日期:07-22
助力长沙打造“中国软件名城” 湖南云天励飞首批签约
云天励飞副总裁王磊(右六)上台签署合作协议   5月8日,长沙市软件和信息技术服务业促进会正式成立,将推动当地软件业发展,助力长沙打造“中国软件名城”。湖南云天励飞信息...
日期:04-07
超级计算机 El Capitan 开始安装 AMD Instinct MI300 人工智能 GPU「超级计算机显卡」
7月6日 消息:美国劳伦斯利弗莫尔实验室(LawrenceLivermoreNationalLaboratory)周三宣布,他们已经开始安装即将在明年完全投入使用的超级计算机ElCapitan的组件。该系统的一个关...
日期:07-06
京东“百亿补贴”提前20小时上线,价格战开打_京东百亿补贴时间
声明:本文来自微信公众号“全天候科技”(ID:iawtmt),作者:张超,授权转载发布。3月5日,全天候科技从知情人士处获悉,京东“百亿补贴”将于3月6日0时全面上线京东App,亮相首页首屏正...
日期:03-06
打个飞的「明年,“打飞的”将成为现实:飞10分钟700元,比汽车快6倍」
“任何新技术的引入都要经过许多步骤才能真正实现。要让它成为人们日常通勤的一部分,还有很长的路要走,但重要的是我们要专注于实现这一目标的步骤,我们确实认为这一点至关重要...
日期:06-19
120W快充、5000mAh电池,iQOO Z8续航太给力了「iqoo8续航时间」
iQOO Z8系列正式发布,除了搭载机圈少有的LCD屏幕,充电和续航也是该机一大亮点。iQOO Z8搭载了120W超级闪充,内置5000mAh大电池,能刷短视频超12小时、或者在线听音乐超55小时,满足...
日期:09-01
4999元起 荣耀MagicBook 14 2023笔记本发布:5项世界第一_荣耀magicbook14 2021上市时间
快科技4月13日消息,荣耀今日下午发布了MagicBook 14 2023笔记本,升级13代酷睿标压处理器,号称是PCMARK10续航第一、边框最窄、性能遥遥领先、护眼最全和智慧互联功能最强大的14...
日期:04-13
马斯克放弃收购Twitter后:后者群龙无首、人心涣散_Twitter 马斯克
Mac和iOS雷蛇essential2020款哈弗h9智享型   讯 北京时间7月29日早间消息,据报道,在埃隆·马斯克(Elon Musk)放弃收购Twitter后,这家社交媒体公司每年营收45亿美元的广告业务受...
日期:07-31
现场拔网线!第四范式版GPT能力首秀,有点不一样
声明:本文来自于微信公众号 量子位 (ID:QbitAI),金磊 发自 第四范式大厦,授权转载发布。国产大模型能大战,又有一员猛将入局。就在刚刚,第四范式自研大模型“式说”(4Paradigm Sage...
日期:04-27