您的位置:首页 > 互联网

斯坦福机器人运动学分析「从ALOHA迈向Humanplus,斯坦福开源人形机器人,高配版人类上线」

发布时间:2024-06-15 12:48:03  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:机器之心,授权转载发布。

人形机器人的Hello World。

说起前段时间斯坦福开源的 Mobile ALOHA 全能家务机器人,大家肯定印象深刻,ALOHA 做起家务活来那是有模有样:滑蛋虾仁、蚝油生菜、干贝烧鸡,一会儿功夫速成大餐:

研究团队来自斯坦福,由三个人共同打造完成。Zipeng Fu 为项目共同负责人,他是斯坦福大学 AI 实验室的计算机科学博士生,师从 Chelsea Finn 教授;Tony Z. Zhao 也是斯坦福大学的计算机科学博士生,导师也是 Chelsea Finn。

现在,继 ALOHA 之后,Zipeng Fu、Chelsea Finn 等人又联合推出了一款新的机器人研究 HumanPlus,不过这次 Tony Z. Zhao 没有出现在作者栏里,而是在致谢名单上。

HumanPlus 团队成员。

这款机器人能够自主的叠衣服,然而即使是2倍速,动作看起来也是慢吞吞:

充当仓库的搬运工,准确的将物品放置在机器狗背上的篮子里:

给大家表演个向后跳的节目,就像人类一样,扎个马步让自己稳妥一点:

可能你都不会弹的钢琴,但这次机器人会了,它不是乱弹一通,仔细听还能听出旋律来:

化身你的乒乓球搭子,来上几个回合没有问题:

骁龙8的手机

像个电脑新手一样,在键盘上努力的敲出HELLO WORLD

打起拳来也是有模有样

值得一提的是,这次斯坦福团队公布了论文、机器人材料清单、数据集以及代码。正如 Tony Z. Zhao 所表示的这是唯一一篇完全开源的论文,虽然我们处在一个前沿的研究时代,但充满了闭源、竞争等其他因素的限制,这个领域需要更多开放的科学,而不是酷炫的演示。

根据材料清单我们推测完成机器人组装大约花费107,945美元。

研究介绍

斯坦福机器人dh参数

论文地址:https://humanoid-ai.github.io/

论文标题:HumanPlus: Humanoid Shadowing and Imitation from Humans

长期以来,人形机器人因其类似人的形态而备受关注。这主要得益于我们周围的环境、工具等都是依据人类形态而设计的,因此人类大小的机器人在解决人类从事的任务上潜力巨大。

通过模仿人类,人形机器人为实现通用机器人智能提供了一个充满希望的途径。

然而,在实际操作中,要让人形机器人从以自我为中心的视角学习自主技能仍然面临挑战。这主要是因为人形机器人在感知和控制方面的复杂性,以及其在形态结构和执行机制上与人类之间仍存在的物理差异。此外,还缺乏一套数据处理流程,可以让人形机器人通过以自我为中心的视角学习自主技能。

斯坦福机器人学

荣耀商城开业

基于此,斯坦福团队开发了一个全栈系统,用于人形机器人从人类数据中学习运动和自主技能。该研究首先基于40小时的人体运动数据集,通过强化学习在模拟环境中训练低级策略。然后将这一策略迁移到现实世界中,从而允许人形机器人仅使用 RGB 相机实时跟踪人体和手部运动,称为 Shadowing 系统。

通过 Shadowing,人类操作员可以远程操作人形机器人来收集全身数据,以便在现实世界中学习不同的任务。基于收集到的数据,随后进行有监督的行为克隆,使用以自我为中心的视角来训练机器人的技能策略,使人形机器人能够通过模仿人类的技能自主完成不同任务。

研究者在定制的33自由度、高180cm 的人形机器人上演示了该系统,通过多达40次演示,该系统可以自主完成诸如穿鞋站立和行走,从仓库货架上卸载物品,折叠运动衫,重新排列物品,打字以及与另一个机器人打招呼等任务,成功率为60-100%。

该研究团队发布的机器人如图2左侧所示,具有33个自由度,其中包括两个拥有6自由度的手指、两个1自由度的手腕和一个有19自由度的身体(包含:两个4自由度的手臂、两个5自由度的腿和一个1自由度的腰部)。

该系统基于 Unitree H1机器人构建,每只手臂集成了 Inspire-Robots RH56DFX Hand,通过定制手腕连接,其中每个手腕配有一个 Dynamixel 伺服电机和两个推力轴承。手和手腕均通过串行通信控制。

机器人头部安装了两个 RGB 网络摄像头(Razer Kiyo Pro),向下倾斜50度,瞳距为160毫米。手指可以施加高达10牛顿的力,而手臂可以举起重达7.5公斤的物品。腿部的电机在操作过程中可以产生高达360Nm 的瞬时扭矩。图2右侧提供了该机器人的其他技术规格信息。

人体部分和手部动作使用 SMPL-X 模型进行参数化。为了重定向身体姿态,研究人员将 SMPL-X 对应的欧拉角复制到类人模型中,即髋部、膝盖、脚踝、躯干、肩膀和肘部。机器人的每个髋部和肩部关节由3个正交旋转关节组成,因此可以视为一个球形关节。机器人的手指有6个自由度:每个食指、中指、无名指和小指各1个自由度,大拇指2个自由度。为了重定向手部姿势,他们使用中间关节的旋转来映射每个手指的对应欧拉角。并且通过使用前臂和手的全局方向之间的相对旋转,计算1自由度的手腕角度。

如图3所示,身体姿势估计和重定向在 NVIDIA RTX4090GPU 上以每秒25帧的速度运行。

实时手部姿势估计和重定向:该团队使用 HaMeR——一个基于 Transformer 的手部姿态估计器,通过单个 RGB 摄像头进行实时手部姿态估计。手部姿势估计和重定向在 NVIDIA RTX4090GPU 上以每秒10帧的速度运行。

该研究将低级策略 Humanoid Shadowing Transformer 制定为仅解码器的 Transformer,如图4左侧所示。

贝尔金二合一无线充电器

在每个时间步中,策略的输入是人形机器人的本体感知和目标姿态。策略的输出是人形机器人身体关节的19维关节位置设定点,这些设定点随后通过1000Hz 的 PD 控制器转换为扭矩。

随机化模拟环境和人形机器人的物理参数见表2。

如图3所示,研究者使用单个 RGB 摄像头实时估计人体和手部姿态,并将人体姿态重定向为类人目标姿态。

如图1所示,人类操作员站在人形机器人附近,将他们的实时全身运动投射到人形机器人上,并使用视线观察人形机器人的环境和行为,确保远程操作系统反应灵敏。

在被远程操作时,人形机器人通过双目 RGB 摄像头收集第一视角视觉数据。通过 shadowing,研究人员为各种现实场景任务提供了一条高效的数据收集管道,从而避免了模拟环境中真实 RGB 渲染、精确软体对象模拟和多样化任务规范的挑战。

与其他远程操作方法相比,Shadowing 系统更具优势。


返回网站首页

本文评论
小米手环支持八达通吗「549元!小米手环8 Pro达达利亚原神定制版开售时间公布」
快科技12月9日消息,小米手环8 Pro原神定制版昨晚已经正式发布,售价549元。第一波放货火速售罄,非常抢手,官方目前公布了预售和发售时间。初次预售12月9日0点-12日9点,订金预售,12...
日期:12-09
vivo折叠屏概念机「轻薄创纪录 vivo X Fold3系列旗舰折叠新品正式发布」
通信世界网消息(CWW)2024年3月26日,vivo正式发布全新一代折叠旗舰vivo X Fold3系列。作为vivo创新技术集大成之作,vivo X Fold3系列的机身重量和厚度不仅较上代机型大幅降低,更以...
日期:03-27
美团两天蒸发4854亿_美团大跌后腾讯辟谣清仓,今年已遭沈南鹏8次减持
作者:陆涵之;;责编:宁佳彦   8月16日,有消息称,腾讯控股(00700.HK)将出售美团(03690.HK)股票,对此腾讯集团市场与公关部总经理张军进行了辟谣。今日港股,包括美团在内的腾讯系股票均...
日期:08-20
微软高管已买-索尼被迫捆绑销售PS5
来源:中关村在线iphone 13 pro max摄像头会刮花吗redmi note12系列入网台铃省电技术据微软与美国联邦贸易委员会(FTC)的诉讼文件中的一封电子邮件透露,Xbox的负责人菲尔·斯宾塞...
日期:09-19
3秒钟,让iPhone用户抓狂_iphone 3秒
  来源:果壳  “如果有人把iPhone的闹钟声当铃声天天用,那你杀了TA也是合理的。”  这是一个真·胡扯网站(bullshit.ist)上的吐槽文章。纵观全文,这篇胡扯报道的主旨只有一...
日期:09-30
研究表明狗能闻出人的压力 准确率超90%!
9月29日消息,英国贝尔法斯特女王大学的一项研究发现,狗能通过嗅觉感知到人类的压力。在研究中,研究人员收集了36人在做数学难题前后的汗液和呼吸样本,并且纪录了他们测试前后的...
日期:10-02
为期10年、1亿美元、10万量子比特:IBM与两所大学合作开发量子计算机量子信息
2023/5/23 16:44 为期10年、1亿美元、10万量子比特:IBM与两所大学合作开发量子计算机  南山 C114讯 5月23日消息(南山)日前,IBM在日本宣布与东京大学、芝加哥大学合作,开展...
日期:05-26
支付宝大额存款需3年提取?不实「支付宝可以存大额存款吗」
  个人账户的高风险操作行为可能影响账户正常使用。为规避风险,用户须规范使用自己的账户,不要轻易与不明账户交易,不要把个人账户出借给他人使用,也不要进行网络刷单、跑分、...
日期:09-28
盒马X会员店落地北京CBD:5公里半径实现最快“1小时达”
10月20日,位于北京大望路商圈的盒马X会员店开业;盒马方面表示,这预示着会员店竞争已经从郊区挺进城市中心。岚图 贾守平据盒马方面表示,该X会员建国路店面积近2万平米,原址沃尔玛...
日期:10-20
剑桥初创公司在训练基于物理定律的 AI 模型_剑桥的创始人
8月2日 消息:剑桥初创公司 BeyondMath 正在训练基于物理定律的 AI 模型。他们的目标是建立一个能够理解宇宙的 AI,甚至能够提出继爱因斯坦相对论之后的统一理论。高通三星电...
日期:08-02
华为nova 10系列/nova 9系列启动HarmonyOS 3公测招募
11月8日消息 华为nova10系列、华为nova9系列现已启动HarmonyOS3公测招募。HarmonyOS3新功能包括智能桌面布局、音频共享等,功能升级带来全新用机体验,大家可以用起来。机型包...
日期:11-12
TikTok电商重返印尼,但更重要的战场已出现 | 焦点分析_tik tok 在印度dau
TikTok的一块心病终于得以消解。12月11日,TikTok官方宣布与印尼GoTo集团达成电商战略合作。TikTok印尼电商业务将与GoTo集团旗下电商平台Tokopedia合并,TikTok获得该合资企业7...
日期:12-12
赛博朋克2077发售首日销量「《赛博朋克2077》更新销量数据:已卖出2000万份」
  9月28日晚间,游戏公司CD Projekt官微宣布,《赛博朋克2077》累计销量突破2000万份。据了解,CD Projekt花了8年时间开发《赛博朋克2077》,成本高达12亿兹罗提(约合人民币17.28...
日期:10-02
董宇辉回应“弼马温”官职:不是弼马温,有职权_弼马温是什么官职
12月21日,东方甄选高级合伙人董宇辉和新东方CEO周成刚现身直播间。对于几天前,他被任命为高级合伙人后出现的弼马温官职作出了回应。他表示,俞敏洪老师打电话向自己解释过:不是...
日期:12-22
微软发现恶意 npm JavaScript包,可从 UNIX 系统窃取数据
  Microsoft 的漏洞研究团队在 npm(Node Package Manager) 存储库中发现了一个恶意 JavaScript 程序包,可从 UNIX 系统窃取敏感信息。   该恶意软件包名为 1337qq-js,于...
日期:04-02
“初代网红”成时代的眼泪!无数女人遭背刺,成大冤种?!_初代快手网红
看!这个东西,你们是不是都很眼熟?当年,ReFa美容仪真的红极一时!线上线下的广告全是它,女明星几乎人手一只。ReFa就是初代网红,对于普通人来说,第一次接触美容圈,都是从它开始的。但是...
日期:12-14
小米下一个代言人或是张颂文「现在小米的代言人还有谁呀」
近日,张颂文在发布微博时,后续的机型显示 小米13 Pro,并且还在网友的评论中回复称“正在试用”。目前很可能小米与张颂文团队正在谈合作,而作为代言人,他本人正在亲自体验产品。...
日期:04-07
双胞胎妹妹降生!大熊猫福宝吃醋了:再也不是爷爷唯一的孙女了
7月15日消息,微博话题福宝吃醋了”冲上热搜榜。据河北广播电视台农民频道官方微博报道,大熊猫爱宝本月顺利产下雌性双胞胎幼崽。雌性大熊猫爱宝”和雄性大熊猫乐宝”今年2月成...
日期:07-16
动画市场迎来《三体》,然后呢?「动画 三体」
声明:本文来自于微信公众号 娱乐独角兽(ID:yuledujiaoshou),作者:桃乐丝,授权转载发布。京东买东西没花钱为什么对于《三体》粉丝们而言,上周六发生了一件大事情。在《三体》IP开...
日期:12-13
从IM向SNS门户管理员转型 MSN 2011突围战打响
  作为全球IM(即时通讯)老大,微软MSN在中国市场一直只能坐第二把交椅。究其原因,不够开放和本地化不足是两大掣肘。而去年11月份发布的Windows Live2011版,就瞄准了上述两大短...
日期:07-25