您的位置:首页 > 互联网

北大新成果:无需训练,机器人听指令就能灵活走位_机器人听命令

发布时间:2023-11-07 03:22:37  来源:互联网     背景:

要点:

机器人能听懂吗

1. 北大研究团队开发了一种具身导航系统,使机器人可以根据口头指令在室内环境中移动,无需额外训练或建图。

2. 这一系统涉及多个关键任务,包括指令分析、视觉感知、完成估计和决策测试,由大模型专家团队协同完成。

3. DiscussNav系统通过与大模型专家互动,使机器人能够根据人类指令移动,解决了机器人导航训练数据稀缺的问题,同时具备零样本能力,能够执行多样的导航指令。

11月6日 消息:北大的研究团队近期推出了一项具身导航系统,可使机器人无需额外训练或建图,仅通过口头指令在室内环境中自如移动。这一系统包括指令分析、视觉感知、完成估计和决策测试等多个关键任务,需要不同领域的知识,这些任务由一个大模型专家团队协同完成。

作者启发于现实中专家讨论行为,设计了DiscussNav导航系统,通过赋予大语言模型(LLM)和多模态大模型(MLM)专家角色和任务,构建了具备不同专长的视觉导航专家团队。

特斯拉三季度交付量

防钓鱼邮件安全系统

论文地址:https://arxiv.org/pdf/2309.11382.pdf

任天堂的ns性能如何

在这一系统中,导航机器人会在每一步移动前主动与专家讨论,以理解人类指令中所需的动作和提及的物体标志。然后,它会根据这些物体标志类型倾向性地感知周围环境,估计指令的完成情况,并做出初步的移动决策。

值得注意的是,在决策过程中,机器人会同时生成多个独立的预测结果,并在这些结果之间出现不一致时,向决策测试专家求助,以筛选出最终的移动决策。这一方法不同于传统方法,无需额外预训练,通过与大模型专家的互动,直接解决了机器人导航训练数据稀缺的问题,并具备零样本能力。

DiscussNav系统在经典的视觉语言导航数据集Room2Room上的表现显著超越了所有零样本方法,甚至胜过了经过训练的方法。

研究团队还在Turtlebot4移动机器人上进行了真实室内场景导航实验,结果表明,该系统在真实世界中的表现明显优于之前最优的零样本方法和经过预训练微调的方法,展现出良好的从模拟环境到真实环境的迁移能力。

作者指出,这一系统具备四个强大的能力,包括识别开放世界物体、识别细粒度的导航标志物体、纠正其他专家在讨论中的错误信息,以及排除不一致的移动决策。

此外,作者还提出,深入研究如何有效利用仿真数据和大模型从海量数据中学到的先验知识是未来具身智能研究的发展方向。尽管受到数据规模和真实环境探索成本的限制,但大模型的进展为具身智能提供了新方向,将推动其发展。

在总体上,北大的DiscussNav系统代表了具身导航领域的一项重要突破,使机器人能够根据口头指令自如导航,同时具备零样本能力,这对未来的智能机器人和自动化应用具有重要意义。

华为6月新机发布会


返回网站首页

本文评论
14寸笔记本电脑推荐_14寸笔记本推荐 2020
如今笔记本已经成为了我们日常生活必不可少的一部分,而在14寸笔记本市场中,有很多好的产品供消费者选择。接下来,我们将为大家推荐几款不错的14寸笔记本电脑。同时,奢侈品牌也...
日期:05-30
大众之后,奔驰车机被曝推送广告_网易订阅_奔驰媒体更新
IT之家 9 月 28 日消息,如今广告真是无处不在,电视机有广告、手机有广告,现在连汽车都要推送广告了,而作为交通工具,安全性是最重要的,车机推送广告势必会对行车安全产生影响。近...
日期:10-11
windows10的功能更新,版本20H2安装失败「Windows 11 22H2再出问题 微软确认Windows Hello被更新损坏」
在今天的"Windows 11 22H2这次搞坏了什么"的节目中,下一个登场的是Windows Hello认证系统。根据微软的最新公告,用户在使用Windows Hello登录时可能会遇到问题,如人脸识别、指...
日期:10-14
抖音20万点赞!中国第一本词集竟然是它?里面的内容你一定背过
  传统诗词是中华民族文化的瑰宝,在诗人们的笔下,寥寥数句就能将人的心情描摹得细致入微。直到今天,我们形容思乡之情时依然会用“每逢佳节倍思亲”“但愿人长久,千里共婵娟...
日期:05-16
为了让人多下游戏?特斯拉推出1TB车规级固态硬盘
今天稍早些时候,特斯拉率先为北美地区的Model S和Model X推出了Steam测试版,作为其假日更新”的一部分。据悉,特斯拉的这两款旗舰车型配备了为游戏设计的更强大的AMD Ryzen处理...
日期:12-14
海天酱油包装不一样「海天酱油回应双标:不区分国内外市场、添加剂都有」
最近,全国闻名的海天酱油因为添加剂问题闹得沸沸扬扬:国内售卖的含有食品添加剂,在日本售卖的却零添加,被质疑双标”。对此,海天味业曾发布公告,否认存在双标”,还指责有人借机炒作...
日期:10-12
Facebook App将取代Android的WebView 但不会使用Custom Tabs「安卓手机没有facebook」
当你在其他应用程序中打开一个链接时,它通常会在你的浏览器(如Chrome)或Custom Tabs中启动。Facebook选择在其自己的应用内浏览器中打开网页,该浏览器由Android系统WebView提供...
日期:10-04
联发科MediaTek天玑开发者中心上线 聚焦移动AI技术「联发科天玑公司」
6月9日 消息:联发科宣布,MediaTek 天玑开发者中心(developer.mediatek.com)已于6月8日正式上线,聚焦移动游戏与移动 AI 技术的开发者资源。现在iphone销量如何买新机还是买二手...
日期:06-09
利用IBM Watson Code Assistant重塑IT自动化
作者:Keri Olson,IBM数据和 AI 产品管理总监在当今的数字世界,企业与 IT 领导都在积极转向用自动化来改善运营效率、提高员工生产力,最终提升企业绩效。在 IBM,我们认为企业需要...
日期:05-17
“大漠叔叔”宣布离职!网友担心他步老陈后路_大漠叔叔怎么了
声明:本文来自于微信公众号 直播观察(ID:zhibogc),作者:直播观察,授权转载发布。近年来,随着流媒体的迅速发展,短视频也成为了警务宣传的主要阵地,一些才华横溢的民警也通过直播短视频...
日期:09-30
一加Ace Pro原神限定版真机公布 含定制礼盒「一加原神联动礼盒」
一加Ace Pro原神限定版真机公布没新机将今晚正式发布,一加Ace Pro限定机在设计上融入了大量胡桃的主题元素。在手机后壳的下方,可以看到胡桃头像的蚀刻图案,清晰明了的展现了此...
日期:10-26
可折叠次数倍杀竞品?Find N3狂堆猛料配置拉满_findx折叠屏
日前,OPPO正式官宣全新的大折叠屏手机OPPO Find N3将于10月19日14:30发布,并打出了“影像新世代,也是折叠下一代”的标语,一时间引发众多网友的关注。而随着发布会日期临近,近期...
日期:10-19
理想汽车 CEO 李想:因考虑车型兼容问题延迟数月推出哨兵模式「理想汽车创始人兼ceo李想」
IT之家 4 月 24 日消息,理想 L 系列车型近日正式开启OTA 4.4 升级推送,新增 28 项功能,优化 20 项体验,其中包括新增哨兵模式、LKA Plus 等。随后,理想 CEO 李想发文表示,因考虑车...
日期:04-24
擎朗送餐机器人为上海定点隔离区等地配送物资(擎朗送餐机器人价格)
  武汉疫情牵动着无数网友的心,无人配送机器人品牌及室内无人驾驶专家擎朗智能也是一样,并且付诸行动。从大年初一开始,一直在落实向杭州、上海等全国范围的隔离区捐赠送餐...
日期:07-18
疯狂退货,“逼疯”商家_电商恶意退货
声明:本文来自于微信公众号深燃(shenrancaijing),作者 | 唐亚华,编辑 | 黎明,授权转载发布。90后小雨这个双11从电商平台买了15件衣服,花了大约2000元。到货后试穿了一轮,她最终留...
日期:11-19
印度推出首辆5G救护车 所有设备可在5G网络下运转「5G救护车」
  10 月 4 日消息,印度 10 月 1 日在印度移动大会上宣布正式推出 5G 服务,并将在年内提供给近 75% 的人群,第一阶段覆盖 13 城,2023 年底前推广全国。  据央视新闻报道,大...
日期:10-05
国际空间站迎来首位女指挥官,联盟号宇航员已返回地球「国际空间站三位宇航员」
  IT之家 10 月 1 日消息,随着“联盟号”飞船于美东时间 9 月 29 日凌晨 3 点 34 分从国际空间站 (ISS) 解锁并返回地球,来自意大利的欧空局宇航员萨曼莎・克里斯托福雷蒂(Sa...
日期:10-04
GitLab 宣布推出 ModelOps 人工智能产品计划 股价创下历史最大单日涨幅
6月8日消息:日前软件开发平台 GitLab 的股价上涨超过 35%,原因是该平台宣布计划推出一款有助于利润增长的人工智能(AI)产品。苹果ipados15.1建议更新吗医疗新闻2020GitLab 广泛...
日期:06-08
新浪微博公司注册地_新浪微博已注册境内外独立公司 分拆上市前奏
  6月13日凌晨消息,网易科技上周独家报道了《曹国伟年内将清空MBO股票或为认购微博股份》,关于新浪微博的未来,网易科技又获悉,新浪分拆微博上市已经箭在弦上:除了已在海外及...
日期:07-30
看点、幻核双双关停,腾讯再割“二两肉”
撰文/赵子坤 何畅   编辑/董雨晴   始终难舍的视频化   起初,腾讯看点立足于腾讯的社交生态,以腾讯QQ·看点、QQ浏览器·看点和看点快报App三端为核心,形成“社交×资讯...
日期:08-17