您的位置:首页 > 互联网

机器人ChatGPT来了,80亿参数、前OpenAI人员经数年打造_机器人t1

发布时间:2024-03-13 10:30:08  来源:互联网     背景:

声明:本文来自于微信公众号 机器之能(ID:almosthuman2017),作者:关注生成AI用例的,授权转载发布。

严格地说,是“拾取与放置任务”版本的ChatGPT来了。除了自然语言交流,还能像Sora一样生成视频。

有了机器人基础模型RFM-1,使用简单英语就能指导机器人完成拣选工作。

机器人 AI 公司 Covariant CEO Peter Chen坐在一个聊天机器人面前,界面和 ChatGPT 的很像。

“给我看看你面前的运送箱,” 他输入一段文本。然后出现了一段视频,一个机械臂悬在一个装有各种物品的运输箱上——里面有一双袜子、一管薯条和一个苹果。

聊天机器人可以和你讨论它看到的物品,也可以操纵它们。接着,Chen 要求它去抓一个水果,只见机械臂伸向苹果,轻轻抓住苹果后将它移到附近的另一个箱子里。

这个聊天机器人是该公司迈向“机器人 ChatGPT ”的重要一步。人们希望 AI 最终能够解决长期以来的编程难,并让它们做更多的事情。“在这一点上,说基础模型是机器人技术的未来是没有争议的。” Chen 说。今天,Covariant 正式宣布推出机器人领域的通用基础模型 RFM-1。因为整合了语言数据,Chen 用简单英语就能指导机器人完成拣选工作。

更为重要的,“基础模型”意味着 RFM-1可以接受更多数据的训练来完成更多的事情——目前都是关于仓库操作的任务,因为这就是它所接受的训练,但它的功能可以通过向其提供更多数据加以扩展。

“对于完成各种拾取和放置任务来说,现有的系统已经足够快速和灵活。” Covariant 联合创始人、机器人学习先驱 Pieter Abbeel 说,像 RFM-1这样的模型可以让机器人更流畅转向新任务,走得更远。所谓远,既包括完成任何任务,也包括接入任何具身(不排除人形机器人),为全球数十亿机器人提供动力。

野心不小的 Covariant 成立于2017年,由加州大学伯克利分校电气工程和计算机科学教授 Pieter Abbeel 和他的三位华人博士生 Peter Chen、Rocky Duan 以及 Tianhao Zhang 创立。Abbeel 在2016年成为 OpenAI 早期员工,就在 Chen 加入该公司一个月后。Rocky Duan 也曾担任 OpenAI 的研究科学家。后来他们离开 OpenAI,希望将 AI 从比特世界落地到真实世界,打造像人类一样通过推理来适应现实场景的机器人产品。

Covariant 核心技术是被称为“ Covariant Brain ”的机器人大脑(软件),主要部署在工业机械臂上。最初他们专注于拣选用例是因为可以创造真实价值——客户愿意掏腰包支付软件费用。不过,对于 Covariant 来说,最令人兴奋的部分是过去四年积累的大量现实世界的数据。

“完成我们正在做的事情的唯一方法是让机器人部署到世界各地真实客户现场,收集大量数据,”Abbeel 说。“这使我们能够训练一个具有独特能力的机器人基础模型。”

与 ChatGPT、谷歌 Gemini 和其他聊天机器人一样,机器人大军收集的来自真实世界的数千万条高质量多模态机器人数据(包括静态数据、动态视频、关节角度、力读数、吸盘强度等机器人操作中涉及关键数据),训练出80亿参数规模的 RFM-1,可以帮助机器人更像人类一样思考。

在真实世界中接触到各种拾取和放置物体对象,比如易变形、被高度遮挡、材质各异、不规则外形等,建立对真实物理世界的理解。

在不断变化的仓库环境中24/7全天候运行,系统也可以发现实验室的环境中难以遇到的长尾边缘案例。

零跑香港上市

凉山up主

新出的四个摄像头的手机

我们可以将 RFM-1视为一个视频生成器(就像 Sora )。输入拾取某些物体的命令,系统会使用其训练数据(形状、颜色、大小等)来识别面前与该描述最匹配的物体。然后生成视频,预测自己试图拿起这个物体时可能发生什么,并确定最佳行动方案。

下面是一个类似图生视频功能。输入初始图像(类似图片提示),RFM-1即可生成相应的动态视频。本质上是一种模拟,以过去所有训练数据为基础。

上面两张图都是作为输入的初始图片,对应的下方动态内容是模型的输出,预测自己执行这一任务会是什么样子。

再比如,如果你想知道把一个圆柱体的物品放到传送带上会发生什么?也可以让 RFM-1生成视频,它能准确显示圆柱体翻转和滚动的样子(比 Sora 还精准),因为在此之前它已经看过很多东西被放置在不同传送带上后的状态。这些视频在仓库业务中可能没有实际用途,但它生动显示出机器人对周围世界的理解。

除了生成视频的能力,现在任何人都可以在几分钟内通过自然语言指导机器人执行特定操作。

chatbot机器人

在遇到问题时,RFM-1甚至赋予机器人求助的本领。它们会将遭遇的困难直接告诉操作人员,并根据新建议尝试完成任务。

值得注意的是,虽然 RFM-1最大亮点就是泛化能力,但泛化能力有限——“......它目前不能泛化到完全新的对象或情况。” Abbeel 表示。换句话说,如果你希望机器人拿起一颗螺丝并把它拧进去,或者剥一块生姜,这并不是一个真正有关拾取和放置问题,RFM-1暂时无能为力。目前, RFM-1也主要销售给只做某些仓库任务的公司。另外,就像ChatGPT也会有幻觉并出错,RFM-1也有不理解要求并掉落东西的时候。错误的风险与成本取决于场景,制造等领域的容错率非常低。

不过,Abbeel 相信,只要有足够的数据,有用的世界模拟将是可能的。“从现在起的5年里,我们建造的将是唯一一种任何人都会使用的模拟器。”这是一个更强大的模拟器,一个从建造之初就带有碰撞检测等元素的模拟器。所有这些东西都很难以任何方式构建到你的物理引擎中,更不用说让事物看起来像真实世界中的渲染器——“在某种意义上,我们正在走捷径。”

为了扩展 RFM-1的能力,以实现为“全球数十亿机器人”提供动力的基础模型的长期愿景,下一步是向它提供更多数据。“我们基本上已经构建了一个数据收集引擎,”Abbeel 说。“如果你愿意向我们提供不同类型的数据,我们也会收集这些数据。”

但是,这也会导致另一个局限性 —— 商业可行性。1X AI 副总裁 Eric Jang 提到过目前三种扩张机器人部署规模的路子。除了耳熟能详的传统编程方法,一种是以特斯拉、1X、Figure.ai 这些人形机器人为代表的全栈路线(既做本体硬件也研发通用系统软件),另一种就是 Covariant 这种纯软的方式——建立一个“全能的大脑”控制机器人,每台机器人的硬件供应商都会来找你,要求接入“全能大脑”的 API 。

如果你能建立一个别人无法建立的模型,就能获得丰厚的软件利润,每个人都给你他们的数据。GPT-4可能是最好的例子。但是,这种方法的缺点是涉及大量数据,你的硬件合作伙伴可能不想给你数据,他们的客户也不想给你数据。

RFM-1目前尚未部署在人形机器人上,虽然它可以学习控制训练数据中没有的类似硬件(甚至人形机器人?),但一家人形机器人公司又会基于什么样的动机愿意将数据共享给你呢?

对此,Chen 表示,“我们的宗旨是帮助他们走进现实世界。”“我认为,真的没有多少公司拥有 AI,可以让他们的机器人在生产环境中真正自主。如果他们想要强大、能够帮助他们进入现实世界的 AI,我们确实是他们的最佳选择。”

也就是说,虽然每个机器人公司都可以单独训练自己的模型,但对于任何试图实现与现实交互操作的模型来说,其性能可能远不如使用 RFM-1。

参考链接

https://covariant.ai/insights/introducing-rfm-1-giving-robots-human-like-reasoning-capabilities/

https://spectrum.ieee.org/covariant-foundation-model

机器人org

https://www.wired.com/story/quest-ai-chatbots-a-hand-arm-robots/?utm_source=twitter&utm_brand=wired&utm_medium=social&mbid=social_twitter&utm_social-type=owned


返回网站首页

本文评论
中国电信广东地区崩了?客服回应:全省基站故障「中国电信 广东」
广东省的不少电信用户下午发现手机没信号,据当地网友反映,电信手机卡显示无服务,不能打电话、发短信、上网,或者打电话时听到空号或关机的提示,重启手机也没用。目前,其他省份似乎...
日期:06-09
ChatGPT正式被美国调查:虚假信息泛滥「chat coin」
通信世界网消息(CWW)7月14日,美国联邦贸易委员会(FTC)宣布正式调查ChatGPT,重点是ChatGPT是否因发布虚假信息,伤害到相关个人,这也是美国监管部门首次对AI聊天机器人进行风险审查。m...
日期:07-15
英特尔Lakefield 3D堆叠芯片曝光:超低压5核心,性能比肩奔腾G5400
  9月3日消息 根据Tom's Hardware报道,英特尔即将推出的3D堆叠处理器代号为Lakefield,@TUM_APISAK最近发现这款芯片在3DMark中的数据,一起来看一下吧。   3DMark数据显示...
日期:01-05
微信公众号“史诗级”优化:图片终于可以改了「公众号图片修改怎么弄」
一直以来,微信公众号的内容修改都是一个令人头大的问题,为了修改几张图片不得不删掉文章重发,或者干脆放置不管的情况并不少见。快科技8月15日消息,今天,有用户发现,微信终于为公...
日期:08-15
行业首款!中国联通完成RedCap工业路由器商用能力认证测试「联通最新路由器」
通信世界网消息(CWW)近日,中国联通5G物联网OPENLAB开放实验室(以下简称“OPENLAB实验室”)携手厦门四信完成行业首款商用RedCap工业路由器终端的创新孵化并完成能力认证测试,颁发...
日期:08-04
AMD首秀锐龙AI:火眼金睛 还不费电_amd锐龙散热怎么样
如今,AI已经无处不在,无论应用场景还是实现方式都是多种多样。AMD Zen4架构的锐龙7040H/HS系列处理器,就首次内置了XDNA AI引擎,这也是全球首款集成AI引擎的x86处理器。锐龙的所...
日期:06-06
短剧收费乱象频发:有老年人充值4万_老年人优惠卡充值
3月12日消息,据国内多家媒体报道,当下大火的微短剧存在诱导付费、收费金额高和重复收费等乱象。一位网友爆料,他的家人为了追剧疯狂氪金”,陆陆续续充值了4万元。据了解,当事人看...
日期:03-13
魅族延保在哪里购买「魅族延长3年质保 魅族20系列全量覆盖」
今天魅族在上午官宣,在今年6月20日前购买魅族20系列手机、并于6月27日前激活手机的用户,均可获得3年的超长质保服务。此次3年超长质保服务将“全量”覆盖魅族20系列手机用户。...
日期:05-15
阿尔特曼重返OpenAI董事会,持续4个月的“宫斗戏”暂告段落_阿尔 特
3 月 9 日消息,根据彭博社报道,山姆・阿尔特曼(Sam Altman)经历了长达数月的审查之后,近日已重返董事会。此外报道称 OpenAI 董事会还新增了 3 名外部董事会成员。作为重返 OpenA...
日期:03-09
比特币看涨看跌「追随股指 比特币价大跌3.4%下破20000美元大关」
加密货币反映了全球市场的情况,在杰罗姆·鲍威尔警告不要过早放松政策后,比特币跌破了过去两周交易的狭窄区间的底端:20000美元。数字资产基金经理Valkyrie Investments的研究...
日期:09-12
创业180天估值20亿美元!欧版OpenAI爆火,Llama主创自立门户,英伟达都入股了
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:明敏 ,授权转载发布。“欧洲版OpenAI”最新估值,逼近20亿美元!总部位于巴黎的大模型初创公司Mistral AI最新一轮融资,4.87亿...
日期:12-05
火狐Firefox 71浏览器将带来WebSocket检查器(firefox火狐浏览器下载)
  WebSocket(WS)是HTML5开始提供的一种在单个TCP连接上进行全双工通讯的协议,它允许服务端主动向客户端推送数据。在WebSocket API中,浏览器和服务器只需要完成一次握手,两...
日期:06-08
官宣!国产大飞机C919正式拿证:内部设计公开「首架国产大飞机C919亮相」
根据央视、中国商飞的官方消息,中国民航局已经正式向中国商飞公司颁发了国产大飞机C919的型号合格证,为其交付并投入商业运营打开了最有决定性的绿灯!同时,C919项目团队代表也接...
日期:10-04
暴击东方曜「“饭圈”暴击东方甄选」
图片来源@视觉中国文 | 螺旋实验室,作者 | 追命,编辑 | 坚果东方甄选“小作文”事件,开始向越发难以收场的局面发展。起初只是内部争功,后来扩大成为了负面舆情,顺带着引发粉丝倒...
日期:12-15
国家广电总局:三阶段推进电视“套娃”收费问题治理工作
通信世界网消息(CWW)9月28日,国新办举行“权威部门话开局”系列主题新闻发布会。会上,国家广播电视总局副局长杨国瑞介绍,近年来电视“套娃”收费问题治理工作受到人民群众高度关...
日期:09-29
亚马逊试点基于AI的产品广告图像生成工具_亚马逊广告acos
划重点:华为P8参数微信文章底部增加淘宝入口怎么设置跨境电商为什么会成为外贸新引擎Google开源...
日期:11-06
5g救护车的技术「印度推出首辆5G救护车 所有设备可在5G网络下运转」
  10 月 4 日消息,印度 10 月 1 日在印度移动大会上宣布正式推出 5G 服务,并将在年内提供给近 75% 的人群,第一阶段覆盖 13 城,2023 年底前推广全国。  据央视新闻报道,大...
日期:10-12
中国美丽休闲乡村名单公布:共255个 有你的家乡吗英语「中国美丽休闲乡村名单公布:共255个 有你的家乡吗?」
11月14日,农业农村部今天公布了中国美丽休闲乡村推介结果,持续推进农村一、二、三产业融合发展。pixel 3 XL经各省遴选推荐、专家评审和网上公示,推介北京市门头沟区妙峰山镇炭...
日期:11-15
魅族前总裁公开引战「魅族CEO沈子瑜真心话聊All in AI:2月18日9点见」
快科技2月15日消息,今日星纪魅族集团董事长兼CEO沈子瑜发微博称:为什么All in AI,聊聊真心话,2月18日早9点,咱们开工见!”2021 Q2中国商用平板市场季度研究报告此前,魅族百米巨幅广...
日期:02-15
通义千问团队发布Qwen1.5 聊天模型性能大幅提升
2月7日 消息:在近期几个月的深入探索之后,通义千问团队终于迎来了其开源系列Qwen的下一个重要版本——Qwen1.5。2022款宝马X8MQwen1.5的亮点之一是其丰富的模型系列,涵盖了从0...
日期:02-07