您的位置:首页 > 互联网

UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官_多模态身份建构

发布时间:2024-01-22 23:07:39  来源:互联网     背景:

要点:

特斯拉自动驾驶第一案

夏普237载体与312载体一样吗

恒大出的新车

  • UCLA等机构的研究人员最近推出了具身智能大模型MultiPLY,该模型具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。

  • 通过与3D环境的交互,MultiPLY在对象检索、工具使用、多感官标注和任务分解等具体任务实验中,表现出比当前技术水平更高的性能。

  • 为了训练MultiPLY,研究人员创建了一个大规模多感官数据集Multisensory-Universe,包含50万条由AI智能体在3D虚拟环境中交互时收集的数据,涵盖了多种任务类型。

1月22日 消息:近日,UCLA等机构的研究人员推出了具身智能大模型MultiPLY,该模型不仅具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。

MultiPLY在多任务实验中表现出色,包括对象检索、工具使用、多感官标注和任务分解等,刷新了当前技术水平。为了训练这一新模型,研究人员创建了Multisensory-Universe数据集,包含50万条多感官数据,涵盖了多种任务类型。尽管面临挑战,如当前缺少训练多感官交互的数据和正确表示3D场景的多感官信息,但MultiPLY的出现为实现AGI提供了新的方向。

在模型训练阶段,研究人员引入了新物体,并通过触觉、环境声音、撞击声音、温度等多种传感器数据获取方式,让模型学会感知物体的多模态信息。

多模态认知计算安徽省重点实验室

法拉第未来和贾跃亭关系

为此,研究人员提出了多感官全景生成管线,通过不同传感器收集触觉、声音、温度等信息。整个训练过程中,MultiPLY通过智能体与3D环境交互,生成多感官观测值,并在推理过程中不断生成动作token,展现出强大的多模态能力。这一研究的出现,为构建更全面、具备多感官能力的大模型提供了新思路。


返回网站首页

本文评论
广告流主失后马斯克再遭一击 Threads近3个月下载量大幅超过X_马斯克推送
12月5日消息,根据对应用商店趋势的最新分析,Meta旗下社交媒体应用Threads最近一段时间的新增下载量已经超过竞争对手X。应用情报公司Apptopia的数据显示,尽管Threads的每日下载...
日期:12-05
王易见:借壳九樱入华 Facebook演绎“蛇吞象”
  全球SNS巨头Facebook对中国4亿7千万网民可谓是垂涎三尺,曾经业界也多次传出Facebook入华的消息,最终却屡屡被证实为“乌龙”,虽然业界对这种“坑爹”的传闻已经有所免疫,但...
日期:07-23
中国1000年前就有摩天大楼:相当于50层高 可俯瞰整个洛阳_洛阳十大高楼
提到摩天大楼,大家第一印象就是现代都市。其实在1000年前的北魏时期,我国古代劳动人民就修建过140米高的摩天大楼”。在《中国国宝大会》第二季节目中,专家介绍,永宁寺是北魏时...
日期:11-28
Check Point 获评云原生安全领域领导者和创新者_云原生关键技术
Check Point CloudGuard 被 Frost & Sullivan 评为领先的云原生安全平台,在最 新报告中位居前列。2024 年 1 月 ,全球领先的网络安全解决方案提供商Check Point® 软件技术有...
日期:01-17
蔚来发布2月限时优惠购车方案:部分长库龄展车最高降2.4万「蔚来车主推荐优惠」
2月3日 消息:蔚来官方社区发布2023年2月限时优惠购车方案,包括国家补贴兜底优惠、长库龄展车优惠、置换优惠等。方案显示,2023年2月内锁单购买2022款ES8、ES6、EC6的用户,蔚来...
日期:02-03
32g内存macbookpro「淘汰8GB 苹果M3版MacBook起步就给12GB内存:这次够用了」
快科技8月14日消息,苹果的手机、电脑很受欢迎,然而在内存上可以说很抠门,甚至被批吃相难看,1万元的MacBook也只给8GB内存,升级1条内存要1500元,被网友吐槽了很久,现在总算有点改观...
日期:08-14
1024程序员节,技术大咖共赴英雄会_1024程序员节logo
(原标题:1024程序员节,技术大咖共赴英雄会) 10月24日,2023长沙·中国1024程序员节的重磅环节——2023技术英雄会在长沙举行。中...
日期:10-26
维珍银河公司发布全新一代太空飞机「维珍银河飞船完成首次商业太空飞行」
6月30日消息,英国大亨理查德·布兰森(Richard Branson)旗下维珍银河控股公司首次将付费客户送到了太空边缘。对这家成立了近20年的太空旅游公司来说,这是一个重要的里程碑。维珍...
日期:06-30
技术赋能治理 纠纷线上化解 阿里发布网络新“枫桥经验”报告
  20世纪60年代初, 浙江诸暨枫桥镇创造了“发动和依靠群众,矛盾不上交,服务不缺位”的“枫桥经验”,作为基层社会治理典范而被多地效仿。   在跨入数字经济时代的今天,“枫...
日期:06-14
倪光南院士:加强网络核心技术自主创新,实现算存运高效协同_倪光南院士认为网络安全自主可控亟待补齐哪两大短板?
通信世界网消息(CWW)8月19日,中国工程院院士倪光南出席了由工业和信息化部、宁夏回族自治区人民政府联合主办的2023中国算力大会,并发表“打造算存运高效协同的算力基础设施底座...
日期:08-22
陌陌:2023年Q1净营收28.189亿元「陌陌2018年q2净利润8.94亿人民币 连续14个季度盈利」
6月6日 消息:6月6日,挚文集团(Nasdaq: MOMO)公布了2023年第一季度未经审计的财务业绩。财报显示,2023年第一季度,挚文集团净营收达28.189亿元(约4.105亿美元),不按照美国通用会计...
日期:06-06
喜马拉雅携自研语音技术成果亮相云栖大会,重现经典声音_喜马拉雅声音研究院
10 月 31 日, 2023 云栖大会在杭州云栖小镇正式开幕,喜马拉雅携自研语音技术成果亮相这一重要科技盛会,与全球科技、数字精英,共同探讨AI、云计算、大数据等新兴技术的未来发展...
日期:12-22
生财、群响、飞象,这三个付费社群,一年5000万,他们的核心是什么?
声明:本文来自于微信公众号十里村(ID:shilipxl),作者:村长住在十里村,授权转载发布。各位村民好,我是村长。在杭州有许多付费人数过万的社群,其中一年收入三五千万的就有十几个。此类...
日期:11-02
三星i408「三星i450破解」
是一款在2009年发布的经典手机,拥有时尚的外观设计和强大的功能。这款手机采用的是直板设计,外观简洁大方,质感优美。它采用了2.4英寸的TFT彩色屏幕,分辨率为320×240像素,色彩鲜...
日期:06-03
街头大量出现银杏果 千万别乱吃 碰也别碰
秋天到来,不少人发现,街头的银杏树结果了,圆圆的黄色果子掉落在地上、草丛里,偶尔也有人把掉在地上的果子捡拾回去。苹果出货量下降银杏是很常见的园林绿化植物,需要注意的事,银杏...
日期:10-15
国产游戏出海,《原神》成为 2021 年 Reddit 浏览量最高的板块(原神中国玩家数量)
  1 月 3 日消息,据 IGN 报道,Reddit 的 2021 年年度回顾已经出炉。数据报告显示,2021 年用户非常喜欢《原神》《最终幻想 14》《英雄联盟》《侠盗猎车手》等角色扮演游戏。...
日期:12-14
iPhone 15供应商泄密!潜望式长焦终于来了
iPhone 14 Pro机型在摄像方面迎来重磅升级,4800万像素主摄也是其大受欢迎的主要原因,据新的爆料消息,明年发布的iPhone 15将用上潜望式长焦镜头,进一步优化拍照效果。亚马逊监控...
日期:10-17
老代车末日来了 北京交管局:违规电动三四轮车明年起禁行「北京市严查三四轮电动车」
快科技4月12日消息,据易车网报道,北京市交管局于今日再次强调,自2024年1月1日起,违规电动三、四轮车不得上路行驶,不得在道路、广场、停车场等公共场所停放,这些车辆中凡有违规上...
日期:04-12
大客户可寻求替代方案 软银旗下Arm上调处理器授权费或引火烧身
北京时间3月27日早间消息,据报道,为实现上市目标,软银集团创始人孙正义近日决定提高旗下芯片设计公司ARM的企业客户购买芯片设计方案的价格。依靠涨价来拉动ARM的营收只是看上...
日期:10-05
立秋不意味着入秋 网友:感觉秋天还很遥远「立秋是不是意味着秋天到了」
8月8日,我们迎来了立秋节气,这是秋天的第一个节气,标志着天气由夏天转凉的过渡性季节。然而,立秋并不意味着所有地方都已经进入了秋天。我国南北地区的进入秋天的时间差别很大,只...
日期:08-08