您的位置:首页 > 互联网

AIGC 施展“物理魔法”,3D视觉突破“精度极限”

发布时间:2023-08-21 10:43:19  来源:互联网     背景:

声明:本文来自于微信公众号 光锥智能(ID:guangzhui-tech),作者:姚 悦,授权转载发布。

“没有艺术,全是物理!物理让你快乐,不是吗?”

近日,在世界计算机图形会议 SIGGRAPH2023上,英伟达创始人、CEO 黄仁勋宣布,将生成式AI与仿真模拟平台Omniverse结合的时候,如同他宣布“AIGC是iPhone时刻”一样兴奋。

不同于大语言模型只能应用在图文,有了基于物理规律的仿真模拟平台,生成式AI就可以直接用到现实世界。

图片

除了黄仁勋,美国斯坦福大学李飞飞团队,近期也将大模型接入机器人,不仅使得机器人能够与环境有效交互,还能够在无需额外数据和训练的情况下完成各种任务。

图片

“基于物理世界模拟的生成式AI,是生成式AI2.0”,跨维智能创始人、华南理工大学教授贾奎对光锥智能表示,与具身智能的结合,生成式AI 将发挥出更确定性的作用。

而随着通用能力的增强,AI也有望打破商业化的“魔咒”。

m3u8怎样转换为mp4格式

当生成式AI学会物理

将生成式AI与物理世界结合,并不容易,这里面涉及的技术链条非常长。

首先,需要对物理世界基本规律的掌握,才能将真实世界建模到仿真模拟平台。

仿真模拟平台,不仅可以仿真物理场景,还可以模拟真实世界中物体之间相互作用、运动和变形。

而生成式AI的加入,会让仿真模拟平台拥有“预演”能力。

“人类从小就知道的物理常识,AI却不知道。”黄仁勋表示,“生成式AI和仿真模拟平台结合,就是要让AI的未来能够在物理上扎根。”

黄仁勋进一步解释,让AI在虚拟世界中学习如何感知环境,并通过强化学习来理解物理行为的影响和后果,让AI实现特定目标。

这就需要用生成式 AI,预测物理世界中的千万种、甚至上亿种可能性,形成有价值的合成数据。

比如机械臂需要通过3D视觉的“眼睛”才能精准抓取,但如何排除环境变化的干扰,认出待抓取的物体(比如工厂里的零部件)?

通过仿真模拟平台掌握了“光线对场景目标的反射、折射影响”等物理规律,生成式 AI就能预测模拟出一个瓶子,在不同场景光照下,周身不同的反光程度;同一光照下,金属、塑料、木制品等不同材质物体表面呈现的状态;一堆钉子,所有可能出现的散落状态……

图片

再次,需要将所有数据,都在仿真模拟平台中用AI都跑一遍。

这一步,就是在训练3D视觉大模型。区别于大语言模型,3D视觉大模型对于理解和推理视觉场景的组成特性至关重要,需要处理对象之间的复杂关系、位置、以及现实环境中的变化等。

图片

最后,再连接上机械臂等具身智能的硬件,才能让其学会智能化操作。

可以看到,生成式AI与物理世界结合的整个技术链条,不仅涉及物理学、图形学、计算机视觉、机器人多学科交叉,还包括数字孪生、几何深度学习、运动学解算、混合智能、智能硬件等多维前沿技术。

相应的,整个产业的链条也比较复杂,需要从数据到模型,再从模型到部署。

图片

在这些环节中,有一个节点和此前AI的路径非常不同,那就是“合成数据生成”。

用基于物理规律的生成式AI合成的数据,去训练大模型,将给实体产业带来跨越式的革命。

不用一张真实图片,

训练3D视觉大模型

为什么不直接用真实数据训练大模型?

高通收购ARM

目前,行业内多数基于3D视觉的机械臂,其控制系统的算法训练所使用的就是真实数据。因为商业隐私等问题,这些真实数据很难在通用数据中获取,基本都是企业自行采集。

然而,自采真实数据,首先在“效率和成本”这两个运营的关键指标上,性价比就非常低。

这是因为,终端应用场景碎片化,数据根本不能通用。采集真实数据,企业就需要一个一个行业,一个一个工厂,一个一个场景的“地毯式”采集。而且,采集回来的数据也不能直接用,还需要进行一系列处理。

这个过程中,甚至产生了“人工智能悖论”。

“采集真实数据,AI技术的成本构成中,半数以上都是数据成本,而对数据的采集、清洗、标注、增强等处理过程,往往是大量人力堆积的结果。”有分析人士就曾指出,人工智能的本质是代替人工的智能。“讽刺的是,这样的AI具备显著的劳动密集型产业特征。”

如果用合成数据呢?

“用五六年、上千个案例积累的真实数据,通过合成数据,几天几周就能完成。”贾奎告诉光锥智能,相比于人工采集与标注数据,合成数据的成本能够实现几个数量级的降低。

最关键的还是,在训练效果上,合成数据能够更优于真实数据。

由于本身就是基于物理规律合成,合成数据天生自带绝对精确的标注,这就意味着,AI学习起来效率非常高。

另外,合成数据的“全面性”是真实数据难以比拟的。“生成式AI2.0可以创造无数个世界,而且可以让这个世界快速演进。”贾奎表示。

而落地到3D视觉行业,机械臂就犹如有了“上帝之手”,可以掌控一切过去未来。

“当然,这不能是物理世界的规律之外的。”贾奎强调。

图片

“目前,我们不使用一张真实图片,就可以完成机械臂复杂场景作业的3D视觉模型训练。”贾奎告诉光锥智能,完全使用合成数据训练的模型引导机械臂的柔性操作,可以实现现场99.9%以上的稳定抓取。

联想z5pro和小米mix3

也正是因为此,合成数据,被称为大模型的“数据永动机”。

当前,除了3D视觉领域,许多领域也都因通用数据缺乏和噪点多等问题,开始尝试使用合成数据。但也有对合成数据抱有强烈质疑的观点,称如果没有经过精心调试,在训练时大量使用,会引发模型崩溃,造成不可逆的缺陷。

从技术演进的角度,合成数据不会是大模型的唯一解。

但贾奎指出,“没有找到更好的办法之前,合成数据就是目前能够解决实际问题的最好办法。如果还采用人力堆砌的真实数据,在包括3D视觉在内的很多领域,AGI(通用人工智能)永远不可能实现。”

打破AI的商业化“魔咒”

在机器视觉领域,对合成数据的需求更加旺盛,生成式AI2.0能够释放的价值也就会更大。

作为机器视觉非常重要的感知手段,3D视觉对于合成数据的需求就十分迫切。

“在一堆相似的零件里‘找不同’,物体换一个材质、颜色,都需要去调整参数。”一位3D视觉从业人士表示,不同领域的需求不同,使得落地场景过于碎片化,只能做完一个项目再重新定制另一个项目。

图片

这就意味着,企业很难通过着力解决一个或几个项目需求,就能形成标准化产品。也就无法进而通过快速复制,打入并拓展市场,追求利润规模。

边际成本难以降低,会将一家技术公司,变成项目公司,最终拖垮。

“魔鬼”藏在细节中。

传统3D视觉感知有多脆弱?贾奎向光锥智能描述,“机械臂在抓取过程中,如果有人路过产生光线变化,任务就可能失败。”

这是由硬件3D相机的成像原理造成的,3D相机成像容易受环境、物体形状、材质、颜色、散射介质等影响,而且这一问题短时间内难以解决。

“解决一个问题可能是一百步,但最后一步付出的努力可能跟前面99步加起来是一样的。”商汤科技联合创始人杨帆曾表示,企业大部分的精力都需要用来应对小部分长尾问题。

但现在,“通用性能力很强的生成式AI2.0,能够解决长尾问题,对于产品标准化至关重要。”贾奎表示。

图片

相较于行业传统定制化开发的模式,企业基于生成式AI2.0,就可以利用通用大模型,实现产品模块化开发,做到开箱即用地部署,进而实现同行业直接拓展,不同行业也能有效复用。3D视觉行业的商业化难题也就迎刃而解。

与此同时,数据、开发、部署、硬件、行业拓展,每一个环节的成本也都实现骤降。

而在生成式AI2.0的催化下,3D视觉一旦爆发,也就意味着,在机械臂、机器人、无人驾驶、元宇宙等等高度依赖3D视觉技术的垂直场景,都将加速吃到AI的红利。

图片

不少数据已经印证了这一点,像数据标注、合成数据、工业机器人、机器视觉等领域,全球市场规模都在高速增长,尤其是合成数据的年复合增长率甚至都超过了30%。

图片

这背后,实际上是生成式AI2.0的战略价值,已经受到了科技和众多制造业巨头的高度重视。

从西门子、福特等老牌制造企业,到英伟达、特斯拉、谷歌等一众科技巨头,再到Waabi等明星初创公司,都开始纷纷在工业、机器人、无人驾驶、医疗、零售等诸多领域,探索生成式AI2.0更大的可能。

与此同时,资本的热情也被极大地调动起来。据不完全统计,近年来,国外合成数据的相关融资,累计已接近8亿美元。

在国内,合成数据相关企业也同样引起了资本的注意。2022年6月,跨维智能宣布完成Pre-A轮融资,融资金额数千万元,成立不到一年时间累计融资近亿元;今年7月,光轮智能也宣布完成天使+轮融资,融资金额累计数千万元。

可以说,从会作诗到学物理,生成式AI2.0正在开启一个产业数字化的宏大未来。


返回网站首页

本文评论
中通快递寄丢白金项链只赔500元 当事人:接受不了
10月6日消息,据小强热线报道,今年8月,叶女士和朋友到四川旅游,不小心将一些物品落在了成都都江堰的一家酒店。其中最贵重的就是一条白金项链,结果中通快递在邮寄途中,把包裹弄丢了...
日期:10-16
华为Mate 60最新爆料:9月底发布,不支持5G网络_华为手机mate60
知名数码博主“厂长是关同学”爆料称,华为将于9月底发布Mate 60系列,很有可能取消原定计划,这意味着很可能传言已久的5G夭折。该博主还爆料称,年度发布的nova12系列手机或许将会...
日期:07-06
北半球三大流星雨之一!英仙座流星雨8月13日迎极大:肉眼可见_英仙座流星雨最佳观赏城市
快科技8月12日消息,每年暑假最值得期待的天象英仙座流星雨要来了。据天文科普专家介绍,今年该流星雨将在北京时间8月13日迎来极大,感兴趣的公众可在13日晚至14日凌晨对其进行观...
日期:08-12
更新Windows 11_最新测试版发布!Windows 11又有新变化
  Windows 11最新的预览版已经推送,尝鲜用户都已经陆续升级。在Windows 11 Build 22610中,微软修改了大量已知错误,此外还对任务栏和文件资源管理器大动手脚。  此前传闻...
日期:01-17
GarminMove是怎么把智能屏幕藏起来的?
  最近,Garmin在北京举办了主题为“独一有二”的新品发布会,隆重介绍了包括Fenix6系列、Venu、GarminActive、GarminMove的一系列新品,并邀请了品牌代言人迪丽热巴出席。...
日期:10-20
曾遭霸凌的解说YammerS离世 DOTA2官微回应:深感痛心
日前知名电竞解说YammerS离世的消息引发关注,他还通过之前定时发布的微博解释了原因,诉说曾遭遇暴力与霸凌,引发网友惋惜。DOTA2官方微博刚刚也发表公告,表示经过确认,解说Yammer...
日期:05-30
95后女孩斥资1.96亿 将拿下A股公司!背后父母身份不简单
95后女生”曾是财经记者”斥资1.96亿”,如此多的标签在身,收购一家A股上市公司,想不引起网友关注热议都难。11月10日消息,据报道,停牌数日的国立科技披露新东家”身份,为95后女生...
日期:11-11
特斯拉喊话Model 3中国车主:请谨慎驾驶车辆 快点来检修「特斯拉model 3汽车论坛」
11月25日,市场监管总局公告,特斯拉汽车(北京)有限公司、特斯拉(上海)有限公司召回部分进口Model S、Model X及部分进口和国产Model 3电动汽车。国家市场监督管理总局周五在公告中...
日期:12-03
华为Mate50E上架:3999元起_华为mate50发布了吗
华为Mate50非常火爆,目前也是一机难求,而目前最便宜的Mate 50版本要来了,3999元起步,华为Mate50E已经开始了预约,并且将在10月14日10:08正式开售,其中128GB版本售价3999元,256GB版...
日期:10-27
哪些中小商家会被淘宝重点扶持呢「哪些中小商家会被淘宝重点扶持?」
声明:本文来自于微信公众号 亿邦动力(ID:iebrun),作者:石航千,授权转载发布。中小商家真的有机会成为 “主角”?日前,淘天集团中小企业发展中心与淘宝教育共同发起了面向中小商家...
日期:07-24
凸六式扫把火了 商家剪坏扫把低价引流 男子将计就计下单
相信不少小伙伴遇到过低价引流套路,在商品列表看到一款商品售价很低,但点进去发现这个价格并不是宣传的商品,可能只是一个配件,一般人根本不会下单。.net core 3.1发布时间5月21...
日期:05-22
英伟达考量纬创 AI 服务器产能不足 将订单转至鸿海生产「纬创rd」
8月3日消息:据 UDN 消息,英伟达考量代工伙伴纬创 AI 服务器产能不足,取消部分原定交给纬创的订单,转至鸿海集团生产。鸿海未评论传闻,纬创则说旗下订单量完全没有改变。AI 服务...
日期:08-03
小米电子秤测体脂「小米Watch S2发布:999元起 居然把体脂秤干掉了」
12月11日晚,小米Watch S2正式发布,售价999元起。它有一大绝技:测量身体成分,可以取代普通的体脂秤了。原来,小米Watch S2内置生物电阻抗传感器,只要将手表正常佩戴到手腕上,另一只...
日期:12-12
麦当劳在抖音直播卖汉堡,一天卖出1000万_麦当劳在抖音直播卖汉堡,一天卖出1000万
声明:本文来自于微信公众号 电商头条(ID:ecxinwen),作者:李松月,授权转载发布。麦当劳在抖音直播,一天卖出1000万经过两年多的布局,本地生活早就成了抖音生态中不可或缺的一环。今...
日期:11-05
百度首席战略官辞职;小米发布「无线」AR 眼镜,视网膜级显示;苹果明年彻底放弃高通
余正钧因个人原因辞任百度首席战略官,此前曾任首席财务官2 月 27 日,百度(Nasdaq:BIDU,09888.HK)在港交所发布公告,余正钧已因个人原因辞任公司的首席战略官职位,于 2023 年 3 月 1...
日期:03-01
英媒:美反华“芯片联盟”陷入困境,韩国是潜在国家中最不情愿的一个
英国《金融时报》9月12日文章,原题:美国动员东亚“芯片四方联盟”遇阻 美国试图争取其东亚盟友支持组建一个半导体供应链联盟,然而担心中方报复和地区紧张影响了这一计划。“...
日期:09-15
抖音生活服务上线“日历房”产品能力 刷抖音就能订房间「抖音日历网」
5月30日 消息:抖音生活服务官方宣布,为了更好地满足用户预订和商家经营需求,正式上线“日历房”产品能力,提升酒店住宿商家从内容种草到转化履约的经营效率。安卓有几款ps2模拟...
日期:05-30
外部投资短缺,与吉利需求适配度低,星纪魅族终止芯片研发
通信世界网消息(CWW)8月8日下午,星纪魅族回应“裁员”风波时表示,面对全球经济环境的不确定性,决定终止自研芯片业务,未来将更加聚焦产品创新和软件用户体验。近日有消息称,因业务...
日期:08-09
突发!一款塑料壳iPhone将被苹果列入过时产品名单_苹果有一款塑料壳的手机
苹果计划在下个月将iPhone5c标记为过时的产品,根据MacRumors获得的一份备忘录。苹果在2020年10月将iPhone5c标记为老式产品,这意味着该公司及其服务提供商只能根据零件的可用...
日期:10-13
2600岁古楠木王被盗割、11人被判刑:已安排专人看护_楠木古宅
日前,贵州省高级人民法院官方通报了一起特殊的案情,贵州2600岁的古楠木王”被盗割,树体遭到严重毁坏,11人被判刑,并与4名附带民事被告承担修复救助费29万余元、惩罚赔偿金15万余...
日期:04-20