您的位置:首页 > 互联网

给自动驾驶AI搞个“外挂”,显著提升运动状态判别力丨CVPR开源_自动驾驶辅助神器

发布时间:2023-08-01 22:40:21  来源:互联网     背景:

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

只需“100K大小的外挂”,就能让自动驾驶AI识别“物体运动状态”的能力大幅上升!

这是一项来自香港大学计算机视觉与机器智能实验室(CVMI Lab)和TCL AI Lab的新研究,目前论文已被CVPR 2023收录。



研究提出了一种叫做MarS3D的轻量级模型,给原本只能识别物体“是什么”的语义分割模型用上后,就能让它们进一步学会识别这些物体“是否在动”。



而且是任意主流模型即插即用,几乎不需要额外的计算量(推理时间只增加不到0.03秒),目前已开源。

自动驾驶辅助神器

要知道,对于靠激光雷达来判断周围环境的自动驾驶系统而言,其感知能力,很大程度上依赖于3D点云语义分割模型的准确率和效率。

如果想提升模型识别“运动物体”的能力,往往需要将繁重的室外多帧点云数据分别进行特征提取和处理,但这种方法不仅要增加大量计算,识别性能也没提升多少,属实是事倍功半。

相比之下,MarS3D参数量只有约100K大小,却能将主流点云分割模型的性能提升近5%。

这究竟是怎么做到的?

100K参数让模型学会识别“运动”物体

首先要了解一下3D点云的两种语义分割任务,单扫描(single-scan)和多扫描(multi-scan)。

这两种方法的核心差异,在于能否区分物体的运动状态。

单扫描任务只需要根据单帧点云,把场景中汽车、行人、道路等语义信息分割并标注出来。像下图,不同的颜色代表不同的物体,如蓝色的点云代表车:

美的格力投资价值



多扫描任务,则需要根据时序上的多帧点云,同时分割语义信息和运动状态。

换言之,不仅要学会区分汽车、行人、道路,还得识别这些物体是否在运动。如汽车标签扩展成“运动的车”和“不动的车”,以及行人扩展成“运动的行人”和“不动的行人”:

世界互联网公司排名2020



目前,自动驾驶做激光雷达点云数据的处理,主要还是通过单扫描语义分割方法。

虽然能通过扩展标签、融合点云数据,直接将单扫描模型训练成多扫描模型,从而让AI掌握识别物体运动状态的能力,但存在两个问题:

一个是性能收效一般;另一个是融合点云数据量大,导致这种模型复杂、计算时间长,而这正是“争分夺秒”的自动驾驶系统无法接受的。

为了解决这两个问题,让语义分割模型又快又好地掌握识别“运动物体”的方法,MarS3D横空出世。

即使之前模型只能做单扫描语义分割,给它加个MarS3D后,不仅能大幅提升多扫描语义分割能力,区分物体“是否在运动”,效果还比其他多扫描方法更好。

所以,MarS3D的核心思路是什么?



具体来说,模型设计了一个基于2D CNN网络的分支BEV Branch,这个模型能提取点云数据转换的BEV(Bird’s Eye View)表征,即自上而下的鸟瞰视角。

之所以选用BEV,主要有两个原因。

一方面,目前的运动物体基本都是在地上跑(即使在空中飞,也几乎不存在垂直上升的情况),也就是说,几乎所有的运动都在水平面上有位移,因此它能很好地反映物体在绝大部分场景中的运动状态;

另一方面,BEV相比点云数据量更小,还能通过参考帧和特征图相减,降低点云稀疏性带来表征不稳定的问题,即同样静态区域的表征近似,含有动态物体区域的表征距离更远。此外,多尺寸卷积对表征抽取特征图,以保证模型对不同运动速度的物体都有很强感知力。

随后,将这个分支提取的运动状态信息特征、和其他被时序嵌入向量增强的单扫描任务模型分支3D Branch提取的语义信息特征结合起来,进行特征融合,最终实现语义分割。

那么,这样实现的3D点云语义分割,效果究竟怎么样?

几十毫秒计算,分割性能提升近5%

相比和其他输入如RGB图像进行结合,论文重点测试了模型针对纯点云输入的分割效果。

从下表可见,对于SemanticKITTI数据集,在目前主流的单扫描点云分割模型如SPVCNN、SparseConv和MinkUNet上,MarS3D在只给模型增加0.1M的情况下(参数量增加不到0.5%),将性能(mIoU)分别提升了4.96%、5.65%和6.24%。



同时,计算时间(延迟)只增加了19ms、14ms和28ms。

5%对于模型分割性能提升有多显著?下图是在两个扫描场景中,模型增加MarS3D前和增加后的效果对比,其中左图是增加前,中间是增加后,右边是真实值:



显然,增加MarS3D后模型识别物体的效果要更好。

直接将分割效果和真实值对比,可见增加MarS3D后的“错误值”,比增加前要低不少:



整个推理过程,只需要一块英伟达GeForce RTX 3090 GPU就能搞定。

对MarS3D感兴趣的小伙伴们,可以去试试了~

项目地址:
https://github.com/CVMI-Lab/MarS3D

论文地址:
https://arxiv.org/abs/2307.09316


返回网站首页

本文评论
gmail第三方授权_谷歌允许Gmail和该公司旗下在线服务用户部署第二层认证方式
  北京时间2月11日上午消息,谷歌将允许Gmail和该公司旗下的其他免费在线服务用户部署第二层认证方式。当用户登录这些服务时,可以使用通过手机或固定电话发送的一次性密码...
日期:07-26
“子宫移植”临床实验在上海开展,供体一般来自患者母亲「子宫移植手术视频」
复旦大学附属妇产科医院(上海红房子医院)正在开展一项“子宫移植”临床实验,招募18-40岁之间的子宫性不孕患者,为她们圆一个生育的梦想。4月5日,澎湃新闻记者采访了这项临床实验...
日期:04-07
有人靠送外卖脱贫 也有人边送外卖边写诗(描写送外卖的人的文章)
作者: 彭晓玲   两年前,在朋友圈刷屏的报道《外卖骑手,困在系统里》把外卖小哥这个群体首次推到了公众面前。如今,第一本聚焦外卖群体的非虚构写作《中国外卖》则像一部纪录片...
日期:08-06
什么操作?贾跃亭因借款纠纷起诉乐视控股 其本人持股92%「乐视网贾跃亭占股多少」
作为乐视集团的创始人,贾跃亭如今要起诉乐视控股,案由是借款合同纠纷,这也着实少见。不过对于频上热搜的乐视和贾跃亭来说,已算是日常操作”。11月1日,山西省高级人民法院发布开...
日期:11-09
年货上哪买?苏宁春节不打烊,年货慢慢挑(苏宁易购春节发货吗?)
  距离2020年越来越近,大家是不是已经开始忙着置办年货了呢?不过年底也是各大公司进行年终盘点的时候,工作也会相比平常更加忙碌。但是还没有腾出时间准备年货的朋友也不用...
日期:02-15
乘联会:初步统计12月乘用车市场零售242.5万辆 同比增长15%
1月5日消息,乘联会官方微信公众号发布消息称,初步统计,12月乘用车市场零售242.5万辆,同比去年增长15%,较上月增长47%;12月全国乘用车厂商批发227.3万辆,同比去年下降4%,较上月增长12...
日期:01-05
原神 议价「原神内购内容将涨价 价幅度未知」
中关村在线消息:《原神》官方在HOYOLAB社区透露受平台价格政策调整的影响,或将调整部分地区的内购内容价格。受影响的地区包括智利、埃及、日本、马来西亚、巴基斯坦、波兰、...
日期:10-25
员工带薪拉屎「员工每天带薪上厕所3至6小时被解雇:法院判了」
职场上有一种调侃叫带薪上厕所”,不可否认,人有三急,但要是如厕时间过长甚至夸张,恐怕性质就变了。扎克伯格投资元宇宙据媒体报道,王某于2006年4月进入公司工作。2014年12月王某...
日期:05-25
豆瓣将在个人主页等位置展示帐号IP属地_豆瓣账号主页链接
7月26日,豆瓣官方发布公告,将陆续上线在“个人主页等位置展示帐号IP属地”的功能。相关功能将于即日起面向部分用户进行测试,预计在本周内面向所有用户正式上线。该功能上线后,...
日期:07-31
鲍尔默 微软_微软CEO鲍尔默暗示微软将推Metro版本Office
  9月19日消息,据国外媒体报道,微软CEO史蒂夫·鲍尔默(Steve Ballmer)上周透露称,微软有计划推出下一代Metro版本Office。   在接受采访时,鲍尔默被问及微软是否有计划推出...
日期:07-23
全民战“疫“ 极客修无接触维修为何受青睐
  厂房停工,店铺歇业,各种生活服务也停止,居民的生活全靠“云”。在这各行各业都经历“寒冬”的背景下,维修业却因为有“上门”这项方便服务变得火热。   成都居民小张在...
日期:01-11
比亚迪赵长江:腾势N7领先两代 将成为家用和年轻人首选大五座标杆SUV
快科技6月21日消息,智能豪华猎跑SUV腾势N7首批量产车昨天正式下线,这也意味着新车将上市即交付。据悉,腾势N7将于6月下旬上市,7月交付,预计售价在35万-45万元。iPhone13发布在即,...
日期:06-21
对标美团、支付宝? 百度App上线“发现”频道深耕服务(支付宝口碑和美团)
  近日,有网友发现最新版百度App菜单栏上线了“发现”频道,将原来的“有料”的位置取消,替换成了“发现”,同时新增服务中心、购物、健康和小程序等入口。这一排兵布阵被外界...
日期:07-16
快手发视频危险行为「快手打击违规健康科普内容 共处置相关视频超26万个」
10 月 9 日消息,日前,快手发布关于打击违规健康科普内容的处罚公告(第八期),公告称为营造积极、健康、正能量的社区环境,向用户传递科学严谨、真实可信的健康科普内容,快手平台持续...
日期:10-17
盘点被 VC 爱过的「十大风口」现状:风停后,谁还能继续飞?
声明:本文来自微信公众号“IT桔子”(ID:itjuzi521),作者:李新新,授权转载发布。如果说过去以10年为限,可见证一个行业扶摇直上而后又从顶端跌落、渐无音迹,那么在时至今日高速运转...
日期:05-05
肯德基麦当劳儿童节玩具断货 网友在社交平台寻“代购”_肯德基麦当劳玩具6个
最近,不少网友在社交平台上抱怨不能买到肯德基、麦当劳的“六一”儿童节玩具,“好想要肯德基的三丽鸥”、“现在哪里还有麦当劳的游戏机”。由于这些玩具是儿童节期间限定销售...
日期:05-31
加强创新、研发!华为新年首发债 总额30亿元:去年达210亿元_华为发行30亿债券
华为投资控股有限公司17日发布公告,为支撑各项业务发展和关键战略落地,公司拟发行30亿元中期票据,将用于补充公司本部及下属子公司营运资金。发行总额30亿元,发行利率3.45%,期限5...
日期:01-18
谷歌数据中心投资_Google投资1亿美元在台湾建数据中心
  9月29日消息,Google宣布,将在台湾彰化县建立数据中心,预计总投资将超过1亿美元。   Google彰化数据中心占地15公顷,预计将在两年内建成,总投资超过1亿美元。这是Google首...
日期:07-23
Facebook商店分享到instagram「Meta宣布美国所有Facebook和Instagram用户均可分享NFT」
DoNews9 月 30 日消息(郭睿琦)Meta 公司今天宣布,在美国境内所有 Facebook 和 Instagram 用户都可以连接他们的钱包,并分享他们所持有的 NFT 资产。Facebook 老总美国的所有用户...
日期:09-30
ios15更新后wifi「升级iOS 16.4的用户被苹果坑了!Wi-Fi/天气崩溃、电池续航大缩水」
当下,iOS最新正式版已是16.4,Beta版则推进到了16.5。不过,iOS16.4作为一次较为重大的正式版更新,体验方面的问题却也不少。除了已经确认的造成天气应用和Wi-Fi崩溃的问题之外,Up...
日期:04-05