您的位置:首页 > 互联网

完成国内首次端到端智驾大模型路测,千挂科技实现弯道超车

发布时间:2024-01-20 13:19:52  来源:互联网     背景:

(原标题:完成国内首次端到端智驾大模型路测,千挂科技实现弯道超车)

2023年,由ChatGPT所掀起的大模型风潮正在席卷科技圈,它充分展现了全新的技术范式所带来的想象力、潜能以及背后的生产效率提升。

这股技术浪潮席卷至自动驾驶,智能汽车作为一个能够承载、实现前沿的理想超级智能终端,能够最大限度地展现新技术范式所带来的变革。

2023年8月,特斯拉以直播形式向外界展示FSD V12测试版,该版本基于完全的端到端输出,真正实现了从感知到决策的全流程融入一个模型中,它成功走出依靠人工规则以外的技术通途,在全局视角下,展现出对感知、预测、规划、控制和决策的高度统一,呈现出流畅的驾驶行为和卓越的体验感。

当然,在这场新的技术范式变革里,参与者不止只有特斯拉;许多中国玩家们也朝着同一个突破口努力,贡献自己的解题思路,甚至率先走向端到端技术应用的前沿。

自动驾驶的技术奇点时刻:端到端智能驾驶大模型

此前,证明自动驾驶的可落地性是整个自动驾驶行业需要回答的问题。

一方面,业界不断减少激光雷达的数量,以无图或轻图的方式摆脱对高精度地图的深度依赖,减少或摆脱以堆料的方式实现对外部的感知;另一方面,渐进式道路成为了业界的共识,以高速、城区等分区域落地的思路来证明自动驾驶的可实现性。

可以说,在端到端没有到来之前的自动驾驶世界,是一个依靠天才工程师对于无数驾驶场景的观察、归纳、提炼、总结的世界,同时也是一个依靠规则搭建的世界。这当中存在着一个残酷的事实:场景是不能够穷举的。依靠人工规则对数据的总结提炼,不仅效率低而且泛化性差,这就导致了最后1%的长尾场景问题始终无法解决。

天才的工程师们始终在做打补丁的工作,缝缝补补一个由规则所搭建起来的世界,这样的技术路线也导致自动驾驶的落地未如预期。

端到端技术的到来则有机会彻底改变这一局面,它打破了过去业界在开发自动驾驶系统时,感知与规划分离,推翻一个由人为规则所搭建起来的世界。

这一明确的技术趋势使得几乎所有人都在赛跑:在美国,FSD12已进入用户测试环节的特斯拉,是第一梯队的排头兵;而在中国,比亚迪投入4000人进行智能驾驶研发;理想也宣称2024年端到端上车;而在刚刚结束的千挂科技2024年度产品发布会上,千挂科技公布了自己的端到端智能驾驶大模型在2023年底便已经进入公开道路常态化的测试阶段。从公开信息上来看,这是中国首个完成端到端智能驾驶大模型公开道路闭环测试的选手——而许多企业此时依然将端到端仅仅作为一个未来的重要规划。

端到端的技术想象力究竟在哪里?在千挂科技联合创始人叶璨博士看来,端到端智能驾驶大模型对于自动驾驶至少有三点重要的意义:

•第一点:端到端可以大幅提升数据的利用规模和效率,打破传统自动驾驶研发当中,依靠人工规则对数据的总结提炼模式,解决效率低且泛化性差的痛点;

•第二点:端到端能够对数据进行自动化学习,由模型取代规则,打破自动驾驶泛化性的瓶颈,能够覆盖更多的驾驶场景;

•第三点:在传统自动驾驶当中,不同模块都在关注和优化自身的代理指标,而这些指标存在不一致,端到端能够解决多模块甚至全链路联合优化的问题。

另一方面,在这种全面learning化的AI系统之上,我们有机会将世界模型(world model)进一步引入自动驾驶系统中,复刻类似于GPT4.0等大模型的模式,通过Transformer把海量的互联网数据及对应的知识压缩到模型参数当中,弥补现在自动驾驶系统对通用知识(world knowledge)的缺失。当自动驾驶系统拥有了先验知识以后,就能迅速提高泛化和推理能力,包括对长尾物体的识别、对场景的深度理解、对驾驶任务的拆解规划等,这些能力的提升使得自动驾驶有机会迈向一个更为广阔的世界。

因此端到端所勾勒出的是一个全新的技术图景,打开了全新的技术范式,开启一个产业变革的契机。如果说,端到端智能驾驶大模型对于乘用车而言,是一个体验上的升级;那么,端到端智能驾驶大模型对于干线物流而言,更具经济意义和效益。

千挂科技背后所面向的是一个庞大的干线物流市场,这个市场涵盖770万台中重卡,市场规模超过4.6万亿,司机成本达到20%+,预计2030年卡车司机缺口达到15%以上。端到端智能驾驶大模型的应用,可以提高自动驾驶系统的泛化性,更好地处理长尾场景,有机会在长途干线双驾变单驾的基础上,进入无人驾驶,进一步提升利润率,拥有无穷的想象力与现实意义。

端到端智能驾驶大模型的实践赛事:深厚的技术根基

知道一个最优解并不难,难的是践行一个最优解。

在V12亮相之前,特斯拉就做了非常多的打地基技术工作。其中就包括了2021年,特斯拉在AI Day推出基于BEV+Transformer的自动驾驶方案,这个方案相当于,打开了一个理解自动驾驶的全新范式。在过去的几年里,BEV + Transformer + 占用网络 + 无图化几乎统领了头部车企的研发方向。

作为新一代自动驾驶技术企业,千挂科技一开始便出生于GPT时代;更幸运的一点是,作为一个年轻的技术公司,千挂没有传统大厂的技术包袱和组织束缚,在新的技术道路上能够启动得更为从容。

在千挂1.0阶段,千挂通过One Model和Scene-centric的方式,攻克自动驾驶卡车中感知和预测两道难题,有效解决高速干线场景下异形车、遗撒物识别等挑战。

在感知方面,千挂采用One Model,即一个大模型完成感知任务,实现多模态数据的前融合和多任务学习的能力。具体来说,多模态前融合即,将环视相机、激光雷达等多个传感器采集的数据输入到一个感知大模型中,通过模型实现空间融合和时序融合,获得时空融合的特征。基于时空融合的特征,完成多个感知任务,能够实现对障碍物的检测与分割、路网结构(如车道线、可行驶区域)的实时感知等,达到更完备、更准确、更鲁棒的效果。

在预测方面,千挂科技采用了Scene-centric架构,对所有道路参与者Agents进行联合建模和推理,底层基于Transformer架构完成特征编码与解码。相对于Agent-centric的传统架构,这种对所有障碍物统一建模的新架构简化了整体流程,提升了训练和推理效率,并且可以更好地理解道路参与者之间的交互关系,更好地处理蝴蝶效应。

凭借着One Model和Scene-centric奠定的技术基础,千挂的自动驾驶卡车如今在京沪等物流大干线上顺利实现了周行万里无接管的目标。另一方面,以One Model和Scene-centric为起点,千挂科技开始了新一代自动驾驶技术——端到端智能驾驶大模型的研发。在12月的GADS 2023全球自动驾驶峰会上,叶璨博士提出了千挂自研端到端算法框架 - AutraFlow。

抖音上面的手机卡

千挂科技AutraFlow是面向新一代的自动驾驶技术,是从全面learning化和数据驱动的角度,进行设计研发的。据叶璨博士介绍,在研发过程中,团队深入调研了大量端到端的前序工作,在此基础上结合干线物流的业务场景特点,在算法、工程、数据等层面做了大量的优化工作。目标是让端到端算法实际上车跑起来,能应对高速干线上的各种路况和场景,并最终在产品和业务中用起来。

整体上,AutraFlow是一个完全learning化的自动驾驶系统,系统的每个模块都是基于Transformer的神经网络模型,模块与模块之间采用embedding连接,摆脱了传统的人类设计的抽象概念——比如障碍物的边界框(bounding box)或预测轨迹,做到更高效、流畅、无损地传输数据。

叶璨博士进一步解释,可以把整个端到端模型看作是一个大的神经网络,在训练时能够实现各模块的联合优化,与此同时可以在中间阶段,通过对embedding解码得到具有相对明确语义的中间结果,便于理解和检查,打破端到端的黑盒状态,从而提升端到端算法的可解释性。

目前,千挂的端到端算法AutraFlow,已经在城市快速路和城市间高速路等公开道路进行常态化的全功能闭环测试。近日,千挂科技也对外公布了一段2023年11月AutraFlow在北京市高级别自动驾驶示范区进行早期路测的视频集锦。

在叶璨博士的技术规划中,以端到端技术为基础,未来将借助多模态大模型,把通用知识(world knowledge)引入到自动驾驶系统,基于人类的知识和经验做出更好的驾驶决策,进一步提升自动驾驶系统的泛化性、可用性。

在千挂新一代自动驾驶技术的研发中, 大模型成为了最核心的技术变量。在叶璨博士的带领下,千挂在自动驾驶领域的多模态预训练中持续探索,将自动驾驶的多模态特征(图像、点云等)统一在语言特征空间对齐,从而获得泛化性更强的特征表达。基于语言对齐的多模态特征,为下游的多种感知任务提供基础,使得系统更好地识别异型车、遗撒物等长尾物体,提高对驾驶场景的理解和泛化能力。

对于千挂而言,大模型已经成为自动驾驶数据闭环的核心,比如数据挖掘、自动化标注等应用。2023年3月起,千挂开始在华中、华北、华东、华南等区域的主要一级干线,为顺丰、福佑等合作伙伴,提供常态化的物流运输服务,单均超过1000公里。业务规模的扩展也积累了海量的高速场景数据,而这也成为千挂的核心竞争力。通过大模型对海量路测数据进行挖掘,可以释放数据的黄金价值。目前,千挂超过95%的训练数据都来自于大模型的自动化标注,而大模型进行模型压缩后得到的车端模型,可以部署路测,获得更多数据,进一步帮助迭代优化模型。

千挂正在跑通技术到产品的闭环

可以说,BEV重新定义了空间和时序,让空间和时序统一,直接在上帝视角下完成了感知、规划、控制、决策的高度统一。未来端到端将成为行业标配。

在这场技术加速赛当中,得益于叶璨博士及其团队极其前瞻的技术嗅觉,千挂在夯实的技术基础上启动端到端的工作,在海量仿真测试的基础上,在国内率先实现了公开道路的常态化的端到端智能驾驶大模型闭环测试,真正迈出了技术体系2.0的第一步,完成了从0到1的突破。在这场高手如云的比赛当中,千挂进入了第一梯队,以国内领先的身位,跑出了自己的第一个里程碑。

在千挂这支技术尖兵团队里,聚集了众多在AI领域深耕多年的顶尖人才。叶璨博士毕业于美国卡内基梅隆大学(CMU)的人工智能专业,曾履职快手资深技术总监,负责了快手主站推荐、快手 AI 技术,以及快手私域和社交业务,在他的带领下,快手实现了强化学习在工业界的首次大规模落地应用。在叶璨博士背后,是一群有着在百度、快手、腾讯、商汤等技术巨头丰富经历的技术专家,和国内外头部院校博士组成的技术团队,在这场端到端的赛跑中,他们打通了感知、预测、规划、控制、架构等技术的任督二脉,攻克了一个又一个的技术难题。

在技术的长板足够长的同时,千挂在资本层面也取得长足的进展,近日,千挂科技顺利完成 Pre-A 轮融资的新一轮交割;在商业化层面,千挂在中国东部的主要一级干线路段完成300余次的载货运输服务。

这家年轻的公司正在走出从资本、商业化、技术的全面正向闭环,以领先的技术优势打开一个全新的物流实践地图,展现出技术如何驱动商业升级发展。


返回网站首页

本文评论
美登月火箭发射连续推迟 马斯克暗示应改用甲烷作为燃料「马斯克发射火箭的时间」
9月5日消息,当地时间周六,美国宇航局(NASA)再次决定推迟无人环绕月球任务Artemis 1(“阿耳忒弥斯1号”)的发射,此前任务团队在向太空发射系统(SLS)火箭加注液氢时遭遇泄漏问题。对...
日期:09-25
招联消费金融发布130亿参数开源金融大模型“招联智鹿”_招联消费金融有限公司是什么贷款我没操作
11月6日 消息:招联消费金融发布了消费金融行业首个130亿参数的开源大模型 “招联智鹿”,在权威榜单 C-Eval 和 CMMLU 上名列前茅。该模型在通用知识领域获得了权威认可。芒果...
日期:11-06
三星f669_三星f669电池型号
是三星(中国)电子有限公司推出的一款手机。虽然此款手机已经停产,但是根据一些用户的评价,我们可以了解到的性能、功能和特点。首先,作为一款功能性手机,其性能是比较稳定的。它...
日期:05-29
iqoo neo 8+128参数「1.5K 144Hz新基材直屏 iQOO-Neo9参数曝光,骁龙8 Gen 2处理器」
来源:中关村在线据最新消息,iQOO即将发布一款名为iQOO Neo9的新机。博主@数码闲聊站今日披露了该机的主要参数。预计这款新机将配备一块6.78英寸1.5K+144Hz新基材直屏,前置16MP...
日期:12-12
苹果不坑穷人?曝iPhone 15 Pro不涨价 Pro Max涨价_苹果promax降价了吗
【手机中国新闻】7月7日,手机中国注意到,有相关数码博主暗示,iPhone 15系列中的Pro机型可能不会涨价,但是iPhone 15 Pro Max或许不是这样。在和网友的互动中,该博主透露称,iPhone...
日期:07-08
小米12S减600元:跌价24期免息 到手3399_小米10s大降价
马上双十一,很多手机厂商已经提前一个月就开始了促销活动,小米作为每年双十一促销力度最大的手机厂商之一,今年也不例外,小米12S手机立减600元,现在到手只要3399元了,而且还能跌价...
日期:10-25
mate20pro戴口罩「华为Mate 50 Pro喜迎新功能:终于支持戴口罩识别」
如今,出门戴口罩已经成为常态,很多小伙伴都在期待手机支持支持戴口罩识别。近日,数码博主@曦夕Katarina 透露称,华为Mate50 Pro的全新鸿蒙HarmonyOS 3.0.0.150版本,有望支持戴口...
日期:10-05
迅雷公司股票「迅雷:第二季度营收7830万美元 同比增长41.9%」
  讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收为7,830万美元,同比增长41.9%,符合预期收入指引。基于通用会计...
日期:09-30
微软首席执行官纳德拉抨击谷歌 分享他对人工智能的巨大担忧
10月9日消息:微软一直是人工智能(AI)领域的领导者,将其从理论概念变成了实际应用。该公司在 2019 年的一篇博客文章中详细阐述了自己的计划,几乎预测了未来。剑网3新门派仅仅几...
日期:10-09
信息化观察网成功举办2020中国智慧办公产业生态大会_2020智慧年会
  4月17日,由信息化观察网、中国智慧办公产业生态大会组委会共同主办的“2020中国智慧办公产业生态大会”线上会议成功召开。本次大会以“数字化驱动 无边界协同”为主题,...
日期:02-13
机房巡检机器人+智能运维解决方案 京东数科聚焦IDC产业痛点(电力机房巡检机器人)
  12月18日-19日,第十四届中国IDC产业年度大典在京正式举办。京东数科出品的机房巡检机器人凭借综合性能与机房场景的深度解决方案,荣获“2019年度中国IDC产业优秀智能运维...
日期:09-08
转转上买二手手机可靠吗_转转 & 找靓机618盛典:17日晚8时全面开启,手机数码超低价!
  一年一度618,还上转转找靓机!   6月17日晚8时至6月18日晚24时,转转集团旗下转转 & 找靓机两大平台联合推出的“1折抢大牌——618盛典”大促再次火力全开:   大额满减...
日期:11-23
OPPO K11搭载红外遥控:适配国内外数千个家电「oppo k5红外遥控」
OPPO K11将搭载“红外遥控”功能,可以控制国内外数千个家电品牌的设备,电视、空调、风扇,均可由OPPO K11手机遥控。新零售背景下社区团购OPPO的入门旗舰产品OPPO K11已经官宣,将...
日期:07-24
p50怎么更新鸿蒙「P50等升级尝鲜鸿蒙4.0-华为加速全球第三大手机系统更新」
全球第三大手机操作系统鸿蒙,正在加快推新版本的速度,而现在一些机型已经可以提前尝鲜开发者版本了。据一些网友在社交媒体上晒出的结果看,华为Mate40、P50等系列机型现已推送...
日期:09-21
网易未成年游戏时间限制规则「网易游戏宣布增设未成年人模式:一键内容屏蔽、防网络欺凌」
快科技1月3日消息,今日,网易游戏官微宣布,为积极响应、落实《未成年人网络保护条例》,网易游戏全线产品将在防沉迷系统基础之上,全面增设未成年人模式”。目前34款首批试点产品已...
日期:01-03
托管和交易还不够,投资巨头富达自主研发数字货币激励员工
《托管和交易还不够,投资巨头富达自主研发数字货币激励员工》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我...
日期:08-01
2024年元旦世界人口接近80.2亿:每秒约4.3人出生、印度将全球第一_2300年世界人口预测
快科技12月29日消息,马上就要迎来2024年了,你直到全球人口有多少了吗?美国普查局当地时间12月28日公布预估,2024年1月1日世界人口总数将接近80.2亿,比2023年元旦增加超过7516万。...
日期:12-31
华南赛区智能车大赛_精英车队齐聚羊城:2019智能网联汽车驾驶大赛(广州)即将召开
  自动驾驶是互联网之后产生的,是汽车产业与人工智能、信息通信等产业融合创新的产物。它集合了环境感知、行为决策、自动控制等功能,进而实现对人类驾驶员部分或完全的...
日期:04-11
摩托罗拉razr40是三星的屏幕吗","info":{"wordid":"7256023626791982336"}「摩托罗拉ra
来源:中关村在线摩托罗拉即将在今晚 7 点举办新品发布会,推出 moto razr 40 系列可折叠手机。消息源 Sudhanshu Ambhore 分享了 moto razr 40 标准版的规格和多张渲染图,让用户...
日期:08-14
移动互联网应用程序管理办法「工信部组织开展移动互联网应用程序备案工作」
通信世界网消息(CWW)为促进互联网行业规范健康发展,进一步做好移动互联网信息服务管理,工业和信息化部近日印发通知,组织开展移动互联网应用程序(以下简称APP)备案工作。要求在中华...
日期:08-09