专访 || 清华大学车辆与运载学院教授李升波:我们正在推动一条全新的端到端自动驾驶路线
编前:近日,智能网联汽车领域的“新政”频出。9月15日《关于加强智能网联新能源汽车产品召回、生产一致性监督管理与规范宣传的通知》结束意见征集;9月17日,工业和信息化部发文公开征求《智能网联汽车组合驾驶辅助系统安全要求》强制性国家标准的意见。这些动作与今年2月正式发布实施的《关于进一步加强智能网联汽车产品准入、召回及软件在线升级管理的通知》一道,回应了市场与消费者对安全的关注,并对智能网联汽车产品提出了更高要求。
从“智驾平权”概念开始流行,到多起智驾交通事故引发民众对“智能驾驶”的态度更趋谨慎、理性。智能驾驶在舆论场上的热度如同过山车一般。我国汽车智能化技术发展节奏是否会因此波动?我国在这个领域的优势有多大?如何看待智能化技术发展趋势?近期,《中国汽车报》对清华大学车辆与运载学院长聘教授、博士生导师李升波进行了一次深度访谈。
要平权更要安全
《中国汽车报》:从年初“平权说”的豪情壮志,到如今行业上下的谨小慎微,行业对智驾的态度与热度,可谓是大起大落,如何看待这种变化?
李升波:“智驾平权”代表了我国产业界积极进取的心态,值得鼓励和肯定,但必须以保证安全性为前提。“平权”旨在通过技术创新和成本控制,将原本仅限于高端车型的功能普及到中低端价位的车型上,让出行更加便利和舒适。简单讲就是“用更少的钱,享受更好的功能”。这种自上而下的技术平权,反映了汽车行业服务大众的初心与愿景。
平权的核心是降本,而降本的底线是安全。如何在保证出行安全和性能不缩水的前提下降低智驾系统总体成本,是全行业面临的共同挑战。例如,虽然可以通过降低传感器、域控芯片等硬件配置来压缩系统成本,但硬件配置降低必然带来一定性能损失,这道“减法”需要由更高质量的数据、算法和模型等软件系统“加倍”弥补,否则系统的安全性必将存在极大隐患。因此,核心技术的进步仍然是智驾平权的基本保障。
《中国汽车报》:当前行业存在这样的现象:智能网联技术和产品不断进化,但营销层面已经“先行”,甚至比较激进。您怎么看?
李升波:虽然过去10年智能驾驶技术有了长足发展,但需要厘清一个关键概念:当前所有量产车的智驾功能依然定义为辅助驾驶,还未达到自动驾驶阶段。通俗一点说,辅助驾驶与自动驾驶的区别有两点:一是由谁监控行车风险,二是由谁负责事故责任。
辅助驾驶是指系统在特定条件下可提供转向、加速、减速等辅助性支持,但驾驶员仍需全程监控行车环境并随时准备接管车辆控制,若发生交通事故,由驾驶员负责;自动驾驶则是系统在规定驾驶场景内,无需驾驶员监控风险的情况下独立完成驾驶任务,期间如果发生交通事故将由系统及其设计者负责。
这两类系统对感知、决策与控制技术的性能要求有很大区别。后者要求系统提供的驾驶功能几乎不能出错,甚至要达到比人类更好的水平;而前者允许出现一定小概率失误,因为人类与系统是处于人机共驾状态,系统的失误可由人类的监控和干预进行弥补。因此,个别企业将“辅助驾驶”宣传为“自动驾驶”,放任驾驶员的脱手行车,这是对用户的极大误导和对公众安全的不负责任。
政府主管部门为此发声,并明确加强监管,让汽车智能化技术从“夸大营销”回归“产品本色”,引导消费者正确认识和使用智能驾驶功能,这对汽车行业健康有序发展具有积极意义。当然,在智能化发展过程中,遇到一些问题在所难免,行业断不可因噎废食。目前,我国已经成为汽车智能化的积极探索者与创新引领者,应在坚守安全底线、服从统一监管的基础上,鼓励市场主体进行技术创新与产业协同,稳步推进高级别自动驾驶技术的成熟与落地。
“端到端”不神秘
《中国汽车报》:“端到端”是当前最热的词汇,它与之前的规则驱动有什么不同?
李升波:智能汽车的研发历程可追溯至上世纪60年代,以斯坦福大学的“Stanford Cart”等为代表。进入本世纪初,随着一批高科技企业的战略入局,智能驾驶的技术发展与应用进程显著加速。目前,智能驾驶系统主要分为两大技术路线:一类是以专家规则为核心的分模块架构,另一类是以神经网络为载体的端到端方案。这两种技术路线代表了行业在不同发展阶段的技术演进路径,即从规则驱动的专家系统向数据驱动的学习系统转变。前者通常将系统拆解为感知、定位、预测、决策、规划和控制等独立功能单元,各模块通过精心设计的专家规则进行逐一开发,并通过人类可理解的接口实现信息传递与功能协同。
随着人工智能技术的快速发展,以神经网络为载体的学习方法开始被引入到自动驾驶功能开发中。源于图像识别的技术突破,感知与预测模块率先采用人工神经网络替代传统的专家规则设计,显著提升了对混杂交通环境的感知能力。随后深度学习、强化学习等技术进一步引入,使得决策、规划和控制等模块也逐步实现神经网络化。
当所有模块均采用人工神经网络作为载体时,便形成了所谓的“端到端”自动驾驶系统。端到端的本质是通过训练一个或多个神经网络,建立从感知信号到控制命令的直接映射关系。需要特别强调的是,端到端的核心特征在于所有模块均实现神经网络化,而非局限于使用单一“黑箱”神经网络完成所有的驾驶功能。因此,该类系统也可以是多个神经网络构成的,比如说三段式、两段式端到端,也可是仅有一个神经网络,即一段式端到端。
从行业现状看,分段式端到端更适合团队分工协作,具备更强的工程落地性,这也是目前多数企业采用的方案。但是模块之间采用人类可理解的结构化语义作为信息传递介质,不可避免地存在从感知到执行之间的信息损失,这会导致系统能力受限,且增大了维护和扩展难度。而一段式端到端因其全神经网络化的统一框架和数据闭环学习能力备受关注,特别是采用隐层特征进行信息传输之后,理论上说比多段式具有更高的性能上限。
实际上,端到端自动驾驶并非一个全新概念,其历史可以追溯到1988年的AL‐VINN,该系统的输入是相机和激光测距仪的两个“视网膜”,由一个简单的浅层神经网络生成方向盘的转向指令。2016年英伟达公司曾经进行类似的尝试(即DAVE-2系统),演示了端到端技术应用于车道保持功能的可能性。从商业上说,这两项技术的落地应用并不成功,受限于当时的算力、算法和数据能力,未能突破复杂场景下的实用性瓶颈。
端到端技术的首次商业化突破来自于特斯拉公司。从2018年开始,特斯拉利用量产车构建数据闭环体系,采用“影子模式”收集稀有高危长尾场景(即corner case数据),上传至训练中心之后采用监督学习模仿专业驾驶员的驾驶方式。特斯拉于2023年底发布了FSD V12版本,它所展示出的优秀驾驶能力不仅让研究人员感到惊讶,也大幅超越了大众的心理预期。
《中国汽车报》:我国在这一领域的发展现状如何,是跟跑还是领跑?
李升波:可能公众不太熟悉的是,大约在2018年(即上文所提特斯拉利用量产车构建数据闭环体系)的同一时间,清华大学车辆学院也开始了端到端技术的探索。项目启动之初,我们就意识到特斯拉所提出的技术路线并非每一家科研机构都能效仿的,“数据匮乏”与“算力不足”等资源局限是国内汽车企业面临的最大瓶颈。
我国是继续跟着走,还是闯出一条新路线,行业众说纷纭,一时难以形成统一的意见。这种情况之下,高校作为原创技术的策源地,应该有所作为,也是可以有所作为的。为了破解资源欠缺的困局,我们提出了一个颇为大胆的思路——数据不足仿真“补”,算力落后算法“超”。
现在想一想,当时颇有点逼上梁山的味道。跟着国外的技术方案跑,永远是跟随者,况且资源有限,我们极大可能跟不上,惟有换一条赛道,才能走出自己的路!经过大概3年的尝试,我们正式推出了以仿真数据为主、以实车数据为辅,强化学习与模仿学习相结合的训练路径。强化学习是这一方案的核心特色,这与之后DeepSeek采用的技术方案有异曲同工之处。
《中国汽车报》:和特斯拉FSD相比,你们独创的这一方案有哪些优势?
李升波:与特斯拉“实车数据+模仿学习”的技术路线相比,我们的方案在训练成本和模型能力方面均具有显著优势:一方面,高保真仿真数据能够海量廉价生成,大幅降低模型训练的数据成本;另一方面,强化学习具有近似人类的学习机制,通过自主环境探索实现模型性能的持续提升,比模仿学习具有更高的能力上限。典型案例是棋类AI-AlphaZero,它采用强化学习、自我博弈获得了超越围棋冠军的能力。
然而只有方案还远远不够,惟有突破核心算法和工具软件的研发,才能真正服务于汽车行业。为了实现这一全新路线的落地应用,团队先后建立了面向高级别自动驾驶的感知-预测-决控三段式模型架构,研发了综合性能国际领先的值分布式强化学习算法DSAC,提出了具有保辛特性的神经网络优化算法RAD,首创了时空分离的交通参与者行为预测模型SEPT,研发了共性功能原子化的混合专家感知模型CBDES MoE,设计了具有动作平滑特性的控制型神经网络模型SmoNet,开发了自主知识产权的最优控制策略近似求解器GOPS和高保真自动驾驶仿真器LasVSim,逐一解决了端到端自动驾驶面临的一系列核心难题。
以此为基础,2023年底我们推出了国内首套全栈神经网络化的端到端自动驾驶系统iDrive,并且成功在城市开放道路进行了测试验证。这标志着我国在自动驾驶领域并非处于完全跟随状态,已探索出与我国国情相符的新技术、新路径与新模式,为汽车智能化技术的全球引领迈出了坚实一步。
勇于创新才能突破
《中国汽车报》:在攻坚“卡脖子”技术时,是什么支撑团队坚持走自己的技术路线?
李升波:当前,在我国汽车行业,类似的技术引领并非个案,普遍发生于电动化和智能化的各个领域。对于任何一个行业,技术研发模式从来不是一成不变的。如果说我国汽车工业由小变大的成长过程中,采取跟随策略还能取得成功的话,那么这条“规律”将不再适用于从汽车大国迈向汽车强国的阶段,新一轮的跨越必须依靠核心技术的引领性突破。
近年,无论是在企业研发一线,还是在高校科研机构,国家坚定发展新能源汽车的战略自信,所带来的创新勇气推动了“卡脖子”技术的攻坚克难。面对国外优势资源的强大压力,自2018年起团队对几十种网络模型和学习算法设计进行反复比对、优化、验证和测试,历经了诸多酸甜苦辣,但我们并没有因困难险阻而放弃。因为看见所以相信,因为理想才得以坚持。这份坚持让我们最终确立了更适合自己的技术路线,走出了一条独具特色的发展路径。
《中国汽车报》:端到端技术方案有很多优势和实践,是否意味着自动驾驶将沿着这条路线持续演进下去?端到端有没有短板?
李升波:端到端方案的优势根植于人工智能的本质属性,即依托海量数据学习神经网络模型。这一方案具有可持续迭代的优化改进能力,具备更高的性能上限且无需繁复的手工编写代码。迄今为止,端到端自动驾驶技术的发展主要依赖“单车智能”,即每一辆车依靠其自身的传感器与控制器独立完成环境感知、自主决策和运动控制等功能。
然而,受限于标注数据规模、训练算法效率与车载算力约束,现有自动驾驶系统所用神经网络参数规模仅处于千万到亿的量级,这大致相当于百万级神经元的生物体。作为对比,人类则是具有专业化驾驶能力的物种,大脑神经元的规模大致为800亿,即使是典型灵长类哺乳动物,也普遍拥有百亿神经元量级的大脑。
端到端自动驾驶系统的网络规模与人类大脑神经元的数量级差异是明显的。这样的规模差异严重制约了自动驾驶系统对复杂场景的环境理解能力及对未知场景的泛化能力,也是单车智能事故频发的重要原因。
“车路云一体化”方能破局解题
《中国汽车报》:我们关注到业界对“单车智能”方案不断改进、探索,但就“单车智能”而言,其能力有自己的极限与边界。如何破解这一难题,走出独具中国特色的创新之路?
李升波:如何破解自动驾驶的安全性“终局”难题,我认为核心思路是从“单车智能”走向“车路云一体化”,让“路”的全局视野弥补“车”的感知局限。将“聪明的车、智慧的路、强大的云”深度融合的“车路云一体化”体系是契合我国基建优势与管理模式的中国方案,是推动我国高级别自动驾驶产业化落地的核心路径。
在车路云这一框架的赋能之下,汽车行业将有可能合力构建更大规模的数据闭环系统。通过路侧设备提供全局视角、超视距预警和全天候感知,提升对城市道路交通场景的理解能力,加上路侧单元与大规模网联车队协作,实现高质量行为数据和准实时地图数据的众包采集。云控平台则依托强大算力对采集上传的数据进行清洗与筛选,同时结合仿真平台生成海量虚拟驾驶场景,构建开源共享高质量数据库。将车端数据、路侧数据以及大规模的虚拟数据相融合,建立以强化学习为主、模仿学习为辅的双阶段训练范式,有助于进一步降低系统开发成本,进一步提高行车安全性与系统可靠性。训练之后的自动驾驶大模型经剪枝与压缩后形成符合车规要求的轻量化版本,再通过OTA等方式周期性部署至车端,实现自动驾驶功能的持续在线优化。
与此同时,端到端模型结构与模型训练算法将协同演进。模型结构方面,借助大语言模型的发展,探索将语言模态迁移至自动驾驶领域,形成“多模态端到端”的全新概念。例如VLA(视觉-语言-动作)模型,这已成为行业的研究热点,预计未来三五年之内,类似人类驾驶员的多模态自动驾驶系统有望开始实用化。这类模型的参数规模预计可以达到千亿左右,甚至超过万亿,具有与人类相仿的语言交互和理解沟通能力,能准确输出各类场景之下的驾驶意图,让系统功能的可解释性不言而明。
训练算法层面,强化学习的重要性将进一步加强,模型微调与世界模型的结合正在成为主流趋势:前者依托车路数据和仿真环境不断提升自动驾驶策略的能力,后者为前者提供更多样化稀有场景与险态交互数据。两者结合不仅极大提升了数据泛化性与模型训练效率,还赋予类似人类大脑的自进化能力,为突破驾驶性能极限打开了全新通路。
《中国汽车报》:您提到了融合、协同,也提到了很多新进展。回到汽车这一产品对安全的极致追求,人工智能融入汽车后,未来发展应重点关注什么?
李升波:人工智能与自动驾驶的技术发展已深度耦合,你中有我,我中有你,二者密不可分。在汽车这一高度安全敏感的应用场景中,我们不能仅关注算法在多数常规情况下的“平均性能”,更要重视极端复杂场景下的“保底性能”。相比消费电子等领域可以容忍一定的错误率,自动驾驶一旦突破安全下限就可能导致车毁人亡的严重事故。
因此,如何确保算法维持住人类可接受的安全底线,将成为系统研发最核心的考量。这不仅关乎人工智能本身的理论突破与技术进步,更直接决定了自动驾驶系统能否真正超越人类驾驶水平。
采访手记
从年初的狂热到如今的审慎,2025年的智能驾驶赛道充满了变数与思考。在与李升波教授的对话中,我们看到了一种超越喧嚣的定力与自信。这不仅是技术路线的选择,更是一种发展哲学的确立:面对壁垒,不盲从、不追随,而是基于自身国情与优势,开辟一条全新的道路。从“端到端算法超越”的自主探索,到“车路云一体化”的宏伟蓝图,我们看到一个更加成熟、务实的行业愿景正在形成。或许,真正的领跑,并非是超越某个对手的那一刻,而是源于敢于选择一条属于自己道路的勇气。

