“2026加特兰日”演讲实录 | 加特兰系统工程师江鹏飞:《加特兰RSP 2.0:大算力雷达信号处理平台的设计理念与算法实践》

6月5日,在以“芯感知・通未来”为主题的“2026加特兰日”大会上,加特兰系统工程师江鹏飞带来了《加特兰RSP 2.0:大算力雷达信号处理平台的设计理念与算法实践》的主题分享。
以下为演讲实录:
各位嘉宾,下午好!上午,CEO陈博士与雷达产品负责人已为大家介绍了加特兰新一代雷达芯片的各项突破与创新。接下来,我将围绕其中核心子系统——算力系统,为大家详细讲解RSP 2.0,也就是加特兰第二代雷达信号处理平台的研发成果与应用价值。
我是江鹏飞,现任加特兰算法工程师,同时担任算力工程系统功能牵头人,主要负责雷达信号落地实现,以及通过架构设计、软硬件协同,完成各类计算任务在芯片上的部署。入职加特兰五年半以来,我参与了多款主流雷达芯片产品的研发。过去两年,我带领团队全身心投入RSP 2.0的设计与开发,将历代产品研发经验与行业发展趋势融入产品之中。
RSP 2.0是加特兰自主研发的新一代雷达信号处理器算力平台。该平台延续前代产品定位,可实现从原始信号到点位输出的全链路信号处理,同时进一步拓展能力,支持各类定制化计算任务。平台搭载双线程处理架构,可根据产品规格灵活扩展;依托大通量模块化设计,实现超高算力,并支持定制化编程,具备极强的使用灵活性。
目前,RSP 2.0架构已成功应用于多款芯片产品,包括5发4收昆仑芯片、6发6收安第斯芯片。其中昆仑Pro芯片等效算力不低于45pros,可支撑12发12收双芯片应用场景,未来这套架构还将适配大规模量产级应用。
下面结合实际算法应用案例,介绍RSP 2.0的性能优势,并解读背后的设计思路与理念。
首先是基础算法处理,RSP 2.0展现出突出的运行效率。雷达基础运算主要包含多维度FFT、目标检测等通用算法,速度FFT、角度FFT与目标检测常联动运行,这一场景最能体现平台效率。在昆仑Pro芯片测试中,我们以512距离门、768速度门的雷达信号矩阵作为输入,依次完成768点速度FFT运算、64点角度FFT运算,以及速度-角度二维平面检测等任务,全程仅耗时6毫秒。依托强大算力,RSP 2.0大幅缩短了基础算法的运行时间。
高效完成基础运算后,平台富余的算力与灵活架构,还能支撑各类创新算法落地,我们从信号处理链路的上下游两大方向展开实践。
在信号处理上游,核心解决行业共性的雷达抗干扰难题。当前ADAS设备普及,雷达信号相互干扰问题日益突出。市面主流雷达SoC仅支持时域平滑等简易抗干扰操作,无法有效区分干扰信号与有效信号,在滤除干扰的同时,容易造成有效信号损耗、动态范围压缩、虚警增多等问题。而干扰信号与有效信号虽在时域重叠,但在多维联合观测下特征差异显著。我们基于这一原理研发全新抗干扰算法,可精准分离干扰与有效信号,最大限度保留有效信号。
这套算法运算流程复杂、计算量庞大,恰好匹配RSP 2.0高算力、高灵活性的特点。目前我们已研发出多套技术方案与算法原型,并成功在昆仑Pro芯片上落地,实测抗干扰效果表现优异。
在信号处理下游,RSP 2.0的灵活性得以充分发挥,全面支撑定制化点云处理需求。点云增强、特征提取、分类、虚景剔除、超分辨处理等后处理算法,是提升智能驾驶雷达性能的关键,也是行业创新的核心方向。这类算法步骤繁杂、迭代频繁,需要根据车型、场景、功能做定制化调试,传统信号处理平台架构固定,难以适配多样化需求。
RSP 2.0支持用户自定义编程,可灵活调用平台算力资源,实现各类定制化计算任务。我们已在昆仑Pro芯片上完成概念验证,平台可稳定运行CNN卷积神经网络推理任务,同时也完成了点云分类、虚景滤除等传统雷达算法原型搭建。依托RSP 2.0,客户可基于底层算力搭建专属算法体系,打造技术壁垒。
以上是RSP 2.0在算法应用层面的成果,接下来为大家介绍平台核心设计理念与关键技术。
第一,8操作数并行设计。在主频率不变的前提下,提升并行度是增强算力的有效方式。RSP 2.0以8个数据为一个运算单元,每个时钟周期可同步完成数据读取、运算、输出,算力相较传统单数据运算提升约8倍。平台的计算单元与存储单元,均遵循单时钟周期吞吐8个数据的架构标准。
可重构空间架构与CGRA粗粒度可重构架构。数据运算包含读取、计算、写回三个环节,常规架构中存储带宽是算力提升的主要瓶颈。为此我们采用可重构空间架构,在不增加存储带宽的基础上,纵向堆叠运算单元,搭建二维处理单元阵列,进一步提升整体算力。针对FFT、矩阵运算、矩阵求逆等不同运算场景,我们引入CGRA粗粒度可重构架构,无需为不同功能单独搭建运算资源,仅通过重组运算单元的连接与堆叠形式,即可适配各类运算需求。两项技术结合,在控制成本的同时,让RSP 2.0运算能力达到行业领先水平。
专用并行地址控制单元。雷达信号具备多维度特征,算法运行时需要频繁切换数据处理维度。多并行运算架构下,同步访问的多组数据既要满足算法逻辑,也要适配硬件规则。我们专门设计并行地址控制单元,可实时按照预设规则生成地址序列,在矩阵转置等数据变换场景中,实现数据无缝流转。该过程无需额外耗时、不占用内存,也不会降低运算并行度,是平台的核心创新之一。
可扩展双线程运算架构。RSP 2.0在统一缓存架构之上,搭配多组控制单元与算力单元,实现双线程运行,且支持线程数量扩展。在昆仑Pro芯片中,单线程需11毫秒完成的任务,双线程并行运行可压缩至6毫秒以内。同时双线程可分工协作:一线程处理距离FFT、抗干扰等实时性要求高的任务,另一线程负责信号后处理工作。这套设计进一步强化了平台的灵活性与实用性,未来还可通过增加线程单元,持续扩充算力。
依托以上硬件设计,RSP 2.0实现了双线程可扩展、高算力、高灵活性三大核心优势。与此同时,我们也在持续完善配套软件生态,目前已推出多层级模块化可复用驱动程序、与硬件运行状态完全同步的上位机仿真程序,以及可视化内存管理等工具。
未来,我们致力于将RSP 2.0打造为具备长期演进能力的核心IP,持续适配各类新型雷达信号处理算法,助力毫米波雷达技术更好地服务大众。
我的分享到此结束,感谢各位!

