百度世界大会2023 大模型、汽车机器人来了……

发布日期:2023-10-19· 中国汽车报网 张冬梅 编辑:黄霞
张冬梅 编辑:黄霞

10月17日的百度世界大会上,文心大模型4.0如期而至。百度创始人、董事长兼首席执行官李彦宏称这是迄今为止最强大的文心大模型,理解、生成、逻辑和记忆四大能力较文心一言的线上版本有明显提升,“综合水平与GPT4相比已经毫不逊色”。

在智能汽车领域,百度也借助大模型能力发布了多个行业领先的智能驾驶和智能座舱产品,其中包括城市常用路线领航Apollo City Driving。

同一天,赶在汽车机器人极越01上市前夕,极越发布了“BEV+Transformer”算法实现的“纯视觉”高阶智驾技术方案,并对外公布了极越与百度联合研发的国内首个占用网络技术(Ocuupancy Network,OCC)。

01

大模型重构地图

今年3月,百度文心一言的发布掀起国内大模型热潮。而今,文心4.0的到来,再次为业内探索大模型产业发展路径提供了公开样本。

在李彦宏看来,AI原生应用的诞生,得益于大模型的理解、生成、逻辑和记忆四大核心能力。在大会现场,自信满满的李彦宏以《手把手教你做AI原生应用》为主题发表演讲,依次展示了文心4.0四大能力的特点与应用场景。其中,通过现场撰写武侠小说,体现了文心4.0的记忆能力。据现场演示,文心4.0不仅可以快速撰写出武侠小说的故事大纲,还能持续增加角色、增加戏剧冲突。

当然,丰富的AI原生应用才是大模型的价值所在。科技圈也已经从比拼大模型,过渡到比拼AI原生应用阶段。大会上,李彦宏发布了全新升级的十余款AI原生应用,称“我们的搜索、如流、地图、网盘、文库等,都将以一个全新的面目与大家见面”。例如,全新上线的AI原生地图——百度地图V19版本,从交互和导航两大维度对地图进行重构。

其中,交互方面,基于文心大模型推出的百度地图V19版本上线了全新“AI向导”,具备多轮自然语言交互能力,更接近“真人交流”体验。很难一次描述清楚需求时,用户可以多次补充追问;地图也能主动问询,发现和满足用户真实意图。大模型重构后的地图还可理解学习用户喜好。导航方面,大模型应用会加速城市车道级导航全国覆盖。基于文心交通大模型和自研“北斗高精”技术能力,百度地图升级推出了城市车道级导航3.0,预计将在年底前上线超过100个城市,并在2024年实现全国覆盖。

02

汽车将具有EQ和IQ

李彦宏指出:“未来的AI原生应用一定是多模态的,在信息世界之外,一定会重构物理世界,自动驾驶就是大模型重构物理世界的一个典型应用。”他表示,大模型会让百度的自动驾驶能力超越经验系统,更聪明地处理复杂场景,实现更广泛的时空覆盖。

据介绍,大模型驱动自动驾驶技术实现从基于规则到基于生成的范式变革,无人车因此得以突破特定场景或预先规划路线限制,处理不同道路条件、天气状况等长尾场景,使自动驾驶的安全性和强泛化能力越来越强大。或许,大模型时代的到来,将让自动驾驶不再是远在天边的黑科技,无人车将成为市民日常出行的常见选择。

目前,百度自动驾驶出行服务平台——萝卜快跑累计提供服务超400万次,已经成为全球最大的自动驾驶出行服务商。萝卜快跑全无人自动驾驶车队已驶入北京、武汉、重庆、深圳、上海五城。李彦宏预测,随着运营规模的不断扩大、技术水平的不断提升,伴随成本更低的自动驾驶车辆的规模化部署,萝卜快跑将越来越接近商业化盈利。

百度集团资深副总裁、智能驾驶事业群组总裁李震宇也指出,大模型带来理解、生成、推理、记忆等核心能力的突破,让汽车具有EQ和IQ,将重构智能汽车业态。

李震宇认为,大模型对智能汽车行业的重构主要体现在以下三个方面:语言大模型上车,人车交互方式会从“命令式”升级到“对话式”;通过Transformer和BEV等新技术彻底重构自动驾驶技术栈,感知能力获得代际感提升,加速纯视觉方案的成熟和普及;未来的大模型还将走向多模态,塑造出完全自动驾驶的汽车机器人。李震宇预测,2025年将实现L4级自动驾驶无人车的规模运营。

03

打造聪明的汽车机器人

作为中国智能汽车行业的代表,百度Apollo先人一步,已经在大模型重构智能驾驶和智能座舱方面取得了显著进展。

2024年被行业认为是高阶智驾规模化量产的元年和大年,百度Apollo发布了多个高阶智驾解决方案。其中,百度Apollo量产城快/高速领航功能的行泊一体产品Apollo Highway Driving Pro在新岚图Free车型首发上市。百度智能驾驶事业群组智能汽车业务部总经理苏坦透露,该方案将在更多车型搭载,并计划在2024年升级推出包含城市记忆行车、城快/高速领航功能行泊一体产品以及自主泊车2.0。

另外,百度Apollo Highway Driving Pro进一步演进,发布了全新一代Apollo City Driving,使用场景从封闭道路升级到城市开放道路,功能场景无限接近全域。国内首个纯视觉城市领航高阶智驾产品Apollo City Driving Max也将于今年第四季度量产落地。与此同时,百度Apollo还行业首发了Apollo Robo-Cabin舱驾一体软芯融合智算平台。活动现场,百度Apollo与航盛签署战略合作,宣布将共同基于高通平台打造新一代舱驾融合产品。

智舱方面,基于生成式AI进行的舱内智能推荐、主动交互等对话理解的模型,将会快速驱动车内人机交互,从现在的语音遥控式的人机交互,快速进入到“虚拟人”与人之间的拟人交互。目前,百度Apollo智舱大模型加持的车载语音产品已经在极越01、凯迪拉克锐歌、别克E5、吉利银河L7、吉利银河L6等车型中实现量产搭载,吉利银河、哈弗等品牌也即将搭载上线。在现场,李彦宏演示了极越01“类人”的智能座舱语音交互能力,不仅覆盖车内车外、四路同说、连续对话等复杂场景,还融合语音、手势、视觉识别等多模态交互。

同一天,极越发布了BEV+Transformer“纯视觉”高阶智驾技术方案,现已在上海城区道路实现领航辅助驾驶。极越与百度联合研发的国内首个OCC技术也对外公布,该技术的引入将进一步提升汽车机器人“纯视觉”高阶智驾能力。

“基于百度AI底层能力全面开放赋能的极越01,将成为目前最聪明、最懂你的汽车机器人。”李彦宏称。据悉,这款车将于10月底正式上市,并同步开启交付。

热门推荐