从“奶爸”到“AI宗师”

作者|秦章勇 王磊

在新势力的江湖里,理想汽车是最具战略定力的一家。

当其他选手还在烧钱试错的蛮荒期,理想汽车早已完成增程路线的验证,跑通了商业模式,并率先实现稳定盈利,提前进入成熟期。

冰箱彩电大沙发,这七个字不止是产品标签,还是理想亲手开辟的时代红利,它用一套贴合家庭出行的产品逻辑,站稳了高端家用新能源赛道,也让同行看到了差异化突围的标准答案。

可行业的跟风速度,永远超乎想象。

短短数年,这些理想的专属卖点,变成全行业的标配,所有人都在试图复刻理想的成功,却很少有人停下内卷的脚步,思考下一个时代该往哪走。

别人还在抄昨天的理想,眼下,理想开始把全部重心,押向了尚在行业前沿摸索的具身智能。

6月15日的Livis Day,跳出了流量逻辑,没有新车亮相,也没有配置堆砌,复盘整场活动,只讲一件事:理想要用具身智能,重启智能汽车的十年新周期。

马赫M100芯片、马赫VLA模型、星环OS等等,理想按照“造硅基人”的方式重构了智能汽车,这场发布会之后,外界最大的感知就是,技术创新已经成为理想足够宽,也足够深的护城河。

从早期押注增程,到如今义无反顾地投入具身智能,理想汽车没有沉溺于过去的辉煌,也没有模仿任何一家企业,而是基于自身对用户需求的理解和全栈技术体系,走出自己的具身智能道路。

一如李想的态度:理想汽车坚持做最好的自己,不要期望我们变成别人。

01

拆穿“皇帝的新衣”

物理AI时代,智能汽车应该是什么样子的?

或者我们换个方式提问,现在的智能汽车,真的智能吗?

答案是残酷的。绝大多数车型上的“智能”,更像是伪智能,本质上是座舱、智驾、车身、交互这四块功能板的拼凑,它们之间像有一堵无形的墙,数据互不相通,逻辑各自为政,决策更是南辕北辙,一旦遇到需要系统性解决的问题,就无法充分调用功能,甚至宕机。



举个例子,传统智能驾驶,一旦遇到复杂环境,就会主动退出,并把方向盘丢给驾驶员,而且只会前进和转向,不会倒车靠边停,当我们赶时间的时候,甚至都不愿用智驾。

这就是当下的现状,所谓的智能,不过是被动响应指令的机器,而不是主动解决问题的伙伴,不仅能力有限,效率还非常低。

在李想看来,虽然挂着“智能”这两个字,但今天的智能手机和智能汽车,都并不是真的智能。

理想给出的解药,叫“具身智能汽车”。

具身智能汽车既是一辆电动车,一位职业司机,也是一台AI计算机和一位生活助手,这不是四个产品,而是一个产品,电动车和AI计算机是“具身”,职业司机和生活助手是“智能”。



这不是换个说法那么简单,它意味着汽车不再是一个拼凑的玩具,而是一个完整的、统一的、有闭环能力的生命体。

在李想看来,具身智能汽车必须以保护人类安全为核心、全面学习人类技能并独立完成任务,并且比人类效率更高。

要想做到这种程度,就得重新认识汽车这个物种。

它得有眼睛,能看清车外的路况,也能看懂车内乘客的微表情;它得有大脑,能听懂你的弦外之音,也能预判你接下来五分钟的需求。它更得有手脚,能自主地完成从出发、会车、泊车到补能的全过程,而不需要你时刻紧绷着神经去兜底。

过去几年的内卷,大家都在忙着给汽车改造型、堆内饰,比谁更光鲜亮丽,比谁的场景更丰富。

而理想现在做的,是重塑汽车的神经系统和骨骼肌肉,赌的是整个行业的未来形态。有了这套清晰的顶层认知,理想后续所有的芯片、模型、系统、底盘研发,都有了唯一且坚定的落脚点。

02

重构算力底座

所有宏大的叙事,最后都得落到芯片这块硬骨头上。

最近这几年,在车载算力市场出现了颇为尴尬的一幕——TOPS数字越堆越高,有效算力却越来越虚。各家车企发布的新车,算力动辄标上千TOPS,看起来威风凛凛,但真去跑模型,有效利用率往往只有30%到50%。

一方面,通用芯片为了卖给更多厂商,势必会有架构上的兼容和妥协,这意味着大量算力在跑特定算法时,都会有浪费,导致推理延迟高、有效算力折损严重,无法支撑车规级实时多模态具身运算。

此前理想CTO谢炎也曾形容:“通用芯片像成衣,自研芯片则是量体裁衣,唯有极致定制才能构建非对称竞争优势。”

另一方面,计算机行业曾享受摩尔定律与登纳德缩放定律的双重红利,习惯了两年后性能的自动翻倍。但如今这套逻辑已然疲软,单靠挤牙膏式升级,再也满足不了爆炸式增长的算力需求。



再有就是,传统缓存架构需要反复读写,搬运海量的视觉、雷达、车身数据。大量算力消耗在无效的数据流转中,为了掩盖架构缺陷,车企只能不停堆芯片、降精度、减感知,用妥协换取暂时可用。

理想干的事,比“再堆一颗芯片”狠得多:直接换掉了芯片的底层架构逻辑。

马赫M100,全球首款量产的动态数据流AI芯片,5nm车规级工艺,单颗算力1280TOPS,双芯片上车总算力2560TOPS。

但这都不是重点,重点是它抛弃了行业沿用了几十年的“先存再算”缓存架构,改用“让数据流动来驱动计算”的数据流架构。

谢炎在现场打了个比方,说得非常形象,“它是用完全不同的思路造出来一栋完全不同的房子。冯·诺伊曼架构用70年推动了通用计算的辉煌,今天我们以马赫M100为起点,希望用数据流架构接过历史这一棒,继续推动AI计算再辉煌70年。”

能说出这句话的底气在于,马赫M100的实际算力利用率超过82%,而行业主流通用架构想摸到这个数,难如登天。



除了智能驾驶,马赫M100还能跑其他大模型,比如部署Qwen3.5-35B-A3B通用大模型。发布会现场,谢炎直接展示了在通用模型部署上的测试结果,英伟达桌面超算DGX-Spark的售价4万元,测试结果显示,马赫M100的prefill速度是DGX-Spark的2.7倍,decode速度是DGX-Spark的1.5倍。

正是这颗芯片的架构创新,让ISCA破例向一家车企敞开了大门,该论文入选了国际计算机体系结构研讨会ISCA 2026工业分区,也是自ISCA工业分区设立以来,全球首家入选的汽车企业。同批入选的是谷歌、Meta、美光这些纯种硅谷硬核玩家。



除了革新硬件架构,理想还自研了专属编译器、底层驱动与AI运行时工具链。可以实现芯片、编译调度、VLA模型的原生协同,从根源上消除了外购芯片软硬件适配割裂的行业通病。

所以对于行业而言,马赫M100的真正价值,是终结了通用芯片统治车载AI的时代。它为物理AI时代的智能汽车,建立了全新的算力底层范式,也成为理想具身智能最稳固的硬件地基。

03

具身大脑再进化

芯片是心脏,但心脏跳得再猛,没有大脑指挥,也只是一团高性能的肌肉。

传统车载AI最大的问题,就是“大脑分裂”。如前文所说,座舱和智驾两者各想各的,数据不共享、认知不连贯,如果想车辆舒适且安全地跑完长途行程,传统智能车只能拆解成碎片化操作,全程需要人工介入兜底。

为了实现“更安全、更高效、更强大”的能力,理想具身智能的大脑被拆成了“左脑”和“右脑”,语言智能由马赫Mind-Pro和Mind-Edge负责,机器智能由马赫VLA负责,在理想汽车基座模型负责人詹锟看来,任何一侧单独存在,都不能形成完整的具身智能能力。



语言智能负责语言与逻辑思考,听懂指令、推演行动方案,机器智能则负责三维视觉感知与躯体动作控制,看清物理世界、精准执行操作。

其中马赫Mind-Pro覆盖车辆控制、智慧出行、办公、问答、娱乐全部车载高频场景,而且基于Token压缩技术,在任务完成率不下降的前提下,整体Token平均消耗降低了38%,工具调用冗余轮次降低47%,模型TPS峰值达到208token/s。

对于车载Agent来说,这些数字意味着同样一个任务,可以用更少Token、更少调用轮次和更低时延完成。

马赫Mind-Edge则是端侧原生智能体模型,多模态流式时序的建模,让模型能够连续理解动态的物理世界,同时具备因果推理和自主决策能力,摆脱传统AI“只回答不行动”的模式,专门来搞定即时的舱内交互。

两者配合,让车既能理解各种复杂的指令,又能实时回答像“我的耳机掉在哪个座椅上”的问题,让车成为真正懂你的助手。

“更安全”则交给了机器智能端的马赫VLA,传统辅助驾驶系统中,感知、预测、规划往往分别工作,容易出现“效率低,结果错”的情况,理想这次将其升级为原生多模态MoE模型,让看见、理解、思考和行动在同一个框架内对齐。

还首次引入了3D ViT全域视觉模型,系统能实时把二维的摄像头画面,在大脑里构建出像素级的三维空间。有了它,机器智能真正像人类一样去感知和理解这个真实世界。

能力也很直观,普通人开车遇到紧急情况刹车平均需要0.45秒,而新一代马赫VLA系统,反应耗时仅需0.28秒,这一水平已经接近顶级F1车手0.25秒的人类生理极限。

在120km/h的速度下,这0.17秒的差距意味着提前6米刹停。而6米,可能就直接避免了一场重大事故。



算力和训练规模也同步放大,双马赫M100让车端算力达到2560TOPS,模仿学习数据规模提升50%,强化学习数据量提升了15倍,强化学习训练算力提升5倍,模型参数量提升10倍,每秒Token计算量提升15倍。

但让人印象深刻的不是数字,而是那些涌现出来的能力:倒车让路、识别交警手势、穿越无车道线的城中村雨夜窄路。

今年下半年,用户也将在现实中,感受到理想具身智能汽车所带来的变化:

7月,智驾效率整体将提升30%,可以协助用户通过限宽墩、限高杆等复杂场景。9月,用户则会体验到人类司机的能力,包括窄路倒车、会车倒车让行、复杂路面通过,以及智能地锁和车库门控制。



12月OTA,则是理想最有野心的一步,让Livis的安全和效率超越人类。用户误触方向盘会主动防护,系统能紧急躲避补偿,甚至可以听从交警指挥。

最关键的是,理想官宣要在第四季度,对齐特斯拉FSD V14的能力。

04

别人抄不走的作业

对于其他车企而言,芯片可以自研,模型可以迭代。但真正能拉开代差的,从来不是某一个单点参数,而是这些东西有没有长在同一个身体里。

当下大多数车企,走的都是组装式研发路线。比如芯片采用外购,系统是外包,智驾算法分包给供应商,座舱再找另一家做,硬件定型之后软件来做适配。结果就是,软件想优化,硬件改不了,硬件出了下一代,软件又得重新联调,软硬件永远存在适配鸿沟。

这种碎片化模式,适配不了传统智能,更承载不了具身智能的一体化逻辑,理想最大的优势在于,敢推倒重来,颠覆旧有的逻辑。

2021年,理想立项自研操作系统星环OS,到2022年芯片和800V主动悬架立项,再到2023年基座大模型立项,这些不是“并行项目”,但是同一条命的根系,从第一天起就同步定义、协同研发。比如算法需求定义硬件架构,硬件迭代反哺算法升级,软件和硬件之间不是“适配关系”,是共生关系。

组织层面上,更能看出这种“共生”不是嘴上说说。



基于具身智能企业的定位,理想按照“造硅基人”的方式重构了研发体系,重组为Infra团队、基座模型团队、软/硬件本体团队以及评估团队,类似于心脏、大脑、手脚等。好处在于,让做模型、芯片和执行器的人,从一开始就坐同一张桌子。

星环OS就是这套体系的神经中枢,它打破了多域隔离的旧架构,用统一底层内核打通算力池、感知设备、智能终端与车身执行机构,从而达到“感知-决策-执行”全链路的深度融合。

全线控底盘则是最终的执行躯干,无机械硬连接的纯电控制信号,可以毫秒级承接VLA的决策指令,让大脑的每一次思考,都精准落地为轮胎的动作。

正如理想CTO谢炎所言,智能化的竞争,从来不是参数竞赛,而是芯片、OS、模型三者深度垂直整合带来的系统化效率与体验优势。



单一技术或许可以被追赶,炫目的功能可以被复制,但一整套磨合多年、自迭代、自闭环的工程体系,没有任何企业能在短期内复刻得了。

所以时至今日,智能汽车的时代分层已经彻底清晰了。

短期竞争,拼的是内饰、大屏、冰箱等表层硬件,门槛极低。中期竞争,拼外购智驾方案和通用大模型,这个差距两三年内也会被抹平。而长期竞争,拼的就是理想已经站稳的这个位置:自研芯片、原生大模型、软硬一体工程体系、全域数据闭环,这是未来十年维度的壁垒。

从靠产品定义取胜,到靠底层技术立身,理想完成了一次彻底的身份跃迁。

持续的自研投入,让技术可以全系复用、摊薄成本,海量的实车数据闭环,让智能能力持续进化、越用越强,形成无法逆转的马太效应。

所以Livis Day的真正意义,从来不是发布几项新技术。而是宣告理想正式走出那片红海,从地基开始,用芯片、模型、OS和底盘等创新技术,开辟了一条别人追不上的赛道。