端到端AI,内存墙是真正的杀手

500

前段时间,阿波罗二号登月任务被誉为人类史上最伟大的工程成就之一。

它飞得比任何载人航天器都远,依托最强大的火箭,为NASA登陆火星的雄心注入了强心针。

与之相比,另一个目标——完全自动驾驶的陆地车辆则不同。

阿波罗所代表的,是“确定性”工程的极致。

环境极端但已知,故障模式明确,从轨道力学到火箭推力,一切都被牛顿和开普勒留下的方程精确控制。

工程师可以事先写出每一条规则。

但自动驾驶无法这样设计。

城市街道上,一个追球的孩子、被风吹来的垃圾、雨中模糊的车道线、愤怒的司机——场景无限多样,没有哪套规则能穷尽所有可能。于是,工程师转向了“概率”工程:让神经网络从海量数据中自己学习模式,学会适应和泛化。这是唯一可行的道路。

概率系统虽强大,却天然带有风险。

它的决策来自内部输出的概率分布,在分布的边缘,无论多么罕见,都可能出现灾难性的错误。在软件里,这意味着数据损坏;在连接着方向盘和刹车片的物理系统中,则可能意味着致命的事故。

这是我们在物理世界中大规模部署端到端人工智能时,真正在支付的成本,那个被资本市场传唱的“像素到扭矩”的神话,每帧都建立在极其狭窄、极度确定、濒临物理极限的数据通道上。

在芯片产业里,我们把这条通道的瓶颈称为“内存墙”。

今天,它不仅仅是高性能计算的烦恼,它成了判定人类生死的那面墙。

内存带宽如何成为概率的硬边界

端到端人工智能在物理世界中有多脆弱?多难搞?

比如端到端自动驾驶大模型,参数量突破千亿级别,当它面对暴雨中的街道,试图在毫秒内将摄像头、毫米波雷达的原始输入映射为方向盘的转角时,计算单元必须在极短的时间里反复访问存放着模型权重的存储器,将海量的参数搬运进运算核心,完成概率采样,再把中间结果写回。

这个来回搬运的过程,所耗费的时间都受制于内存的带宽和物理距离。

但是,算力在过去十年间以指数级膨胀,而内存带宽的提升远远跟不上。

在存储与逻辑芯片之间,数据吞吐量的增长曲线近乎平缓,业界给这个困局起了一个形象的术语:“内存墙”。

无论你的神经网络有多大,有多深邃,推理能力有多惊艳,它在真实世界的物理时间约束下,只是一条被喂不饱数据的饥饿流水线。

高速行驶的车辆是不会给AI留下等待数据搬家的余地的。

以120公里时速巡航时,系统在数十毫秒内必须完成从环境感知到控制输出的整个闭环。这期间任何一点内存访问的排队延迟,都意味着车辆在盲开数米。

在概率模型里,这一丁点延迟会剧烈扰动输出分布。

原本应该以高置信度做出的避让动作,可能因为计算未完成而退化为一次保守的模糊估算;原本可以清晰识别的紧急车辆,可能因为中间特征图加载不及时而变成背景噪声。

这不是模型的错,它的网络结构、训练数据、损失函数都无可指摘。

真正在制造灾难的,是把一个计算密集、带宽饥渴的概率系统,塞进一个物理上根本喂不饱它的硅基架构里,却期待它能实时响应这个刚性的世界。

况且,这里面还有在产业里难以直接可观的软错误现象,内存单元里存储的每一个比特,都是一个微小的电荷,来自太空的宇宙射线、芯片封装材料中微量的放射性杂质、甚至电源的微小纹波,都能瞬间翻转那个电荷的状态,让“0”变成“1”。

在云数据中心的服务器里,我们有复杂的纠错码(ECC)、有内存巡检和冗余替换机制,成本高昂但可以接受。

在一辆量产汽车的控制板上,内存颗粒正裸露在远比机房恶劣的电磁和温度环境下,并且受限于功耗和成本,它们通常缺乏服务器级别的纠错能力。

假如某次比特翻转恰好发生在AI模型输出的转向扭矩值的高位,一个原本代表“微调向左三度”的命令,可能静默地变成“全扭矩右转”,端到端系统不存在一个中间的规则校验环节来拦截这个物理错误,因为像素直接映射到了扭矩,概率算法也不会去质疑传感器或内存的底层物理异常,它只会忠实计算被篡改后的输入,得出一个灾难性的合理结果。

这意味着,我们在道路上驾驶着依赖海量内存的端到端汽车,实际上是把金融数据中心的闪电崩盘风险,搬到了一台没有熔断机制的移动机器上。

而比特翻转,便是被盲投的骰子。

这些硬梆梆的物理约束,联合构成了一个无法用更多训练数据或更深网络来解决的硬边界。

概率系统面对物理世界展示出的不可靠,根本上源于支撑它的确定性硬件有自己的物理极限,而这极限在端到端的疯狂通胀中被逼到了绝路。

为什么资本市场不为“安全”买单

如果物理层面已经明确揭示了纯概率驱动的致命风险,那么合乎逻辑的做法,应该是像航空工业一样,在核心周围包裹一层不可逾越的确定性安全壳。

比如那些形式化的验证过滤器、独立物理隔离的看门狗系统、自主优雅降级的安全协处理器,这些工程技术都不是什么天方夜谭,它们甚至存在了数十年,广泛服役于核电站、高速列车和生命维持设备中。

吊诡的是,在最需要它们的自动驾驶和人形机器人赛道上,这些安全外壳却被资本市场的估值模型拒之门外。

这是发生在财务报表和商业故事深处的战争。

端到端人工智能为科技公司提供了一张通往万亿美元估值的门票,因为它的底层叙事是纯粹且迷人的轻资产逻辑。

在这个故事里,贵的东西是数据和算法,真正的资产是能够自我进化、征服所有长尾场景的软件大脑。

一旦把铁壳子里的激光雷达、把独立于主芯片的安全协处理器、把逐场景的形式化验证重新请回系统,公司的商业属性就从一家拥有无限边际的软件平台,滑回了一家重资产的精密制造企业。

而资本市场给予前者的市销率,往往是后者的十倍。

所以,华尔街不需要“最安全”的自动驾驶系统,它需要的是“最具估值想象力”的故事。

一个CEO如果在财报会上说,我们在下一代硬件中额外增加了80美元的独立安全模块,以确保在最极端的物理异常下系统依然可以守住底线,分析师们听到的只有“侵蚀毛利率”。

这80美元乘以百万级的出货量,是一笔可以被精确计算的利润损失,而它所预防的那些概率极低的灾难性事故,却是一笔永远不会出现在损益表上的“潜在节省”。

安全在当下冷血资本的定价模型里,是只能看见成本、永远无法产生额外收入的负资产。

于是,整个产业的经济激励发生了根本性扭曲。

马斯克提出的“更多数据、更大模型、安全自动涌现”,在科学上可能经不起推敲,但在金融上却近乎完美。

它不需要任何拉低毛利的物理外壳,安全是免费的,会随着参数规模的扩大自己从模型内部生长出来。这种叙事把投资者对确定性的任何一点渴求,都重新包装成“对技术路线的不信任”。

任何坚持添加独立安全冗余的工程团队,在公司内部都会被贴上保守、不懂商业、阻碍创新的标签。

资本的风险模型还有一层更冷酷的盘算,那就是尾部风险的“外部化”。

一家自动驾驶公司即便发生少量致命事故,最终的成本也并非由它全额承担。法律和解的费用、保险覆盖的部分、以及公众记忆的短暂周期,会共同将灾难转化为可管理和可预算的运营损耗。

而死去的人,不会在股市开盘时引发股价的永久折价。

在极端情况下,那些作为自然人乘客或行人的生命,在资本的方程式里被视作一种可以被统计波动平滑掉的“摩擦力”,是一个奇点来临之前可以接受的过程代价。

没有任何人会在公开场合说出这个逻辑,但每一家对此心知肚明的公司都在用加速部署的速度,默写着一份免赔的赌约。

这种激励结构造成的直接结果,就是过去五年间端到端系统被以前所未有的速度投放到公共道路上,而确定性外壳的研发始终停留在学术界和白皮书中。

汽车工业用一百年建立起来的功能安全体系——独立冗余、失效可操作、故障静默……在人工智能闯入后,被嘲笑为“老派的工程包袱”。

那些被省略掉的隔离、被简化掉的看门狗电路、被集成掉的专用传感器,它们减少的每一分成本,都被兑换成了股价的涨幅,而它们本应拦截住的那些惨烈瞬间,正悄无声息地分摊到不知情、未同意的公众头上。

在芯片底层,重建安全围墙

我们又能怎么办呢?

要打破“内存墙既是物理瓶颈、又是资本借口”的僵局,唯一的办法是将安全从一句口头承诺,变成一块谁也无法绕过的硅基实体,大概至少是一颗物理级隔离、拥有独立存储通道、运行形式化验证代码的安全协处理器。

这颗协处理器的逻辑简单到几乎原始。

它不需要理解什么是行人、什么是湿滑路面,不用运行千亿参数的Transformer。它的程序里只有几十条经过数学证明的不可违反的物理规则和硬性交规,即禁止在检测到正前方固体障碍物时全油门加速;紧急制动请求的优先级永远高于任何驱动指令;当通信中断或主系统心跳丢失超过阈值时,执行安全停车。

它拥有的只是一张极小的、不需要高带宽内存支撑的真值表,运行在一块独立的、抗辐射加固的、小容量但延时绝对确定的内存上。

在物理架构上,这颗协处理器和主AI芯片共享一个封装,但电源域隔离,时钟域独立,内存总线完全私有。

它直接监听一路未经AI处理的、功能性单一的传感器——例如一对只负责探测近距离不可穿越障碍的固态激光雷达,或者一颗只测量车辆横摆角速度的惯性测量单元。

这路传感器的数据不进概率神经网络,不被裁剪、增强或猜测,只是原始的电信号,直通安全协处理器。

一旦主AI由于带宽拥堵、比特翻转或概率误判而发出危险的指令,这颗小芯片有能力在纳秒级的时间内发出硬件中断,从物理层面截断执行器的控制链路,将车辆送入确定性的安全状态。

这套系统的物料成本,在半导体供应链的角度来看,并不高昂。

如今一部中端智能手机的SoC上,集成了负责加密的安全隔离区、负责音频的DSP、负责始终感知的传感器中枢,任何一块的复杂度都不亚于我们需要的这个驾驶安全核心。

技术上零障碍,供应链完全成熟。

真正昂贵的,是让它诞生的商业意志。

那种商业意志的转变,最终会被两股力量逼出来:监管的硬杠杠,以及保险的精算。

当自动驾驶事故从“小众奇闻”积累成社会无法忽视的常态,政府部门将被迫制定明确的验收标准,而不再满足于企业“平均比人类安全”的统计把戏。

届时,法律条文将很可能明确要求任何L4级别以上的自动驾驶系统,必须配备一个物理上独立于主AI决策链的、功能可审计的安全停机模块。

这种模块的存在,将会像今天的ABS或安全气囊一样,成为上路许可的硬门槛。

没有人会问一辆车的安全气囊“平均而言”是不是多余,因为它在一次碰撞中能发挥作用就已足够。

确定性外壳将成为一种强制性的物理存在,而非可选的软件补丁。

保险上亦然。

今天自动驾驶车险的定价是粗糙的,因为缺乏可量化的安全分层标准。

一旦物理安全核成为普遍配置,精算师就有了一个强力的区分因子,搭载独立安全协处理器的车辆,在极端故障场景下的致命事故概率有数量级的下降。

这种概率上的显著差异,会被直接转化为保费价格的巨大鸿沟。

为没有安全核的车辆支付高额保费,本身就是一种市场惩罚;而为有安全核的车辆支付低额保费,则是对安全工程的直接奖赏。

当这种价格信号清晰、稳定地传递回来时,资本市场的估值逻辑会随之动摇,因为安全不再是一项无法折现的成本,它变成了可以为产品赢得市场准入门票和保险折扣的可定价资产。

这一波变革,必然还会为存储产业自身打开一片意想不到的新市场。

确定性安全核对内存的要求,和云端的AI训练截然不同。

它不追求庞大的容量,而要求极端的低延迟、完全的确定性时序,以及面对恶劣环境时近乎完美的抗软错误能力。这些特性恰好是新型非易失性存储器,如磁阻式随机存取内存(MRAM)或电阻式内存(ReRAM)的优势所在。

MRAM存储单元以磁性状态保存数据,对宇宙射线免疫,读写延迟可以压到数纳秒以内。

一个围绕功能安全需求而生的“嵌入式安全内存”细分市场,将有机会把存储产业从无限堆叠带宽的成本陷阱中拉出来,开辟一条以可靠性和确定时延为价值标尺的高端赛道。

若干年后,当我们回顾产业历程时,或许会看到这样一条脉络,正是社会无法再承受“尸体堆积”的代价,才最终催生出了一个以物理安全为锚点的芯片新品类。

这就是我认为的端到端AI物理化的最终宿命,它不会被叫停,但终将被约束。

资本的狂飙终会撞上法律的边界,数据的崇拜终会让位于物理的铁律,而那个曾被嘲笑为老派工程学的确定性外壳,将以一块小小的、焊死在主芯片旁边的硅片形态,完成它对狂妄概率论的最终裁决。

当市场终于学会为“安全”这个最古老的资产精准定价时,我们今天所目睹的一切惨痛实验,才会被真正宣告终结。

在那之前,沉默的内存颗粒们,仍将与飞驰的车轮一道,继续做着这场无人知情、无从同意的道路模糊测试。

作者 | 东叔

审校 | 童任

配图/封面来源 | 腾讯新闻图库

编辑出品 | 东针商略

©2026 东针商略 版权所有。未经授权同意,禁止任何形式的转载或使用。

*本文基于公开资料分析推测,纯属个人观点,仅供参考,不构成任何决策或投资建议。

站务

全部专栏