端侧AI时代,存储变了:江波龙全面出击

过去几年的发展证明,人工智能是一个既定的事实,各大模型厂商和基础设施供应商也前赴后继地投入到“基建竞赛”中去,以提高模型的能力和竞争力。但从人工智能诞生起就伴之而来的另一个存在已久的问题——人工智能什么时候能从云端走向终端落地,在过去多年备受关注。

带着这个疑问,全球各地的厂商也做了多样化的尝试。如去年年底以来,OpenClaw引爆的“养龙虾”热,就是其中一个典型场景。这一波浪潮更是让大家坚信,2026年真的会是AI大规模落地的元年。

为了紧抓这个机会,产业链从业者一如既往地基于AI不同环节对性能的不同要求有针对性地打造相应的软硬件产品。其中,最近半年走向风口浪尖的存储,无疑是当中的重中之重。作为国内领先的半导体存储品牌企业,江波龙已然做好了充分准备。

端侧AI存储:三大核心需求

众所周知,在2026年之前的AI建设潮中,训练(Training)是产业的主旋律,其存储系统的核心任务是承载数万亿Token的海量数据吞吐,并应对模型训练中高频、高并发的Checkpoint瞬时写入需求,以确保昂贵的显卡不因I/O阻塞而停滞,因此当时的行业焦点完全集中在支撑大规模算力集群的读写性能与可靠性上。这也正是HBM和大容量的SSD在过去几年备受追捧的原因之一。

但进入到端侧AI应用领域,存储变了。

江波龙副总裁、嵌入式存储事业部总经理黄强,在日前举办的CFM | MemoryS 2026同期与半导体行业观察等交流的时候指出,对端侧AI应用来说,因为主要聚焦推理应用,所以其跟应用场景的结合会更紧密,而且会有一些差异化,甚至可能要求便携,这就需要在功耗、性能和尺寸等方面做更好地创新。

“无论是训练还是推理,都需要面临一个重要问题——效率(或算力)的浪费。此外,高成本,尤其是高的token成本,给端侧AI带来了巨大挑战。于是,大家希望对存储处理提出分层化的概念,以更细化的方式来解决问题。”江波龙副总裁、企业级存储事业部总经理闫书印补充说。

诚然,在端侧AI(如AI手机、AI PC及智能座舱)中,由于端侧SoC的显存与系统内存共享,运行大模型需要常驻占用数GB的高速空间,这直接压缩了系统流畅度,并对LPDDR5/5x的带宽提出了极苛刻的要求,以支撑实时Token生成;同时,为了降低高昂的Token计算成本并提升响应速度,系统必须频繁调度巨大的KV Cache(键值缓存),这种“高频、小碎块、长驻留”的数据存取模式,迫使底层闪存(UFS/SSD)必须从单纯的存储介质向更智能化的方式演进,以解决频繁数据搬运带来的功耗骤增与发热难题。

而要破解这个难题,除了要在技术方面投入外,系统层面的创新也是亟需的。

500

基于存储行业二十多年的深耕和洞察,江波龙董事长、总经理蔡华波先生在CFM | MemoryS 2026峰会演讲中直言:“端侧AI同样需要深度集成的定制化存储方案,而非通用标准存储产品”,“云端AI聚焦面向GPU的专业化存储服务,而端侧AI则围绕高性能容量、SiP系统级集成封装、定制化服务三大核心需求展开,其对存储的要求与过往标准存储生态存在本质区别。”蔡华波先生进一步指出。

有见及此,构建了芯片设计、固件算法、材料工程、封测制造等全链条能力,承接起端侧AI存储定制服务Foundry模式,突破传统存储单一升级瓶颈,实现全方位综合提升。

500

据蔡华波介绍,该模式覆盖芯片设计、硬件设计、固件软件、封装工艺、工业设计、自动化测试、材料工程、生产制造等全产业链核心环节,通过各环节深度协同、技术整合与能力开放,实现存储产品从设计到交付的全链路定制化与高效化,精准匹配AI手机、AI辅助驾驶、AI穿戴、AI PC、具身机器人等多元场景,为端侧AI存储创新锚定清晰的场景导向,与云端AI存储形成优势互补。

新品迭出 + 技术突破:

江波龙领跑端侧 AI 存储赛道

深耕半导体存储领域二十余年,江波龙凭借全链条研发、设计与制造能力的深厚积淀,持续以创新产品响应端侧AI时代的存储需求。在MemoryS 2026展会上,江波龙领先的产品和技术展示—新一代PCIe Gen5 mSSD高速存储介质与SPU存储处理器+iSA存储智能体,以软硬件协同的创新思路,破解端侧AI存储的性能、容量与调度难题,彰显其在该领域的领先布局。

1.新一代高速存储介质PCIe Gen5 mSSD:小体积藏大能量,散热与性能双突破

作为面向端侧AI设备的新一代高速存储介质,江波龙PCIe Gen5 mSSD、以“小尺寸、高性能、多形态”为核心亮点,精准适配AI PC等终端设备的核心需求。该产品延续DRAM-less架构与20×30mm超小尺寸,完美兼容M.2 2230规格,更可灵活衍生为M.2 2242/2280、AI存储卡、PSSD等多种形态,实现多场景的灵活落地。

性能层面,这款mSSD搭载联芸1802主控芯片,顺序读写性能最高可达11GB/s、10GB/s,随机读写性能峰值达2200K、1800K IOPS,单盘容量最高支持8TB,可满足AI PC运行过程中海量数据的高速读写需求。

500

500

正如蔡华波在演讲中所说:“端侧AI存储的发展高度依托材料工程能力,其中散热材料更是核心技术挑战。”常规的Gen5 SSD需要做到良好的散热效果,一般都会叠加厚重的散热马甲,只能够用于台式机等较大体积的电脑。而江波龙针对PCIe Gen5 mSSD小体积、高性能运行下的散热痛点,率先设计出的专属高效散热方案—集成均热器+TIM1导热胶、石墨烯散热片、VC均热板、铝合金散热拓展卡等多重散热组件,更显轻薄,且相较于普通散热方案,江波龙PCIe Gen5 mSSD的高效散热方案可将11GB/s峰值性能维持时间提升至181秒,连续读取容量可达1991GB,是常规PCBA SSD散热方案的近2.5倍。该方案专为 AI PC KV Cache高负载场景设计,可实现Gen5高性能实时吞吐,同时兼容AI PC超薄机身,兼顾高性能与设备形态要求。

500

2.SPU+iSA:软硬件协同,赋能端侧AI存储智能化

如果说高速存储介质PCIe Gen5 mSSD是端侧AI存储的“高速载体”,那么江波龙发布的SPU(Storage Processing Unit,存储处理单元)与首个iSA(Intelligence Storage Agent,存储智能体)的组合,构建起了“芯片硬件+智能调度”的端侧AI存储软硬件协同技术闭环。

与常规SSD主控芯片不同,SPU是江波龙专为AI应用时代打造的核心智能处理单元。正如江波龙闫书印表示:“SPU它就像一个端侧的智能处理器,不只是传统的简单的数据存储,被动执行存储的指令。”

芯片基于5nm先进制程工艺打造,单盘最大容量达128TB,当前主流cSSD 容量最大仅至8TB,而大容量eSSD方案成本较高,SPU则有效平衡了容量与成本难题,可高效益替代HDD,为客户探索eSSD方案提供了新可能,同时有望显著降低整体拥有成本。SPU核心具备存内无损压缩、HLC(High Level Cache)高级缓存技术两大关键能力,存内无损压缩平均压缩比达2:1,实测覆盖文本/代码/数据库等多类数据,大幅节省SSD容量和成本;还能通过HLC技术实现温冷数据下沉至SSD,节省近40% DRAM容量需求。

500

而iSA存储智能体是面向端侧AI推理的专属智能调度引擎,作为SPU的“大脑”,其核心价值在于解决端侧AI推理过程中的存储调度痛点。随着MoE大模型的广泛应用,参数庞大、KV Cache膨胀快、I/O延迟影响推理流畅度等问题日益突出,而iSA通过MoE专家卸载、KV Cache智能管理与智能预取算法,实现了存储调度效率的大幅提升。

江波龙与AMD的深度协同,更让这一技术组合的实力得到充分验证。双方基于锐龙AI Max+ 395处理器的智能体主机开展联合调优,成功实现397B超大模型的本地部署,在256K超长上下文(122B)场景下,将DRAM占用降低近40%,为超大模型本地化高效部署与规模化应用提供了可落地的创新方案。作为AMD的长期合作伙伴,此次联合调优更是双方生态协同的进一步深化,未来将持续发挥各自技术优势,推动端侧AI存储生态的完善。

500

500

3.HLC技术全端侧落地:破解性能与成本平衡难题

面向存储芯片涨价带动手机等终端产品售价攀升问题,今年年初,江波龙发布了自研HLC(High Level Cache高级缓存技术),江波龙将HLC高级缓存技术与SPU、UFS深度集成,成功实现AI PC端+嵌入式端全端侧场景落地,精准解决端侧设备“性能与成本平衡”的行业核心难题,为终端产品迭代提供高性价比存储解决方案。

在AI PC端,HLC技术依托SPU实现分层架构设计,性能层专门打造AI专用高速缓存区,可高效完成大模型专家/键值对卸载,保障端侧AI推理过程的流畅性;存储层则承担操作系统与通用数据的存储任务,通过高优先级读写、低优先级I/O调度的智能策略,在显著优化AI使用体验的同时,有效降低终端DRAM容量需求,进而压缩终端硬件成本,实现性能与成本的双向兼顾。

在嵌入式端,江波龙与紫光展锐展开深度联合开发,基于紫光展锐芯片平台的实测数据充分彰显了HLC技术的优势:4GB DDR搭配HLC技术后,20款App启动响应时间仅851ms,性能表现接近6GB/8GB DDR的正常配置水平。与此同时,江波龙搭载14nm制程工艺WM7200主控的UFS 2.2产品,同步实现性能突破,顺序读写最高可达1070MB/s、1000MB/s,随机读写IOPS分别最高可达240K、210K,性能超越行业主流水平,在保障终端设备流畅体验和器件使用寿命的前提下,进一步降低终端DRAM容量需求、优化整机BOM成本,适配嵌入式设备低成本、高性能的核心需求。

500

500

4.端侧AI SiP技术:自研赋能,发挥供应链优势

此外,江波龙依托中国工程师自研优势,完成SiP(System in Package,系统级封装)全流程设计,构建起端侧AI存储的另一核心竞争力。该技术可将SoC、eMMC/UFS、LPDDR、WiFi、Bluetooth、NFC等多类芯片集成于一颗封装内,实现硬件的高度集成化。

针对AI眼镜、智能手表、POS机等对空间体积、机身轻薄度、散热控制有着严苛要求的终端产品,SiP集成方案能够显著缩小硬件尺寸、优化设备结构布局及散热表现,成为此类终端的极具竞争力的优选解决方案。同时,江波龙结合本土供应链核心能力,将SiP技术优势充分释放,不仅有效节省端侧AI产品的内部空间,更将技术优势转化为海外制造端的实际价值,大幅降低海外制造难度,可灵活适配全球不同市场的产品需求,进一步提升中国存储企业的全球竞争力。

500

当人工智能的浪潮从大模型中心的喧嚣转向千家万户的终端设备,存储的角色已不再是冷冰冰的数据容器,而是赋能物理世界智能化的核心引擎。

江波龙在CFMS 2026上的重拳出击,预示着一个属于端侧AI的高性能存储时代正式开启。在这场关乎效率、功耗与成本的终极较量中,唯有像江波龙这样具备全链条创新能力的先行者,才能在变局中锚定坐标,不仅助力AI从云端真正走向万物终端,更在重塑全球存储产业格局的过程中,贡献属于中国存储企业的创先范式。

江波龙也强调,公司未来将秉持“Everything for Memory”的理念,持续深耕存储领域,以技术创新为核心驱动力,与全球产业链伙伴携手,共同推动端侧AI产业创新发展。

站务

全部专栏