联发科天玑9400发布:打造旗舰芯片新样板

过去几年,智能手机芯片厂商的每一代旗舰更新屡被诟病。诚然,因为终端的创新乏力,智能手机芯片厂商在迭代产品的时候主要围绕着工艺、功耗和架构进行按部就班的升级。这在工艺制程微缩带来的代际收益愈发减少、架构创新乏善可陈的近年,尤其明显。

但伴随着横空出世的生成式AI、备受追捧的手游和与时俱进的晶圆厂的不断发展向前,智能手机芯片厂商重回创新赛道一决高下。而全球最大的手机芯片供应商联发科更是走在前列。继去年发布了全球首款“全大核”架构设计的旗舰芯片后,联发科近日又带来全新一代天玑9400——采用台积电第二代3nm工艺打造的新旗舰产品。

500

据介绍,天玑9400拥有291亿晶体管,较前一代增加28%,但功耗却同比大降40%。搭配领先的架构和内核选择以及先进的AI智能体化引擎,联发科新旗舰芯片能在不追高频的前提下,仍实现了强悍的性能。

总而言之,这是一颗高智能、高性能、高能效和低能耗的旗舰5G智能体AI芯片。

AI性能大幅提升,端侧也能训练

对于科技行业而言,AI无疑是近年来的重中之重,在智能手机行业更是如此。

根据IDC今年七月发布的最新预测,智能手机行业的未来将发生改变,预计 2024 年全球生成式人工智能 (GenAI) 手机出货量将同比增长 363.6%,达到 2.342 亿部,出货总量占 2024 年整个智能手机市场的 19%。展望 2028 年,IDC预计 GenAI 手机出货量将达到 9.12 亿部,2024-2028 年的复合年增长率 (CAGR) 为 78.4%。

巨大的市场潜力,吸引了手机芯片厂商投身其中,作为该行业的头号玩家,联发科也正在全力以赴。虽然AI在近些年才备受瞩目,但作为一家拥有深厚技术积累和领先市场前瞻性的企业,联发科早在 2018 年就发布了公司首款带有 APU 的手机芯片 Heilo P60。到了 2019 年,在看到 Transformer 模型的潜力之后,联发科就针对图像和语音等应用,围绕其在 APU 层面做了架构和算法适配的预研。在今年年中的天玑开发者大会 2024(MDDC 2024)上,联发科更是发布了 5G 旗舰生成式 AI 移动芯片天玑 9300+。据介绍,这颗拥有出色生成式 AI 能力的旗舰芯,可以让开发者在开发 AI 应用时更得心应手。

而伴随着天玑 9400 的发布,联发科旗舰芯片的 AI 能力又迈上了一个新台阶。

联发科方面表示,天玑 9400 集成了性能更强、能效更高的第八代 AI 处理器 NPU 890,其端侧多模态 AI 运算性能高达 50 Tokens/s。与天玑 9300 相比,其大语言模型(LLM)的提示词处理性能实现了80%的提升,Stable Diffusion 的执行性能提升了 2 倍,AI 模型文本长度提升达 8 倍,但功耗同比大跌了 35%。

同时,该 NPU 还率先支持时域张量(Temporat Tensor)硬件指令加速、率先支持端侧高画质高画质 DiT(Diffusion Transformer)技术、率先支持端侧混合专家(MoE)模型。

500

联发科表示,当初公司在规划端侧训练的考量是希望手机能够“越用越懂”,利用用户晚上休息的时间,将手机接通电源,通过 NPU 的训练能力执行低功耗的训练,让用户的手机能够每天都更懂用户多一点。

“端侧训练希望带给消费者一个‘越来越懂你’的智能体化布局之一。”联发科方面强调。

除了看起来不可能的端侧训练以外,依赖于联发科这颗拥有强悍 AI 能力的芯片,开发者不但可以在智能手机上实现“文生图”,甚至在处理“文生视频”等对算力有更高需求的应用时也游刃有余。而能获得这样的表现,与联发科在定义这颗芯片的时候做的一些决定密不可分。例如,在执行视频生成任务时,天玑 9400 会运用和传统技术不一样的“时域张量硬件加速技术”。联发科方面表示,这样的设计会带来两个好处:

一是在视频生成上的时域加速,联发科针对 4D Tensor 和 5D Tensor 做了指令集的优化,让文图生成过程中的时域计算用上 5D Tensor,硬件可以获得更好的性能表现,从而让高画质视频生成能够在本地端发生;

二是针对端侧训练所提到的 backward propagation(反向传播)部分。按照传统的做法,整个 propagation 当中有不少是要把推理完的结果通过 Loss Function 再回送回来。在过去,这些 backward propagation 需要很多像 deconvolution 这样的反运算单元,这些任务以往也只能在 CPU、GPU 上加速。

“在联发科的第八代 NPU 上,我们将这个硬件算子的指令集,将这种训练的指令集融入到硬件能够支持的加速指令上,使得我们可以实现端侧快速、低功耗和高性能的生成。”联发科高管强调。

全大核设计再接再厉,处理器更快更强

如文章开头所说,联发科在发布上一代旗舰的时候,创新性地引入了“全大核”设计,这给行业带来了震撼,也让公司拥有了更多的竞争筹码。事实上,过去一年多的发展,证明了联发科的决定确实是个明智之选。而随着生成式 AI 等应用的更新,游戏需求的提升,联发科再接再厉,带来了新一代更快更强的处理器。

在 CPU 方面,和上一代采用四个 Cortex-X4 超大核和四个 Cortex-A720 大核的配置不一样,联发科在天玑 9400 上采用了 1 个 Cortex-X925(3.62GHz)超大核、3 个 Cortex-X4 (3.3GHz)超大核和 4 个 Cortex-A720 (2.4GHz)大核的新一代“全大核”设计。

500

据联发科高管介绍,之所以会采取这个新设计,是公司在产品规划时对 CPU IP 组合能效评估的结果。“我们认为,在天玑 9300 CPU 组合的基础上,再增加一个最大的超大核,就可以在各种不同负载的场景下提供比较好的能效。”联发科高管强调。“借助这个大单核,天玑 9400 的性能较前代实现了大幅度的提升,而基于 3nm 制程,我们对天玑 9300 的原有架构做了二次优化,把架构的能效做到最好,从而诞生了这个组合。”联发科高管接着说。

从提供的数据可以看到,与前一代相比,Arm Cortex-X925 CPU 的 IPC 实现了 15% 的显著提升,单核性能提升了 35%,多核性能增加了 28%。但 CPU 功耗反而降低了 40%,在日前应用中,其功耗表现更是非凡,同比大跌 32%。

从联发科过去两代旗舰芯片上的配置,我们可以看到这家芯片巨头在产品定义上的一些转变。

以联发科为代表的领先手机芯片厂商,过去几乎都会跟随 Arm 和台积电的节奏做变化。例如,每当 Arm 推出新的 IP,他们都会与时俱进地在新一代旗舰上引入,同样的事情过去也出现在台积电推出新工艺的时候。但回看过去几代的产品发展,这种情况逐渐发生了变化。

随着天玑 9400 的发布,联发科在自主选择上更进一步。在笔者看来,如果说天玑 9300 是突破传统 Big.little 架构,更贴切用户需求的一种尝试,那么天玑 9400 没有选用 Arm A750,则属于是让 IP 配置更有针对性的一种突破。

联发科方面也表示,这几年的设计理念已经转化成——我们到底想要得到什么东西?

按照联发科所说,公司希望新的芯片能针对每一种场景(如重载场景、中载场景或轻载场景)去优化其性能和能耗,志在达成 30% 以上的重载、轻载场景下功耗的优化。在这个基础上,再去考量如何选择 IP,从而诞生了天玑 9400 当下的这个 CPU 设计组合。再加上同比增加的二级缓存(100%)以及三级缓存(50%),搭配率先支持的、性能和能耗均同比提升了 25% 的 10.7Gbps LPDDR 5X,联发科新旗舰芯片的 CPU 如虎添翼。

500

除了 CPU 以外,联发科在新芯片的 GPU 上也融入了这种设计理念。据了解,在天玑 9400 上,联发科采用了全新的 12 核 GPU Immortalis-G925,与上一代相比,其峰值性能相较上一代提升 41%,功耗节省 44%,光线追踪性能较上一代提升 40%,游刃有余的性能大幅提升游戏沉浸感。

值得一提的是,全新的 G925 还针对移动端首发 OMM 追光引擎,让移动端的光追画质再上档次。

无线连接全面升级,旗舰芯片无短板

在这些年的智能手机 SoC 竞争中,除了一如既往地对 PPA 进行追逐外,上文谈到的 AI 也是重点之一,过去几年厂商们围绕着 NPU、GPU 和 AI 加速器进行了多方面的布局升级,以打造出极具竞争力的 AI 引擎。从上文的介绍中我们也能看到联发科在这方面的布局。

对于智能手机 SoC 厂商来说,这些年还有另外一个追逐点——5G。作为一代革命性的通信技术,5G 因为其丰富的性能,被赋予了更广泛的含义,于是手机 SoC 厂商也在此押下重注,推动 5G 在不同频段、不同应用上发挥作用。以联发科为例,据介绍,迄今为止,公司已投入超过 1000 亿新台币(超过 33 亿美元)用于 5G 研发,拥有长期的研发成果、3GPP 参与(5G/蜂窝标准联盟)以及不断增长的广泛 5G 产品系列。

在天玑 9400 上,联发科也带来了领先的 5G 技术展现,其新一代 3GPP R17 5G 调制解调器,支持四载波聚合(4CC-CA),Sub-6GHz 网络下行传输速率可达 7Gbps ,支持 5G/4G 多制式双卡双通。通过自带的天玑 5G 高效率模型,则能把 16 种场景辨别准确率提升 99.5%,还可以将功耗降低 18% 的同时,将网速提升 30%。

5G 以外,包括 WiFi、蓝牙在内的局域网通信技术,也是芯片厂商这些年发力的重要无线技术方向。作为一家全球领先的 WiFi chipset 供应商,联发科在天玑 9400 上也集成了领先的 4nm WiFi 7/蓝牙芯片组,数据显示,在最新三频 WiFi-7 加持下,联发科天玑 9400 WiFi 的实测最高网络传输速率达到了惊人的 7.3Gbps,游戏抗干扰能力也提升了 80%,借助天玑 Xtra Range™ 3.0 技术,联发科更是进一步增强了 WiFi 性能——将连线距离增加了 30 米。

蓝牙技术则是手机厂商这些年追逐的又一个无线技术,联发科同样在上面有着深厚的积累。在最新的天玑 9400 上,联发科为其引入了新的蓝牙技术标准。从官方演示中可以看到,该芯片拥有超高的蓝牙吞吐量,能率先支持极清音质(高达 384KHz),也能将日常使用功耗至多降低 50%。其稳定蓝牙传输距离更是最高可达到 1500 米,颠覆了过往大家对于蓝牙的想象。

在集成了领先的无线技术之后,联发科把天玑 9400 打造成了一个全能的“六边形战士”,赋能手机厂商,帮助消费者实现无限可能。

总结

回顾智能手机 SoC 领先厂商过去十多年的发展,几乎所有都将晶体管密度、时钟频率和功耗当做了追逐重点。他们自以为打造出最高性能的芯片,就能在客户处得到高度认可。但事实证明,这并不是产业发展的正确道路。

正如联发科高管在分享天玑 9400 的 CPU 设计理念时所说:“在 CPU 设计上,我们不再聚焦于追求频率的数字,而是更关注性能本身,让大家把注意点回归到手机的性能体验上”。这也正是联发科在过去几年一直所践行的。在天玑 9400 创新的架构选择上,联发科再一次将这种设计思路体现得淋漓尽致。

作为一家纵横芯片行业数十年的厂商,联发科的表现有目共睹,这一方面体现在其扎实的技术基础上;另一方面,公司与时俱进的创新,也是让联发科立于不败之地的根本。从过去的“Turn Key”模式助力手机产业腾飞,我们就见识到了联发科在这方面的实力。

“天玑致力于为用户打造非凡的旗舰体验,第四代旗舰芯片天玑 9400 不仅拥有卓越的性能,其高能效设计更是一脉相承。我们相信,通过持续的技术突破和产品创新,MediaTek 将实现市场份额的稳步增长。”联发科董事、总经理暨营运长陈冠州强调。

基于这些辉煌的过去和当前的布局以及团队的信心,我们坚信联发科必然能在 AI 新时代,带领整个智能手机产业奔向另一个新高峰。

路虽远,行则将至;事虽难,做则必成。

全部专栏