国产Arm CPU厂商用生态撬动AI时代

引言:

大浪淘沙,2020年苹果M系列电脑芯片的成功为整个行业注入了新的活力,掀起了国内Arm CPU创业的热潮。然而,四年过去,最初涌现的创业公司如今已所剩无几,事实证明,做CPU不是易事。但那些坚持下来的企业,必将能够撬开Arm CPU这个广阔市场的一个口子。

在人工智能技术持续革新的时代背景下,Arm CPU正从移动设备领域快速扩展到端侧AI、数据中心及AI PC等新兴市场,逐步对传统X86架构构成挑战。在这样的行业风口下,国产Arm CPU厂商——此芯科技正在加速崛起,紧紧抓住端侧AI与AI PC的巨大市场潜力,努力在全球半导体竞赛中占据一席之地。

此芯科技的选择:CPU、Arm架构、端侧AI

众所周知,在CPU领域,X86架构主导了整个生态超过40年。通过构建Wintel联盟,Intel与微软紧密合作,共同掌控了产业链的核心资源,确保了在个人计算机市场上的长期垄断地位。然而,2020年,随着苹果凭借其M1芯片一举打破常规,Arm架构迅速崭露头角,成为了新的行业风口。

自2011年Arm推出V8 64位架构,其正式进军服务器市场;2017年,微软发布了Windows 10 Arm版,标志着Arm架构正式进入PC市场;经过多年的发展,Arm服务器的生态日益成熟,在国内外市场取得了不错的成绩。在这一背景下,此芯科技在2021年创立,坚定选择了充满潜力与高能效的Arm架构作为其底层核心,开始了自己的探索与布局。

而在端侧和数据中心侧这两条路径上,此芯科技又选择了端侧,目标明确——为AI PC、智能汽车、空间计算等新兴应用场景提供高效的芯片与算力解决方案。彼时,此芯科技就认识到,人工智能已成为当今产业的核心驱动力,这既是此芯的机遇,也是其发展的必然选择。因此,三年前,此芯团队便树立了为行业提供高能效智能算力解决方案的梦想。

历经两年多的艰苦奋斗,2024年7月,此芯科技成功交付了首颗达到量产标准的CPU——此芯P1,超出了业界的预期。这一成果不仅是团队付出的汗水与智慧的结晶,更是首次向行业交出的诚意答卷。10月,随着产品的顺利导入量产,此芯科技的生态建设也迎来了全新的篇章,标志着公司进入了一个新的发展阶段。

“做CPU很难,难在生态,难在高投入,难在竞争的激烈。但是,再难的事情总得有人做,尤其是在AI时代,需要有人把智能化的CPU做出来,做好,打破已有的垄断,建立新的生态。我一直认为命运不是机遇,而是选择。”此芯科技创始人、CEO孙文剑表示。

500

此芯科技创始人、CEO 孙文剑

为何是端侧AI?

2024年被称为是AI PC元年,各大整机厂商纷纷推出了自己的AI PC产品。例如,联想的天禧大模型,其AI PC可以支持7B的大模型;微软推出了“Copilot+PC”…… AI PC成为端侧AI普及的重要载体。Arm终端事业部产品管理副总裁James McNiven在会上讲到,预计到2027年AI PC的市场率将超过50%。

随着AI技术的不断成熟,从云端下沉到端侧是大势所趋。端侧的低延迟、隐私性、不依赖网络等特点在诸多应用中都凸显出来,如自动驾驶、汽车、工业自动化、智能家居等。端侧AI作为“计算力走向边缘”的代表,必将在未来几年内持续增长。

端侧AI的核心挑战之一就是如何在算力有限的边缘设备上实现复杂的推理任务。安谋科技市场与生态副总裁梁泉表示,过去,许多端侧AI工作负载,尤其是在PC和手机端,主要依赖CPU进行处理,如计算机视觉(CV)、自然语言处理(NLP)等。然而,仅有CPU是远远不够的,端侧AI的复杂性要求我们采用多种计算单元来协同工作。可以发现,如今,NPU(神经网络处理单元)作为一种专门为AI计算设计的处理器,正日益在端侧AI应用中发挥着关键作用。

异构计算将成为推动端侧AI发展的关键理念。得益于异构计算的技术路线,端侧算力在过去两年间取得了显著进步,算力从5T、10T逐渐发展到AI PC的30T、40T,未来还将进一步提升。

此芯P1芯片就采用了这种异构推理架构,能够将CPU、GPU和NPU等计算单元灵活组合。据此芯科技的技术分析,Arm V9架构非常适合处理混合型的整形和浮点计算,适应各种灵活的数据形状;Arm GPU则在高带宽浮点计算中表现出色;而NPU则最适合低功耗、精度较低的整形计算,如计算机视觉(CV)和自然语言处理(NLP)模型。这种异构计算方式非常适合端侧的轻度到中度的各种AI应用。

在AI模型的发展方面,呈现出明显的两极分化趋势。云端AI模型的参数量已从数百亿增长到千亿级别,甚至基于MOE(混合专家模型)架构的模型参数量已突破数千亿,这推动了生成式AI的边界不断扩展,推动了更多创新应用的落地。与此同时,端侧的AI模型则以较小的规模逐步成熟。目前,端侧适配的模型通常在10B参数以下,这些模型可以在手机和PC端快速迭代和运行,特别是在PC端,由于其强大的计算能力,许多10B以下的模型可以实现快速部署。

算力和模型的“双向奔赴”将在未来两年内推动大量AI能力在端侧的落地应用。特别是在生产力工具的应用上,无论是代码生成、视频艺术创作,还是数字员工的应用,都将大大受益于端侧AI的提升。此外,很重要的一点,Arm架构的低功耗、开放以及灵活的特性使其在移动设备和AI PC产品中能够发挥出色的能效。

生态,是此芯科技重要的一步棋

端侧市场最大的特点是碎片化。端侧AI涉及的设备种类繁多,从智能手机、物联网设备、自动驾驶汽车,到智能摄像头、工业机器人、无人机等,硬件平台差异极大,这种碎片化极大考验着端侧AI生态的建设。尽管Arm架构在PC领域取得了重要进展,但在原生应用、X86应用兼容、软硬件优化等方面,依然面临很多挑战。

生态,是此芯科技很重要的一步棋。

自公司成立之初,此芯科技就着手组建生态部门,制定生态战略。短短三年内,已与超过100家合作伙伴建立了紧密联系,涵盖产业链的上下游。

此芯科技创始人孙文剑表示:“与众多合作伙伴的交流让我们逐步明确了生态理念——开放的态度,贯通产业链,共创商业价值。”

孙文剑进一步解释道,在此芯科技的生态体系中,“开放”是我们生态建设的第一要素。选择Arm架构,就意味着选择了开放,意味着我们愿意与更多的伙伴共同探索和创造。这种开放态度不仅仅体现在技术和产品的设计上,更体现在我们与合作伙伴的深度互动中。我们希望通过这种互相支持、互相赋能的合作模式,加速构建一个开放、互联的AI生态。

具体而言,此芯科技的团队将为合作伙伴和方案商提供开放的参考设计,逐步开源BSP代码,并为上游和下游提供持续的支持。此外,此芯科技还将开放GPU SDK、AI SDK,并在AI部署领域推出AI Model Hub,以便更多的开发者和合作伙伴能够共享并利用此芯的技术积累。软件和技术支持团队是此芯科技生态建设中的另一大优势。该团队在Linux和安卓社区都积累了丰富经验,能够为客户提供全方位支持。

第二,贯通整个产业链是我们一直在做的,也是将继续做下去的事业。从硬件到软件,从操作系统到大模型、应用、固件,依托此芯异构的SoC(系统芯片),与合作伙伴紧密协作,共同打造更为高效、易用的解决方案。

在此次生态大会上,此芯科技发布了瑞莎星睿O6开发套件。该套件由安谋科技、Cadence、此芯科技、RADXA联合打造,搭载此芯P1高能效Arm V9处理器,结合异构算力,赋能多场景端侧AI应用。它提供强大的多媒体处理能力,并且支持灵活的接口和扩展,满足不同开发者的需求。

此外,现场还发布了Project Pavo-AI PC笔记本原型机。该原型机参考设计旨在为众多方案商和客户提供更加接近实际产品的设计方案,帮助其大大缩短产品上市的时间。Project Pavo搭载此芯P1处理器,TDP为28W,默认支持16GB LPDDR5内存,接口丰富,操作系统支持EDK2 UEFI+ACPI,支持openKylin2.0、deepin23社区发行版,同时也可以运行Windows11测试版。

此芯P1芯片流片之后,此芯科技的研发团队快速搭建了验证和测试平台,顺利完成了P1的全功能EVB开发平台。这些底层硬件和软件的支撑,使其能够为合作伙伴提供更加开放的运行环境,更全面的解决方案,并加速产品的落地。秉承“一芯多用”的产品战略,此芯科技还将与合作伙伴一起,持续打造车载计算、边缘计算、空间计算平台,以及最前沿的具身智能计算平台,全面服务于产业的各个层面。

随着端侧算力的不断进步,如何在端侧高效地运行复杂的AI模型,也成为行业面临的重要挑战。在端侧AI生态的推进与合作方面,此芯P1芯片自发布以来已经完成了超过100个端侧AI模型的适配,包括CV、NLP、音频模型以及最新的生成式AI模型。在此基础上,安谋科技、此芯科技以及多家行业合作伙伴还共同发起了“AIPC和EdgeAI联合实验室”,推动端侧AI技术的研发与应用。

“我们深知,独行快,众行远。此芯科技愿意成为各位伙伴拥抱AI生态的垫脚石,相信通过与各位伙伴的紧密携手,我们一定能够在AI的时代大浪当中勇立潮头,谱写华章。”孙文剑表示。

结语

以Arm架构为基础,以端侧AI为突破口,此芯科技正在用生态撬动AI时代的巨大机遇。在这场产业变革中,此芯科技希望成为国产CPU产业发展的引领者,也希望通过开放的生态体系,与产业链伙伴共同开创AI计算的新格局。

站务

全部专栏