AI的东方答案:当“中国方案”定义人工智能

500

文 |钱鸿生

编辑 | 严大方

视觉设计:星船知造

正文共计:7860字

预计阅读时间:7分钟

01 中国AI打破硅谷叙事

当信息革命的进度条从“PC机”、“互联网”、“智能手机”一路行进到“人工智能”时——

“创新”、“开放”、“绝对领先”也曾一路被绑定在自由女神驾驶的战车上。硅谷力量被视为全球技术创新至高无上的引擎。

直到DeepSeek崛起:OpenAI一家独大的局面被打破。

英伟达顶尖研究员Jim fan说:DeepSeek-R1不仅开源了大模型,还披露了所有训练秘密,展示了真正的开放研究精神。为所有人赋能。

中国以DeepSeek为代表的AI创新大大提高了系统性能,降低了开发成本,让全球用户得到实惠。

相比之下,美国则在“单边霸权”中继续摇摆——

当地时间3月4日,美国总统特朗普在国会联席会议演讲中表示,美国应该废除芯片法案。同时有知情人士表示,美国芯片法案办公室已裁员约三分之一。

美国芯片法案中所表现出的“单边霸权”体现在数个方面,如:

●歧视性补贴政策:

法案中规定,接受补贴的半导体制造商在一定期限内不得在中国等“受关注国家”进行新的生产设施投资或扩建。

单边霸权表现:美国通过这一条款,单方面限制其他国家的产业发展,试图通过经济手段遏制中国的半导体产业崛起。

●限制技术转让和合作:

法案限制接受补贴的企业与中国等国家进行技术转让和合作。

单边霸权表现:美国通过限制技术转让和合作,试图切断中国半导体产业的技术来源。

中国政府一直强调半导体产业的全球化和市场化,反对任何形式的贸易保护主义和技术封锁。

500

source:unsplash

很明显,全球AI产业的竞赛逻辑已经改变——

不仅是一场技术竞赛,也是一场生态竞赛。

中国AI正通过丰富的场景化应用、绿色能源革命,重构全球AI格局。下文《星船知造》从三点简单分析,供读者参考与讨论👇

●谁先吃到应用红利:中国强调场景化应用,美国面临高成本和市场垄断问题。

●AI“电荒”危机:中国绿色能源能否成为全球AI算力救星?

●断供威胁下:成熟制芯片也是中国技术演进的“磨刀石”。

是时候打破美国总是主导新技术浪潮的迷思了。

02 谁先吃到应用红利?

中美AI已经出现很明显的“落地分野”——

中国AI拥有巨大场景化应用,美国同时面临高成本、数据枯竭等问题。

500

source:giphy

大洋彼岸在2024年AI发展中,并无太多“场景故事”可讲。几乎所有AI故事都围绕“文本对话”、“动漫生成”等场景展开。

此外,除了多在追求文本对话、多模态转换、3D动漫生成等领域,还花费了巨大的资金与能源消耗投入,让大多数美国商业公司在2024年继续亏损——

OpenAI亏损幅度不断扩大,出现了流动资金问题,在融资66亿美元之后,还要通过贷款方案向银行筹措资金,估计到2026年亏损幅度将高达140亿美元。

500

source:pexels

表面看,美国的信息产业并未像制造业那样被大规模转移到海外,高附加值和高技术产业仍然牢牢捏在自己手里。

但美国不可逆的产业空心化导致了两个问题:

一是加剧了其高新产业供应链上的脆弱性。《芯片法案》的单边霸权由此而生。

二是由于产业空心化,美国的AI某种程度是“无根之木”。

美国业界关于“大模型训练数据枯竭”的争论此起彼伏。

2024年12月14日,前OpenAI联合创始人伊利亚·苏茨科弗认为,AI预训练时代即将结束,数据作为AI的“化石燃料”正在日益枯竭,这一趋势最终将迫使改变当前AI大模型的预训练方式。

500

source:pexels

数据枯竭的原因有以下几种;

1) 互联网上数据被大量使用,高质量可用的数据资源逐步减少,训练大模型所需的数据源变得稀缺。

2)全球范围内对数据隐私和安全的重视程度不断提升,受数据安全法、知识产权法等法律的约束,限制了网络数据的采集、存储和使用。

3)获取有用数据的成本变高,专业的数据提炼和标注高质量数据的成本较高。

4)部分美西方国家的私人企业和科研机构,拒绝提供高质量的数据,没有全国统一的数据共享平台,政府的宏观调控力度较弱。

500

source:unsplash

面对数据耗尽的困境,马斯克提出一个解决方案,他认为“唯一的补充方法就是使用合成数据,即由AI大模型自己生成需要的数据。通过合成数据的输入,AI将经历一个自我学习的过程和评判过程。”

事实上,自2024年开始,包括OpenAI、微软、Meta等AI科技巨头,已经开始尝试用合成数据来训练AI模型了。

据Gartner评估,2024年美国用于AI训练的数据中60%是采用合成的数据。

微软最近公布的开源大模型Phi-4就是采用了合成数据和真实数据共同训练而成的。谷歌公司的Gemma模型和Anthropic公司的Claude 3.5 Sonnet系统、Meta最新的Llama系列模型,也都采用了类似合成数据与真实数据结合的方法来训练大模型。

但使用合成数据存在一些潜在的风险:合成数据质量不高,引入噪声或与真实数据差异过大,可能导致AI大模型系统崩溃,模型输出变得不够准确,最终会严重影响模型的性能。

500

source:giphy

和美国不同,中国巨大工业场景是一片尚未开采的数据蓝海。

中国在AI大模型算法上的突破还只是刚刚开始,中国拥有一大批AI算法研究公司、大模型应用人才、巨大场景潜力,在国家宏观政策的指导下,必将迸发出巨大的能量。

人工智能产业的竞争本质是数据、产业生态的立体博弈,中国以“实用主义”对抗硅谷“实验室主义”,中国的全产业链协同,正加速吃到“场景红利”。

500

source:unsplash

中国工业实力是AI能拥有巨大垂直行业场景化应用的重要因素:下游需求倒逼上游突破,同时政策与资本双重护航。正加速爆发数个新兴产业👇

1)应用正加速聚焦人形机器人产业

截至2024年11月底,我国人形机器人产业链上相关企业数量达到6.7万家,国家级专精特新企业1051家。

2023年10月份印发的《人形机器人创新发展指导意见》中强调,到2025年初步建立人形机器人创新体系,培育2家至3家有全球影响力的企业和一批专精特新中小企业,打造出2个至3个人形机器人产业发展集聚区。

到2027年我国人形机器人技术创新能力显著提升,构建起具有国际竞争力的人形机器人产业生态,人形机器人产业综合实力达到世界先进水平。

目前正重点突破AI核心算法和基础框架、类脑感知与认知、高能量密度电池续航、灵巧手组件、多维传感器等。

2)智能体是AI应用推进重点领域

AI智能体(Agent),一般是指能够自主执行任务、处理复杂信息并作出决策的AI系统。AI智能体的技术特征主要体现在以下方面:

●技术层面采用多模态融合深化,具备强大的多模态理解与处理能力,能高效理解和处理文本、图像、视频等多模态信息,满足用户特定的管理流程与管理需求。

●将深度学习与强化学习结合,让智能体有更强大的感知识别能力,强化学习使其能在环境中,通过试错学习进行决策优化,提升自主决策能力。

●在商业领域,智能体可根据市场动态和用户需求偏好自动调整决策,改进营销策略和产品推荐;在医疗健康领域,能依据患者病情变化和治疗效果,不断优化诊断和治疗方案等。

●在工业制造业、物流配送等环节,智能体将发挥重要作用,实现生产过程的智能化、自动化和优化。

●多智能体系统协同工作将是未来智能体的一个发展方向:不同智能体在复杂任务中分工协作、相互配合,完成单个智能体无法完成的目标任务。

500

source:unsplash

2024 年我国在发展 AI 行业智能体方面取得了一大批的成果,对未来AI智能体的推进积累了宝贵的经验,部分案例如下;

2.2.1顺丰科技 “丰知” 物流决策智能体

2.2.2 中国移动“AI+”行业实践成功落地

2.2.3 中石油打造昆仑大模型与AI中台

2.2.4国能数智设备综合诊断运维大模型

(详见星船知造白皮书《AI人工智能最新科技突破与未来发展趋势展望》)

500

source:pixabay

3)自动驾驶成为AI应用主赛场

自动驾驶技术已成为AI应用的主赛场👇

●技术进步驱动:自动驾驶技术的快速发展,尤其是大模型和端到端架构的应用,使得智能驾驶系统能够更好地处理复杂场景,提升了决策速度和准确性。

●市场需求推进:消费者对智能驾驶功能的需求不断增加,推动了自动驾驶技术的普。

●国家政策支持。

●产业链已经形成:从AI大模型、智能传感器、激光雷达等,形成了上下游配套齐全的产业链。

500

source:unsplash

过去两年,从产业发展角度来看,智能手机、智能PC等智能终端走进生活,同时,AI技术应用的门槛的下降,预训练成本与项目实施边际成本下降,鼓励AI技术走向千行百业。2025年我国AI场景化应用将进入规模化发展的关键时期。

中国电信加快AI场景化应用规模应用,推动创新成果转化为新质生产力。积极推动AI智能化应用深度融入行业生产场景,利用先进的5G网络优势,重点打造了80多个行业大模型和20个行业智能体,提供“算力+平台+数据+模型+应用”的一体化服务。

AI大模型技术科技成果只有通过规模化应用,才能实现技术和市场双轮驱动,确保AI技术可持续发展。

中国的工业优势十分明显——会从AI应用中更早吃到场景红利。

03 中美AI“电荒”危机

AI算力增长尽头是能源消耗问题。

AI系统特别是深度学习模型,需要执行大量的矩阵运算和密集型计算任务,都离不开高性能计算机和图形处理芯片(GPU)的支持。

英伟达的H100芯片在最高负载条件下,其单片功耗峰值可达700W。10万块H100芯片总功耗将接近一个小型发电厂的全部输出功率。

具体的改进方向不限于以下几种:

1)优化AI的算力对AI芯片无序扩张的需求,通过优化算法减少AI芯片的需求量。

2)降低单个AI芯片的耗电量,采用先进的制成工艺、新材料和新技术,如把光芯片或量子芯片作为算力中心的计算单元,降低单片AI芯片的功耗。

3)采用绿色清洁能源,如水电等电力供应方式,降低碳排放。

目前全球数据中心的能耗正迅速增加。国际能源署2024年报告称,2022年全球数据中心的总耗电量约460太瓦时(1太瓦时=1×109千瓦时=10亿度)。到2026年,这一数据将超过1000太瓦时。

高性能的AI芯片在运行过程中产生大量热量,对环境产生影响。人工智能的掣肘已经凸显,算力的尽头将会是能源消耗问题。

500

source:pixabay

美监管机构已警告,未来十年,美国或有一半地区电力供应不足。

背后既有AI发展带来的电力需求飙升,也有帝国产业空心等导致的基建摆烂等原因。

500

source:pexels

美国电力监管机构北美电力可靠性协会(NERC)去年底发布报告称:随着人工智能发展及建筑和交通电气化发展等原因,美国电力需求的增长飙升,供需失衡。

NERC分析部主任莫拉(John Moura)称,美国的基础设施建设速度跟不上电力增长的需求。

500

source:pexels

分析NERC2024年相关报告可以看到,美国同时伴随着——

1) 基础设施老化。

2) 化石燃料发电厂关闭(NERC相关分析称,已确认到2034年美国退役的发电机组容量约78千兆瓦,另有37千兆瓦已宣布退役计划。1吉瓦的容量可以为多达100万个美国家庭供电。)

3)新建电站速度不够。

与之相对的,是对用电嗷嗷待哺的人工智能及加密货币数据中心。

马斯克也表达了同样的担心——美国到底如何应对电力短缺?

对于美国的基建能力,《星船知造》此前也多次写过美国近年在基建上的低投入👇

500

source:unsplash

●美国土木工程师学会 (American Society of Civil Engineers)在其2021年发布的每四年更新一次的《美国基础设施评估报告》中表明:

至当年为止,美国基建方面“应有投资”和“实际投资”的差额已累计到2.59万亿美元。若美国仍不采取巨额资金投入,预计到2039年,美国将由此损失10万亿GDP和超过300万个工作岗位。

●美国基建停滞的代价是惊人的:同样来自美国土木工程师学会的数据显示,仅在地面交通这一项,美国基建投入就有11250亿美元的投资缺口,其结果就是美国17%的国家公路因为没能得到及时扩建。

●美国基础设施投资占GDP的比重为2.6%。全球平均水平为GDP的3.8%。

面对蓬勃发展的人工智能产业,中国的AI算力中心的建设也面临能耗问题。

2022年全年,我国数据中心耗电量已达2700亿千瓦时。

预计到2030年全国数据中心耗电量将接近4000亿千瓦时——这个数字有多大?2024年三峡工程迎来开工建设30周年。水利部数据显示,三峡电站累计发电量超1.7万亿千瓦时。

目前除了中国已经崛起的光伏等绿色能源力量,我国“东数西算”正对数据与算力进行合理匹配,将大量算力资源部署到西部地区,以降低能耗。

它是一场国家亲自下场,来平衡事关能源和数字生态的百年大计。

500

source:unsplash

东部地区土地、能源等资源相对紧张有限,而西部地区却资源充裕。

数据中心被称为“不冒烟的钢厂”,电力消耗极大。

从经济效益的角度,把数据中心安置在西部,可以节省电费;从社会效益的角度,中国西部有更加丰富的清洁能源,对环境也更友好。

同时为了降低冷却成本,可以直接把数据中心建在天气凉爽的西部和北部地区。

例如阿里的张北数据中心,年均气温仅为2.6℃,最低气温零下40度。只要将自然风新风通过风墙技术输送至机房,直接为服务器降温,一年就有300多天可以“免费”直接自然冷却。

张北的风能、光照资源也非常丰富,年均可利用光照超过1600小时。

500

阿里云张北数据中心 source:阿里云

另外,中国电价在全球处于相对较低的水平👇

更多阅读:星船知造《欧美喊着“不做”电车,是不想吗?》

500

我国构建全国一体化算力网,也意味着能整合和优化全国范围内的优质算力资源。

相比之下,资本主义国家由于受到体制的约束,每个研究机构与企业AI的开发与预训练,必须花费巨资建设自己的算力中心与平台。

我国建立国家级全国一体化算力网,用户需要算力时,通过我国先进的5G通信网络或专用的高速光纤传送网,就可以直接调用国家的算力资源,节约了企业建立算力平台的成本,降低了算力资源的使用成本和使用门槛,极大助力了我国AI计算和其他科学研究等前沿技术对算力支撑的需求,落实“双碳”目标。

当前全国一体化算力网发布如下所示👇

500

全国一体化算力网络国家枢纽节点分布图

当前,我国算力布局正处于连点成线、密织成网的阶段,中国信息通信研究院发布《中国综合算力指数报告〔2024〕》指出,截至2024年6月份,我国算力中心标准机架超过830万,算力规模达246EFLOPS。

04 中国成熟制芯片是技术演进的“磨刀石”

《星船知造》此前在《芯片出口的增长逻辑》一文中写过:

2024年前7个月,中国芯片出口额高达6409.1亿元,同比增长25.8%。如果继续保持这个速度,中国有望成为全球最大芯片出口国。

现在,最新数据显示👇

出口额:2024年,中国芯片出口额达到1594.99亿美元,同比增长18.7%。这一数据标志着中国芯片出口首次突破1万亿元大关,成为出口额最高的单一商品,超越了服装、纺织品和手机等传统出口强项。

出口量:2024年,中国芯片出口量达到2981.1亿块,同比增长11.3%。

产能上——目前中国成熟制程芯片已占据全球三分之一产能。

技术上——尽管美国试图锁死中国14nm以下工艺,但目前我国已具备量产14nm、12nm芯片的能力。中芯国际也已完成了7nm芯片研发。

先进制程芯片基本在手机处理器等少数领域应用,而在工业、汽车等领域,更注重成熟制程芯片的可靠性。28nm及以上的成熟制程芯片,占据了75%以上的应用市场。

500

source:unsplash

但颇长一段时间里,中国成熟制程芯片仍受到部分人士的“不屑”——

认为成熟制程芯片技术上落后、价格也远低于先进芯片,是“落后产能”。因此在面对美国对先进芯片断供的威胁和举措时,一些声音悲观认定中国AI及半导体产业皆前景堪忧。

直到DeepSeek的崛起,更多人开始意识到,中国AI及产业创新与中国成熟制程芯片之间存在多方面的紧密联系。

500

source:unsplash

一是技术维度。

DeepSeek通过算法优化激活了成熟制程潜能。中国传统芯片的产能优势也能成为推动AI产业化、场景化的资源。同时其在若干环节仍有创新空间。

二是市场层面。

中国成熟制程芯片供应链成熟。

成熟制程芯片在我国汽车、消费电子、工业控制等领域都有广泛应用。技术创新使这些芯片也能运行复杂的AI模型。在不依赖最新制程芯片的情况下,实现高性能的AI应用。

500

source:unsplash

三是从历史的后视镜中,更应保持对成熟制芯片产业链的构建。

上世纪美国在确立自己在半导体方面的优势后,首先将存储产业向日本转移。

日本在上世纪80年代通过计算器芯片积累出的市场和制造能力,开始走上一条不同于美国的技术路线(日本通过不断改进的CMOS技术,开始对美国的NMOS技术形成成本优势并反超美国芯片市场)。

到了80年代,韩国看准了美国打压日本半导体的时机,借机上位。

韩国先以半导体封装测试为主,引进日本和美国的技术和设备,建立半导体产业链。最终以三星和 SK 海力士为代表,大力发展了 DRAM 和NAND闪存技术,使韩国成为了存储器市场王牌。之后韩国拓展逻辑器件、模拟器件和光电子器件等领域,成为了继美国之后的第二大半导体强国。

上述两段经历都从历史角度证明:后发者通过大规模生产、应用,有机会获得比先发者更强的生产和制造能力。并在不断发展的市场需求下获得技术改进。

500

source:unsplash

芯片产业的第三次转移,把偏向劳动密集型的代工和封测环节逐步转向中国台湾地区和中国大陆。

以半导体芯片封测起家,借助美国的技术转移和市场需求,中国台湾省逐步发展集成电路设计,并通过晶圆代工模式,成为全球最大的代工地区,最终拥有领先全球的半导体生产流程技术。

在数十年的产业迁移与相互竞争中,全球半导体供应链呈现出不同区域高度专业化的特征:

总部在美国的公司在芯片设计、核心IP、EDA方面处于领先地位;

美欧日企业在部分设备领域领先;

中国大陆、日本、中国台湾地区、韩国在半导体材料方面领先;

韩国、中国台湾企业在先进芯片制造领域领先。点击下图可放大👇

500

现在,中国成熟制芯片已经形成较为稳固的本土产业链。

在DeepSeek的创新强心针后,中国更要坚持先进芯片攻关的同时,以成熟制芯片为根基,构建“需求-生产-创新”的循环。

500

source:unsplash

此外,英伟达垄断AI芯片有可能被终结吗?

美国对华先进芯片封锁是否加速增强本土产业链韧性?

英伟达在AI芯片市场的垄断地位正面临多方挑战,AI专用芯片ASIC,有望将替代英伟达传统的GPU图形计算芯片;部分市场信息表明,AI专用芯片正逐步替代英伟达GPU图形计算芯片,这一趋势在2024年初步显现。

博通(Broadcom Inc)是全球领先的美国半导体公司,正通过其ASIC芯片的生产与服务,成为英伟达的竞争者。谷歌、Meta、亚马逊、微软也纷纷开始自研AI专用芯片,以减少对英伟达的依赖。

2024年,英特尔推出了一款AI优化芯片,型号为XE-200,对英伟达在AI芯片市场的垄断地位形成挑战。

由于美国对出口中国的高端AI芯片实施制裁与管制,促使中国企业加快本土AI芯片的研发。

华为的高性能AI芯片主要包括异腾310和910两款主力芯片,其中异腾910采用了先进的7mm工艺,最高可提供256 TFLOPS 的FP16(半精度浮点数)计算能力。

寒武纪公司先后推出了思元290和思元370两款高性能AI芯片,配套生产相应的云端智能加速卡系列产品和训练整机。未来,随着中国在AI高性能芯片的不断突破,将持续推动我国AI大模型研发能力的提升。

当然,英伟达也在调整策略,成立了AI专用芯片研发部门,扩大提供为客户量身定制的AI芯片服务,并推动其GH200 Grace Hopper超级AI芯片的研制生产,以保持在AI芯片领域的领先地位。

尾声

中国工业场景正不断生成海量真实数据,构建不可复制的数据护城河。

随着DeepSeek的崛起,开源生态和共享精神也在我国AI发展中起到关键作用,提升国际影响力。

让我们对中国AI力量,保持乐观,拭目以待。

主要参考文献:

[1] 昇腾(HUAWEI Ascend) 芯片.海思官网.

[2] 中国第三代自主超导量子计算机“本源悟空”上线运行 新华网

[3] 埃隆·马斯克人工智能AI公司官网.

[4] MINSKY M. The Society Of Mind[C]/Simon & Schuster,1986:19-32.

[5]《中国为什么要在传统芯片上形成竞争优势》 文化纵横

[6] 钱鸿生.ChatGPT技术架构及我国人工智能发展策略的研究[D].社会公众号《星船知造》.

[7] 工信部联科〔2024〕113号《《国家人工智能产业综合标准化体系建设指南(2024版)》[S].

[8] 钱伽诺.《基于开源软件许可协议的软件行业发展趋势研究》[J].

[9] 人工智能为何如此耗电.学习时报 2024-09

本文基于访谈及公开资料写作,不构成任何投资建议

星船知造原创内容

未经授权,禁止转载

500

本文部分内容改编、节选自星船知造2025年1月白皮书《AI人工智能最新科技突破与未来发展趋势展望》,由钱鸿生博士撰写。

之后我们将同步发布白皮书,欢迎您关注《星船知造》,于公众号后台领取。

站务

全部专栏