美国国防部的人工智能加速战略
美国国防部的人工智能加速战略
2026年1月22日 - 作者:文森特·卡基迪
美国国防部位于华盛顿特区的总部
新战略是什么?
1月9日,美国国防部发布了其《人工智能加速战略》。该战略旨在推动一个熟悉的目标:让美国军队成为“人工智能优先”的军队。
根据国防部长皮特·赫格塞斯关于该战略的备忘录,这一“人工智能优先”的地位将通过四个广泛的目标来实现:
1. 激励国防部内部对人工智能模型进行实验。
2. 识别并清除模型集成道路上的官僚障碍。
3. 集中美国的军事投资,以巩固美国在人工智能计算、模型创新、创业活力、资本市场和作战数据等领域中的“不对称优势”。
4. 启动“定步速项目”(Pace-Setting Projects, PSPs),这些项目将作为“有形的、以结果为导向的载体”,用于快速完成人工智能相关的基础设施、数据、模型、政策和人才架构建设。
PSPs 聚焦哪些任务领域?
最初设定的七个PSPs将围绕七个特定的任务领域展开,这些领域分为三类:
作战
蜂群锻造 :美军与精英科技创新者之间的“竞争机制”。
智能体网络 :为战场管理和决策支持开发和试验人工智能体。
安德锻造厂 :人工智能赋能的仿真能力,包括仿真开发和仿真运营的反馈循环。
情报
开放武库 :技术情报向能力开发管线的加速。
格兰特项目 :将威慑从“静态姿态”转变为“具有可解释结果的动态施压”。
企业
mil :在所有密级层面上实现人工智能实验的民主化。
企业智能体 :为企业工作流程中人工智能体的开发和部署建立一套“行动指南”。
如何评估 PSP 的进展?
每个PSP都将有项目负责人。项目负责人需要每月就上述列出的每个任务领域向负责研究与工程的国防部副部长助理“展示”进展。首次演示将在备忘录发布六个月后(即2026年7月)进行。
首席数字与人工智能办公室将负责“赋能”这最初的七个PSPs。(该办公室同样在备忘录的各项指令中扮演着关键角色。)
备忘录强调,在国防部六大关键技术领域的项目中,进展必须与这些PSPs保持同步。
各军种、作战司令部和国防部各局及野战活动机构需在30天内确定至少三个优先项目,以便“快速跟进”PSPs。
国防部资源将(在哪里)分配?
备忘录指示CDAO将精力和资源投入到十一个领域以巩固每个领域。这些领域的非详尽列表包括:人工智能计算(如数据中心等基础设施)、跨国防部数据的访问权限,以及人才获取与参与。
国防承包商应特别注意备忘录中对模块化开放系统架构的强调。备忘录指出,系统架构“必须支持以商业速度更换组件,以保持压倒性优势”——这是国防部现有MOSA工作的一个相对无害的延续。
备忘录还指出,对“模块化接口及相关文档”的需求应在“无需主承包商支持”的情况下实现——这一限定词可能会引起一些承包商的兴趣。
引人注目的是,备忘录指示CDAO确保人工智能供应商能够在模型公开发布后30天内部署“最新模型”。为强调其重要性:“这应成为未来模型采购的主要采购标准。”
新意何在,旧意何存
正如《国防一号》的帕特里克·塔克所指出的,这份《人工智能加速战略》是国防部在短短四年内发布的第三份同类文件。塔克还指出,或许标志着此次的不同之处在于,该战略的发布以及国防部对埃隆·马斯克的人工智能聊天机器人Grok的欢迎,正值后者受到欧洲盟友和其他国家行为体的审视之际。
备忘录指示CDAO将供应商“最新模型”在其公开发布后30天内可用作为“主要采购标准”,这一点同样引人注目,并且标志着与微软耗时18个月才在Azure政府绝密云(并且是物理隔离的)上提供GPT-4的时代有了显著的断裂。
PSPs也是新的,尽管目前尚不清楚与国防部推动自身进入新时代的众多其他努力相比,这些项目在实践中会有何不同。
尽管如此,过去四年的连续性依然可见。
一方面,某些类别的人工智能模型的能力在此期间在某些方面持续提升,备忘录对从人工智能中获取能力所持的乐观基调反映了这一事实。同样,公共部门对私营部门人工智能基础研发将继续快速发展的预期,是人工智能政策中一个引人入胜的文化现象——无论存在多少不足,这项技术主要都是由商业行为体开发的。
此外,备忘录呼吁减少为模型获取数据(无论是用于训练新模型还是用国防部数据提示聊天机器人)的官僚障碍,这是一个熟悉的议题,相关努力正在进行中。备忘录显然以模型为主题,而这些模型从根本上依赖于数据,因此解密或以其他方式安排与它们共享机密数据是国防部反复出现的主题。
对MOSA的强调同样是扩大国防部采办需求可用供应商库努力的延续,包括以“即插即用”方式更换组件的能力。
可能的冗余
备忘录中概述的若干目标——包括人工智能模型的内部实验、用于战场管理和决策支持的智能体开发,以及人工智能赋能的仿真能力——已经以各种形式在整个国防部范围内进行,并可能成为冗余点。
事实上,诸如美国空军和美国海军的协同作战飞机项目、美国空军测试Leidos公司的AlphaMosaic战场管理系统,以及国防高级研究计划局将模拟自主性转移到现实世界部署的新方法等看似不相关的努力,都正在进行中(并且已经持续了一段时间)。
不仅如此,其中几项指令的表述具有高度的概括性,足以使其在现实世界的实施成为相关人员在工作流程中个人决策的问题。这尤其适用于国防部内部与可交互国防部数据的聊天机器人进行的实验(这是一项模糊且未具体说明的指令)。
有趣的是,这反映了企业级大语言模型应用在商业领域的部署情况,其使用有时是被指导的,有时则不是,尽管模型的使用方式在很大程度上取决于员工的偏好。这在国防部内部将如何发展还有待观察;同样,对于国防和商业领域而言,这在多大程度上以及如何影响整体生产力也有待观察。
跟随与引领
该备忘录的显著之处在于它接纳了私营部门到公共部门的动态关系,即前者开发驱动被认为具有革命性意义应用(如聊天机器人或智能体)的基础技术,后者则迅速采用。
如上文所暗示的,这标志着人工智能与其他强大技术之间存在某种脱节,许多其他技术主要或完全是在美国军事研发的范围内开发的(例如GPS、无人机技术)。备忘录似乎接纳并延伸了这种动态关系,采取了一种立场,即国防部应巩固私营部门开发技术的周边领域(例如,构建人工智能和自主系统评估标准),并在国防部内部为其确定用例(例如,内部实验、用于企业工作流程的人工智能体)。
篇幅所限,无法进行更广泛的评论,但正如其他地方所指出的,美国政府人工智能政策这种“跟随”而非“引领”的立场,与其在商业领域磕磕绊绊的推广相互交织。
模型客观性与评估标准
赫格塞斯部长的备忘录中包含了一部分内容——值得注意的是,在文件的最末尾——“澄清”了“负责任的人工智能”的含义。具体而言,它包括了对人工智能模型中“多样性、公平性和包容性及社会意识形态”的反对,包括对模型进行的本质上是“意识形态”的“微调”,以致于干扰了它们为用户提示提供客观真实回应的能力。
与此同时,备忘录指示CDAO“在90天内建立模型客观性的基准,作为主要采购标准……”
可以肯定的是,这部分内容被置于国防部长备忘录的末尾,表明其重要性相对于为PSPs设定的主要指令较低。
此外,经常观察的人会认识到,这是一场关于生成式人工智能模型正确开发的更广泛政治争议的延续,这一主题也出现在特朗普第二任期政府关于人工智能的行政命令中,并且普遍存在于谷歌等公司笨拙的商业部署中。
尽管如此,技术现实比看起来更为有限:构建能够“为用户提示提供客观真实回应”的人工智能模型是一项极其困难的任务,尤其是在应用于开放式领域时。
隐含地成为这部分内容主体的模型是所谓的生成式人工智能模型。这些模型生成的输出与其训练数据相似。模型在训练过程中从统计上学习每个数据点(例如,每个人类生成的句子)彼此之间的关系。生成式人工智能模型随时间的改进,主要是其表面与人类判断的一致性得到了改善:大多数人类接受地球围绕太阳转,瞧,这正是模型在训练过程中“发现”的(如果互联网上充斥着相反的观点,模型就会“发现”地心说)。对于最先进的模型(包括其数学能力)来说也是如此。
因此,除了人类所持有的标准外,构建符合任何其他标准的模型都是不可能的。
这给模型采购带来了不便之处:人工智能供应商将被期望满足那些充其量只能近似达到,而无法以某种特定精确度满足的标准。承包商应意识到为达到此类目的而调整生成式模型所涉及的风险,因为在其应用足够开放的领域中,模型的可控性是一个棘手的问题。就生成式模型而言,特定用途(或特定用途类别)可能是最富有成果的机会。
同样,如果国防部数据可以用于某些类型的模型训练,这将在很大程度上锐化其可能的输出,并减轻供应商满足CDAO标准的负担。
当然,CDAO的最终基准很可能会基于这些模型的技术现实,并且对某种程度不便之处的预期将被考虑在内。这与赫格塞斯部长(单独)指示CDAO制定“用于评估这些人工智能加速工作成功的人工智能系统使用和任务影响指标”如何相互交叉,是一个悬而未决的问题,需要加以关注。
最后,请注意,尽管由大语言模型普及开来的这类生成式模型显然是该战略的目标,但似乎并没有明确的指令要求以这类模型为基础支撑各项指令。原则上,多种技术都可以作为“智能体”等的基础。
文森特·卡基迪拥有国防与政策分析背景,专攻关键与新兴技术。他目前是Forecast International的国防工业分析师。他还保持着对认知科学的背景兴趣,专注于人工智能。
https://dsm.forecastinternational.com/2026/01/22/the-u-s-dods-ai-acceleration-strategy/







