李飞飞终于把空间智能讲明白了：AI 的极限不是语言，世界远比文字更广阔

熊猫儿

昨天 10:18

导读：11月10日，AI领域泰斗、斯坦福大学教授李飞飞发表长文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier（从文字到世界：空间智能是AI的下一个前沿）》，掷地有声地指出：当前大语言模型（LLMs）虽能玩转文字，却如同“黑暗中的匠人”缺乏对物理世界的真实理解，而“空间智能”——人类理解、导航并与三维世界交互的底层能力，才是AI实现真正智能的核心突破点。本文结合李飞飞长文核心观点及权威解读，梳理空间智能的“前世今生”，用表格呈现关键发展节点与能力对比，解析其如何重塑AI未来。

500

前世：从人类进化到AI萌芽，空间智能的千年演进路

李飞飞在长文中强调，空间智能并非新生概念，而是贯穿人类进化与文明进程的“认知脚手架”。从生物本能到科技突破，其发展历经三大阶段，关键节点清晰可辨：

发展阶段关键时间核心事件/突破历史意义

生物本能奠基期远古至公元前3世纪 1. 原始人类通过空间感知躲避天敌、搭建巢穴；确立空间感知为生存与认知的核心，开启“感知-行动”智能循环

2. 古希腊埃拉托斯特尼借阴影几何计算地球周长，

首次将空间感知转化为科学探索

工业与科学赋能期 18世纪至20世纪50年代 1. 哈格里夫斯“珍妮纺织机”通过空间布局革新空间智能成为科技突破核心驱动力，为AI研究埋下伏笔

生产力；

2. 沃森和克里克借3D分子模型发现DNA双螺旋

结构；

3. 1950年图灵提出“机器会思考吗”，引发AI

对智能本质的探索

AI萌芽探索期 2000年至今 1. 李飞飞团队构建ImageNet数据集（现代AI三空间智能从人类认知研究转向AI技术落地，开启产业化探索

大基石之一）；

2. 斯坦福实验室实现计算机视觉与机器人学习结合；

3. 2024年李飞飞创立World Labs，聚焦空间智能落地；

4. 2025年9月World Labs推出空间智能模型Marble预览版

李飞飞核心论断：“感知和行动是驱动智能进化的核心循环，这不仅是自然创造人类的基础，更是AI实现真正智能的必由之路。” 这一观点贯穿其25年AI研究历程，也是ImageNet数据集构建的底层逻辑。

今生：大语言模型的“短板”，正是空间智能的“主场”

当前AI已能生成文本、代码甚至逼真图像，但李飞飞尖锐指出其“致命局限”——缺乏空间智能导致与物理世界脱节。这种差距在日常场景与专业领域均有体现，具体对比如下：

能力维度人类空间智能表现当前AI（含大语言模型）表现核心差距

日常交互停车时预判保险杠与路缘间隙、闭眼倒咖啡、拥挤人群中避障仅能通过图像识别物体，无法推理空间关系，缺乏实时空间推理与物理规律认知

避障需预设场景数据

专业创造建筑师可视化建筑空间、电影制作人构建虚拟场景、科学家搭建分子模型可生成单张建筑效果图或分子结构图缺乏几何、物理、语义一致的空间建模能力

，但无法构建连贯3D交互场景

科学探索消防员在烟雾中判断建筑稳定性、物理学家通过模拟推导粒子运动可处理实验数据，但无法模拟动态空间环缺乏多模态空间数据整合与动态预测能力

境中的变量交互

李飞飞在文中以生成式AI视频为例：“当前AI生成的短视频往往几秒后就失去空间连贯性，因为它无法理解物体运动的物理逻辑——这正是空间智能的缺失所致。”

突破路径：李飞飞提出的“世界模型”三大核心能力

为让AI掌握空间智能，李飞飞在长文中提出需构建全新“世界模型”，并明确其三大核心能力，这也是World Labs的研发方向：

•生成性：构建连贯虚拟世界 能创造在几何、物理、语义上均保持一致的3D环境。例如其团队开发的Marble平台，已可快速生成可探索的3D场景，目前处于限量开放阶段，未来将赋能建筑设计、游戏开发等领域。

•多模态性：整合多元信息输入 打破文本、图像、动作等数据壁垒，实现“指令-感知-行动”闭环。比如接收“搭建沙堡”的文本指令后，能结合图像中沙粒的物理特性，生成机器人的动作路径。

•交互性：预测空间动态变化 能根据外部动作输入实时调整空间模型。例如机器人移动障碍物时，系统可即时预测周围物体的受力位移，避免碰撞——这是当前工业机器人难以实现的柔性交互。

不过李飞飞也坦言挑战重重：“海量空间数据的标注、新型模型架构的研发，以及训练方法的创新，都是我们需要跨越的难关。” 这也是World Labs在2024年获得2.3亿美元融资的核心用途，投资方包括a16z、英伟达风投等巨头。

四、未来图景：空间智能将改写三大行业

基于“世界模型”的落地节奏，李飞飞在长文中勾勒出空间智能的应用蓝图，分短期、中期、长期三个阶段逐步渗透：

时间维度 核心应用领域 具体落地场景

短期（1-2年）创造力赋能电影制作：生成可交互虚拟片场，演员与虚拟角色实时互动；

建筑设计：快速迭代3D方案并模拟光照、人流等动态效果

中期（3-5年）具身智能落地家庭服务机器人：自主规避障碍物、精准抓取物品；

实验室协作机器人：协助科学家搭建实验装置，预测试剂混合效果

长期（5-10年）科学与医疗革命新药研发：模拟药物分子在人体中的空间运动与作用机制；

精准医疗：结合患者体征构建3D身体模型，优化手术方案

李飞飞的初心：AI增强人类，而非取代人类

在长文结尾，李飞飞重申其AI研究的核心宗旨：“构建空间智能不是为了让机器取代人类，而是让AI成为增强人类能力的伙伴。” 她以教育场景举例：未来学生可通过空间智能模型“进入”分子内部，直观理解化学结构，这将让复杂知识的学习更高效。

这一理念也贯穿其创业选择——World Labs的使命正是“让AI真正理解世界，从而更好地服务人类”。此前在2024年伦敦“未来人工智能峰会”上，她就曾与黄仁勋、杨立昆等学者共识：“AI的下一站，必须跨越语言与物理世界的鸿沟。”

互动话题：你觉得空间智能最先会改变哪个行业？如果家庭机器人拥有空间智能，你最希望它帮你做什么？欢迎在评论区分享观点。

李飞飞：只有计算机和机器人具备空间智能，人工智能的潜力才能得到充分发挥

时代周刊100个最具影响力AI人物 | 李飞飞、黄仁勋、李彦宏、曾毅等人入选

▌本文主要来源：

1. 李飞飞长文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》，2025年11月10日，发布于个人社交平台及World Labs官网；

2. IT之家《李飞飞长文畅谈“空间智能”:是 AI 的下一个前沿，更是实现机器真正智能的关键突破》，2025年11月11日，来源链接：https://www.ithome.com/0/896/555.htm；

3. 澎湃新闻《李飞飞发表长文:空间智能是AI下一个前沿》，2025年11月11日，来源链接： http://m.toutiao.com/group/7571316054744465971/?upstream_biz=doubao；

4. 腾讯新闻《李飞飞最新长文，讲述空间智能的前世今生》，2025年11月11日，来源链接： https://view.inews.qq.com/a/20251111A00V7R00；

5. 澎湃新闻《李飞飞解读创业方向“空间智能”，让AI真正理解世界》，2024年5月17日，来源链接： https://www.thepaper.cn/newsDetail_forward_27399578；

6. 文中World Labs融资及产品信息，来自公司2024年9月官方公告。

科技举报

熊猫儿

5886篇文章 | 1734人关注

+关注

观察者网用户社区

作者文章查看全部>>

热门搜索

搜索历史

李飞飞终于把空间智能讲明白了：AI 的极限不是语言，世界远比文字更广阔

熊猫儿

熊猫儿

热点

站务

观察者网评论

请你来预测，2025年这些期待是否会发生？

风闻社区小助手_小风

风闻 “避坑” 版块上线！你的消费避雷指南、好物种草清单，从此常驻不离🎉

最近更新的专栏

风闻最热

全部专栏