李飞飞终于把空间智能讲明白了:AI 的极限不是语言,世界远比文字更广阔
导读:11月10日,AI领域泰斗、斯坦福大学教授李飞飞发表长文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier(从文字到世界:空间智能是AI的下一个前沿)》,掷地有声地指出:当前大语言模型(LLMs)虽能玩转文字,却如同“黑暗中的匠人”缺乏对物理世界的真实理解,而“空间智能”——人类理解、导航并与三维世界交互的底层能力,才是AI实现真正智能的核心突破点。本文结合李飞飞长文核心观点及权威解读,梳理空间智能的“前世今生”,用表格呈现关键发展节点与能力对比,解析其如何重塑AI未来。

前世:从人类进化到AI萌芽,空间智能的千年演进路
李飞飞在长文中强调,空间智能并非新生概念,而是贯穿人类进化与文明进程的“认知脚手架”。从生物本能到科技突破,其发展历经三大阶段,关键节点清晰可辨:
发展阶段 关键时间 核心事件/突破 历史意义
生物本能奠基期 远古至公元前3世纪 1. 原始人类通过空间感知躲避天敌、搭建巢穴; 确立空间感知为生存与认知的核心,开启“感知-行动”智能循环
2. 古希腊埃拉托斯特尼借阴影几何计算地球周长,
首次将空间感知转化为科学探索
工业与科学赋能期 18世纪至20世纪50年代 1. 哈格里夫斯“珍妮纺织机”通过空间布局革新 空间智能成为科技突破核心驱动力,为AI研究埋下伏笔
生产力;
2. 沃森和克里克借3D分子模型发现DNA双螺旋
结构;
3. 1950年图灵提出“机器会思考吗”,引发AI
对智能本质的探索
AI萌芽探索期 2000年至今 1. 李飞飞团队构建ImageNet数据集(现代AI三 空间智能从人类认知研究转向AI技术落地,开启产业化探索
大基石之一);
2. 斯坦福实验室实现计算机视觉与机器人学习结合;
3. 2024年李飞飞创立World Labs,聚焦空间智能落地;
4. 2025年9月World Labs推出空间智能模型Marble预览版
李飞飞核心论断:“感知和行动是驱动智能进化的核心循环,这不仅是自然创造人类的基础,更是AI实现真正智能的必由之路。” 这一观点贯穿其25年AI研究历程,也是ImageNet数据集构建的底层逻辑。
今生:大语言模型的“短板”,正是空间智能的“主场”
当前AI已能生成文本、代码甚至逼真图像,但李飞飞尖锐指出其“致命局限”——缺乏空间智能导致与物理世界脱节。这种差距在日常场景与专业领域均有体现,具体对比如下:
当前AI已能生成文本、代码甚至逼真图像,但李飞飞尖锐指出其“致命局限”——缺乏空间智能导致与物理世界脱节。这种差距在日常场景与专业领域均有体现,具体对比如下:
能力维度 人类空间智能表现 当前AI(含大语言模型)表现 核心差距
日常交互 停车时预判保险杠与路缘间隙、闭眼倒咖啡、拥挤人群中避障 仅能通过图像识别物体,无法推理空间关系, 缺乏实时空间推理与物理规律认知
避障需预设场景数据
专业创造 建筑师可视化建筑空间、电影制作人构建虚拟场景、科学家搭建分子模型 可生成单张建筑效果图或分子结构图 缺乏几何、物理、语义一致的空间建模能力
,但无法构建连贯3D交互场景
科学探索 消防员在烟雾中判断建筑稳定性、物理学家通过模拟推导粒子运动 可处理实验数据,但无法模拟动态空间环 缺乏多模态空间数据整合与动态预测能力
境中的变量交互
李飞飞在文中以生成式AI视频为例:“当前AI生成的短视频往往几秒后就失去空间连贯性,因为它无法理解物体运动的物理逻辑——这正是空间智能的缺失所致。”
突破路径:李飞飞提出的“世界模型”三大核心能力
为让AI掌握空间智能,李飞飞在长文中提出需构建全新“世界模型”,并明确其三大核心能力,这也是World Labs的研发方向:
•生成性:构建连贯虚拟世界 能创造在几何、物理、语义上均保持一致的3D环境。例如其团队开发的Marble平台,已可快速生成可探索的3D场景,目前处于限量开放阶段,未来将赋能建筑设计、游戏开发等领域。
•多模态性:整合多元信息输入 打破文本、图像、动作等数据壁垒,实现“指令-感知-行动”闭环。比如接收“搭建沙堡”的文本指令后,能结合图像中沙粒的物理特性,生成机器人的动作路径。
•交互性:预测空间动态变化 能根据外部动作输入实时调整空间模型。例如机器人移动障碍物时,系统可即时预测周围物体的受力位移,避免碰撞——这是当前工业机器人难以实现的柔性交互。
不过李飞飞也坦言挑战重重:“海量空间数据的标注、新型模型架构的研发,以及训练方法的创新,都是我们需要跨越的难关。” 这也是World Labs在2024年获得2.3亿美元融资的核心用途,投资方包括a16z、英伟达风投等巨头。
四、未来图景:空间智能将改写三大行业
基于“世界模型”的落地节奏,李飞飞在长文中勾勒出空间智能的应用蓝图,分短期、中期、长期三个阶段逐步渗透:
时间维度 核心应用领域 具体落地场景
短期(1-2年) 创造力赋能 电影制作:生成可交互虚拟片场,演员与虚拟角色实时互动;
建筑设计:快速迭代3D方案并模拟光照、人流等动态效果
中期(3-5年) 具身智能落地 家庭服务机器人:自主规避障碍物、精准抓取物品;
实验室协作机器人:协助科学家搭建实验装置,预测试剂混合效果
长期(5-10年) 科学与医疗革命 新药研发:模拟药物分子在人体中的空间运动与作用机制;
精准医疗:结合患者体征构建3D身体模型,优化手术方案
李飞飞的初心:AI增强人类,而非取代人类
在长文结尾,李飞飞重申其AI研究的核心宗旨:“构建空间智能不是为了让机器取代人类,而是让AI成为增强人类能力的伙伴。” 她以教育场景举例:未来学生可通过空间智能模型“进入”分子内部,直观理解化学结构,这将让复杂知识的学习更高效。
这一理念也贯穿其创业选择——World Labs的使命正是“让AI真正理解世界,从而更好地服务人类”。此前在2024年伦敦“未来人工智能峰会”上,她就曾与黄仁勋、杨立昆等学者共识:“AI的下一站,必须跨越语言与物理世界的鸿沟。”
互动话题:你觉得空间智能最先会改变哪个行业?如果家庭机器人拥有空间智能,你最希望它帮你做什么?欢迎在评论区分享观点。
李飞飞:只有计算机和机器人具备空间智能,人工智能的潜力才能得到充分发挥
时代周刊100个最具影响力AI人物 | 李飞飞、黄仁勋、李彦宏、曾毅等人入选
▌本文主要来源:
1. 李飞飞长文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》,2025年11月10日,发布于个人社交平台及World Labs官网;
2. IT之家《李飞飞长文畅谈“空间智能”:是 AI 的下一个前沿,更是实现机器真正智能的关键突破》,2025年11月11日,来源链接:https://www.ithome.com/0/896/555.htm;
3. 澎湃新闻《李飞飞发表长文:空间智能是AI下一个前沿》,2025年11月11日,来源链接: http://m.toutiao.com/group/7571316054744465971/?upstream_biz=doubao;
4. 腾讯新闻《李飞飞最新长文,讲述空间智能的前世今生》,2025年11月11日,来源链接: https://view.inews.qq.com/a/20251111A00V7R00;
5. 澎湃新闻《李飞飞解读创业方向“空间智能”,让AI真正理解世界》,2024年5月17日,来源链接: https://www.thepaper.cn/newsDetail_forward_27399578;
6. 文中World Labs融资及产品信息,来自公司2024年9月官方公告。







