李飞飞终于把空间智能讲明白了:AI 的极限不是语言,世界远比文字更广阔

导读:11月10日,AI领域泰斗、斯坦福大学教授李飞飞发表长文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier(从文字到世界:空间智能是AI的下一个前沿)》,掷地有声地指出:当前大语言模型(LLMs)虽能玩转文字,却如同“黑暗中的匠人”缺乏对物理世界的真实理解,而“空间智能”——人类理解、导航并与三维世界交互的底层能力,才是AI实现真正智能的核心突破点。本文结合李飞飞长文核心观点及权威解读,梳理空间智能的“前世今生”,用表格呈现关键发展节点与能力对比,解析其如何重塑AI未来。

500

前世:从人类进化到AI萌芽,空间智能的千年演进路

李飞飞在长文中强调,空间智能并非新生概念,而是贯穿人类进化与文明进程的“认知脚手架”。从生物本能到科技突破,其发展历经三大阶段,关键节点清晰可辨:

发展阶段                   关键时间                                       核心事件/突破                                                                             历史意义

生物本能奠基期      远古至公元前3世纪           1. 原始人类通过空间感知躲避天敌、搭建巢穴;                    确立空间感知为生存与认知的核心,开启“感知-行动”智能循环

                                                                      2. 古希腊埃拉托斯特尼借阴影几何计算地球周长,

                                                                          首次将空间感知转化为科学探索

工业与科学赋能期  18世纪至20世纪50年代     1. 哈格里夫斯“珍妮纺织机”通过空间布局革新                  空间智能成为科技突破核心驱动力,为AI研究埋下伏笔

                                                                         生产力;

                                                                      2. 沃森和克里克借3D分子模型发现DNA双螺旋

                                                                          结构;

                                                                      3. 1950年图灵提出“机器会思考吗”,引发AI

                                                                          对智能本质的探索

AI萌芽探索期        2000年至今                        1. 李飞飞团队构建ImageNet数据集(现代AI三                  空间智能从人类认知研究转向AI技术落地,开启产业化探索

                                                                           大基石之一);

                                                                      2. 斯坦福实验室实现计算机视觉与机器人学习结合;

                                                                      3. 2024年李飞飞创立World Labs,聚焦空间智能落地;

                                                                      4. 2025年9月World Labs推出空间智能模型Marble预览版

李飞飞核心论断:“感知和行动是驱动智能进化的核心循环,这不仅是自然创造人类的基础,更是AI实现真正智能的必由之路。” 这一观点贯穿其25年AI研究历程,也是ImageNet数据集构建的底层逻辑。

今生:大语言模型的“短板”,正是空间智能的“主场”

当前AI已能生成文本、代码甚至逼真图像,但李飞飞尖锐指出其“致命局限”——缺乏空间智能导致与物理世界脱节。这种差距在日常场景与专业领域均有体现,具体对比如下:

当前AI已能生成文本、代码甚至逼真图像,但李飞飞尖锐指出其“致命局限”——缺乏空间智能导致与物理世界脱节。这种差距在日常场景与专业领域均有体现,具体对比如下:

能力维度             人类空间智能表现                                                                                    当前AI(含大语言模型)表现                                       核心差距

日常交互        停车时预判保险杠与路缘间隙、闭眼倒咖啡、拥挤人群中避障                仅能通过图像识别物体,无法推理空间关系,           缺乏实时空间推理与物理规律认知

                                                                                                                                    避障需预设场景数据

专业创造       建筑师可视化建筑空间、电影制作人构建虚拟场景、科学家搭建分子模型  可生成单张建筑效果图或分子结构图         缺乏几何、物理、语义一致的空间建模能力

                                                                                                                                  ,但无法构建连贯3D交互场景

科学探索     消防员在烟雾中判断建筑稳定性、物理学家通过模拟推导粒子运动          可处理实验数据,但无法模拟动态空间环    缺乏多模态空间数据整合与动态预测能力

                                                                                                                              境中的变量交互 

李飞飞在文中以生成式AI视频为例:“当前AI生成的短视频往往几秒后就失去空间连贯性,因为它无法理解物体运动的物理逻辑——这正是空间智能的缺失所致。”

突破路径:李飞飞提出的“世界模型”三大核心能力

为让AI掌握空间智能,李飞飞在长文中提出需构建全新“世界模型”,并明确其三大核心能力,这也是World Labs的研发方向:

生成性:构建连贯虚拟世界 能创造在几何、物理、语义上均保持一致的3D环境。例如其团队开发的Marble平台,已可快速生成可探索的3D场景,目前处于限量开放阶段,未来将赋能建筑设计、游戏开发等领域。

多模态性:整合多元信息输入 打破文本、图像、动作等数据壁垒,实现“指令-感知-行动”闭环。比如接收“搭建沙堡”的文本指令后,能结合图像中沙粒的物理特性,生成机器人的动作路径。

交互性:预测空间动态变化 能根据外部动作输入实时调整空间模型。例如机器人移动障碍物时,系统可即时预测周围物体的受力位移,避免碰撞——这是当前工业机器人难以实现的柔性交互。

不过李飞飞也坦言挑战重重:“海量空间数据的标注、新型模型架构的研发,以及训练方法的创新,都是我们需要跨越的难关。” 这也是World Labs在2024年获得2.3亿美元融资的核心用途,投资方包括a16z、英伟达风投等巨头。

四、未来图景:空间智能将改写三大行业

基于“世界模型”的落地节奏,李飞飞在长文中勾勒出空间智能的应用蓝图,分短期、中期、长期三个阶段逐步渗透:

时间维度                   核心应用领域                                                                                                          具体落地场景

短期(1-2年)            创造力赋能                                   电影制作:生成可交互虚拟片场,演员与虚拟角色实时互动;

                                                                                      建筑设计:快速迭代3D方案并模拟光照、人流等动态效果

中期(3-5年)           具身智能落地                                家庭服务机器人:自主规避障碍物、精准抓取物品;

                                                                                     实验室协作机器人:协助科学家搭建实验装置,预测试剂混合效果

长期(5-10年)        科学与医疗革命                             新药研发:模拟药物分子在人体中的空间运动与作用机制;

                                                                                     精准医疗:结合患者体征构建3D身体模型,优化手术方案

李飞飞的初心:AI增强人类,而非取代人类

在长文结尾,李飞飞重申其AI研究的核心宗旨:“构建空间智能不是为了让机器取代人类,而是让AI成为增强人类能力的伙伴。” 她以教育场景举例:未来学生可通过空间智能模型“进入”分子内部,直观理解化学结构,这将让复杂知识的学习更高效。

这一理念也贯穿其创业选择——World Labs的使命正是“让AI真正理解世界,从而更好地服务人类”。此前在2024年伦敦“未来人工智能峰会”上,她就曾与黄仁勋、杨立昆等学者共识:“AI的下一站,必须跨越语言与物理世界的鸿沟。”

互动话题:你觉得空间智能最先会改变哪个行业?如果家庭机器人拥有空间智能,你最希望它帮你做什么?欢迎在评论区分享观点。

李飞飞:只有计算机和机器人具备空间智能,人工智能的潜力才能得到充分发挥

时代周刊100个最具影响力AI人物 | 李飞飞、黄仁勋、李彦宏、曾毅等人入选

本文主要来源:

1. 李飞飞长文《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》,2025年11月10日,发布于个人社交平台及World Labs官网;

2. IT之家《李飞飞长文畅谈“空间智能”:是 AI 的下一个前沿,更是实现机器真正智能的关键突破》,2025年11月11日,来源链接:https://www.ithome.com/0/896/555.htm;

3. 澎湃新闻《李飞飞发表长文:空间智能是AI下一个前沿》,2025年11月11日,来源链接: http://m.toutiao.com/group/7571316054744465971/?upstream_biz=doubao;

4. 腾讯新闻《李飞飞最新长文,讲述空间智能的前世今生》,2025年11月11日,来源链接: https://view.inews.qq.com/a/20251111A00V7R00;

5. 澎湃新闻《李飞飞解读创业方向“空间智能”,让AI真正理解世界》,2024年5月17日,来源链接: https://www.thepaper.cn/newsDetail_forward_27399578;

6. 文中World Labs融资及产品信息,来自公司2024年9月官方公告。

站务

全部专栏