未来的3D内容是极乐世界?这位97年的创业者这样畅想 | 独家对话
“造万物,定规则”
文 | 徐小怪
编辑 | 羊羊、小小树
如果你觉得3D建模是专业人士才能做的事,那你就完全Out了。
AI时代,只要用对工具,普通人也能分分钟搞出3D作品。
随着VAST旗下AI 3D大模型最新升级到了Tripo 3.0,3D行业可能又要变天了!
△ Tripo AI进化史
不久前,在2025世界人工智能大会(WAIC)上,一位97年的创业者作为企业代表向李强总理介绍了AI 3D大模型发展状况及在相关领域的实践应用。
在了解AI 3D大模型的技术创新能力及可为人工智能行业带来的新机遇后,李强总理嘱咐道:
你们要把聪明才智贡献给人类AI事业,为人类造福。
△ 2025世界人工智能大会(WAIC)在上海举办,VAST创始人兼CEO宋亚宸(右一)作为企业代表向李强总理介绍了AI 3D大模型发展状况及在相关领域的实践应用。
这位与总理对话的创业者就是3D大模型公司——VAST的创始人兼CEO宋亚宸。
△ 李强总理与VAST创始人兼CEO宋亚宸亲切交流
行业外的人可能对VAST的名字还很陌生,但总理都点赞的公司,必有过人之处。
在传统3D领域,海外科技公司和研究机构在工业设计、游戏开发、建筑设计等核心领域具有技术优势。
随着AI技术的快速发展,这一领域正在经历深刻变革。VAST凭借创新技术深度参与全球AI 3D大模型的发展与竞争,并处于前沿引领地位。
今年6月,VAST凭借自研的通用3D大模型底层核心能力,以及Tripo Studio这一革命性产品的出色表现,完成了北京市人工智能产业投资基金为领投的Pre-A+轮融资。
截至目前,经过连续三轮融资,VAST已获得绿洲资本、达晨财智、春华创投、英诺天使基金、水木清华校友种子基金、靖亚资本等机构的投资,每轮融资金额均达数亿元,成为全球AI 3D大模型公司中估值和融资额最高的公司。
△ 据天眼查数据显示,VAST已成功获得三轮融资
可以说,如果你关注AI,对数字内容的未来感兴趣,VAST已经是一家你必须了解的公司。
日前,极客电影(ID-Geekimovie)独家专访VAST创始人兼CEO宋亚宸,邀请他分享了VAST的战略方向,以及对于3D大模型和数字内容产业发展趋势的观点,甚至对数字娱乐产业的终极想象。
VAST创始人兼CEO宋亚宸
VAST作为一个常见单词,意为“巨大的”、“辽阔的”。
而宋亚宸对这个单词还有自己的解读:
人要成为神,先学会两件事。
第一个是“造万物”,第二个是“定规则”。
“造万物”?“定规则”?
听起来像游戏开发者在做游戏,又像造物主在创造新世界。
#01诞生仅两年多的公司,已经成为行业的主角
公司成立仅两年多,创始人宋亚宸已经逐渐成为行业内的主角。
在不久前举办的2025年ChinaJoy大会上,宋亚宸展示了VAST旗下AI工具Tripo Studio,其“文本生成3D模型”功能给了行业不小的震撼。
△ VAST创始人兼CEO宋亚宸在AI+娱乐科技大会上讨论了当下3D-AIGC娱乐资产的IP实践问题
在Tripo Studio里,用户可以基于文字或图片生成3D模型,系统能自动通过语义分割将模型拆分成一个个部分,每个部分会自动完成补全,用户可以单独对某一部分进行编辑、风格化调整。
这项技术的成熟似乎预示着“所想即所成”的时代即将到来,创作门槛被前所未有地拉低。
VAST创始⼈兼首席执⾏官宋亚宸,本科毕业于约翰霍普金斯⼤学,曾在商汤科技落地了多个从零到⼀的⼈⼯智能项⽬,实现AIGC技术在动画及游戏行业的商业化落地,也曾参与创⽴通用大模型独⻆兽MiniMax。
工作中,他逐渐认识到,3D技术与AI结合有巨大的潜力。
△ VAST核心使命:为世界进文明,为人类造幸福
VAST在2023年3月应运而生。
宋亚宸深知技术人才是第一生产力,他将目光锁定到顶级高校,邀请到清华大学博士梁鼎和曹炎培分别担任公司CTO和首席科学家。
我们到VAST采访时,正好赶上10余位清华博士在开会。
宋亚宸直言,他很喜欢清华大学,喜欢清华的人、清华的氛围,他经常去清华校园里逛,也经常和伙伴们一起去清华打篮球,所以公司位置也选在了清华附近。
当然,VAST的团队亦有其他顶级高校的人才,比如浙大、港大、港科大、北大等,与清华团队一起,共同组建出一支实力超群的研发团队。
官方数据显示,截至目前,VAST已为超300万全球专业开发者,40000多家企业客户,其中包括700多家大企业客户提供服务,累计生成的高质量3D原生数据集突破4000万个。
最近,VAST又官宣了两件大事,一是与索尼达成3D业务合作。
双方将围绕裸眼3D显示技术、AI驱动的3D内容生成与交互创新展开深度协同,致力于通过索尼空间现实显示屏与Tripo AI的高精度3D生成能力,打造从内容创作到沉浸式展示的全链路解决方案。
△ 索尼空间现实显示屏高速视觉传感器示意
合作将推动3D技术在展览、零售、教育等场景的普惠化应用,同时也将为元宇宙、工业设计、数字孪生等领域注入新的动能,开启3D内容生态的广阔未来。
△ 索尼与VAST的合作将为不同行业提供新的3D解决方案
VAST官宣的第二件大事是旗下AI 3D大模型Tripo 3.0正式发布。
对于这款拳头产品,VAST打出的口号是,“欢迎来到AI 3D的IMAX时代”。
#02Tripo 3.0:打造3D大模型的IMAX时代
我们把它叫做3D大模型的IMAX时代,精细程度连丝丝毛发都能做出来。
宋亚宸介绍,VAST先后推出过Tripo 1.0至Tripo 2.5等数十亿参数的3D大模型,而Tripo 3.0的参数级别直接拉升到200亿。
具体来讲,Tripo 3.0带来了几何和贴图算法的双重革新,基于升级版Tripo SF模型,实现标准模式和高清模式双模输出。
两种模式就像雕刻师切换刻刀粗细,能兼顾效率和保真需求。
原来要在影视或动画里建3D模型,几万块钱一个很正常,现在成本几乎不用出钱,可以节省90%的时间,生成一个3D模型可以从几天甚至几周缩短到几十秒。
宋亚宸分享:
Tripo 3.0集十亿体素级三维分辨率、任何拓扑结构与高效计算三大能力于一身,能轻松地还原最复杂的细节与形态,让每一次生成都达到业内最高水平。
对于普通用户,Tripo 3.0也非常友好。其直观操作界面和强大功能,让没有任何建模基础的用户也能通过简单操作生成3D模型。
例如,借助Tripo 3.0,用户只需提供草图涂鸦,即可秒级生成精细的3D模型,并快速完成专业级骨骼绑定,借助智能贴图笔刷工具高效实现材质与纹理的生成与编辑。
△ 向Tripo 3.0输入文本“复古风格的盾牌”秒级生成3D模型
说一句话、一个提示词,就能给生出来一个3D模型,粉丝可以自己做,淘宝店也都可以用。
试想一下,在不久的将来,大到房屋家具、小到鞋包杯碗,身边的物品都可以按照自己的心意来设计和制造,个性化将得到极大解放,每个人心中的创意都将得以展现。
随着技术的进步,这些科幻电影中才有的情节可能很快就要落地了。
#03“乐子人”走进3D内容时代的钥匙
作为一家专注通用3D大模型研发的AI公司,VAST的核心目标为打造大众级3D内容创作工具、建立3D UGC内容平台,最终让3D空间成为用户体验、内容表达及提升新质生产力的关键要素。
长远来看,这里面包含了两大愿景:
第一个是开启“内容创作的新时代”。
历史上,技术发展往往促使内容产业发生深刻改变——印刷系统为全人类带来知识,智能手机和抖音让视频创作者从影视专业团队变成每一个普通人。
当AI让3D创作成为一种大众能力时,是否也就意味着,我们将从短视频时代进入沉浸式、高互动的3D新时代?
宋亚宸将3D用户分为四个层次:
1,最大众的消费者
2,3D内容爱好者
3,业余3D用户
4,专业做3D的人
要真正迎接3D新时代的来临,宋亚宸很看重“乐子人”的作用。
“乐子人”指那些非从业者,创作的目的在于寻找乐趣。他们可能主要分布在“大众消费者”和“3D内容爱好者”这两个群体。
宋亚宸透露,B站UP主“小芃路子野”就是他很喜欢的一位“乐子人”。
“小芃路子野”曾运用3D技术制作过二创作品《甄嬛:皇上萨日朗!!!》《叶问有枪》《黛玉灭鬼》等,在网上引发关注。
△ B站UP主“小芃路子野”作品最高播放量超2000万
乐子人是AI原生人群,没有AI时,他们无法参与创作,现在却能实现‘人生第一部动画’甚至‘生成整个宇宙’……他们的创意和热情是未来内容生态的根基。
某种意义上,VAST开发技术工具的目标就是打破创作边界,使得“乐子人”能真正参与到内容创作中来。
宋亚宸预计,2026年将是PUGC(专业用户生成内容)爆发的一年。
在这一年,“点子大王”或者编剧、策划人员将崛起,他们的想法和创意将通过AI技术在美术和程序环节得到实现。
往后的2027-2028年则是UGC发展的阶段,“乐子人”可能成为内容产出的主力军。
就像米哈游创始人蔡浩宇说的,未来只有0.0001%的人会做像《黑神话:悟空》这样的游戏,99%的普通人会随心所欲做自己的游戏。
△ 《黑神话:悟空》游戏海报
为了迎接这些变化,VAST已经规划好了未来几年自己的发展路径。
宋亚宸透露:
未来3到5年,VAST会不断推出新产品,包括“3D的剪映”、“3D的抖音”。
需要强调的是,“3D抖音”和抖音这类短视频平台完全没有取代或竞争的关系。
宋亚宸认为:
“3D抖音”是一个全新的内容形态,更偏“强交互+轻内容”的生态。
具体来说,“3D抖音”将允许用户生成和分享3D内容。例如,用户上传照片生成模型,点击触发动画,还有多人实时3D互动小游戏,能让用户零门槛享受即时交互乐趣。
不久前,在WAIC 2025世界人工智能大会上,VAST旗下的Tripo AI基于索尼空间现实显示屏打造了一个“语音实时生成3D模型的互动小游戏”,观众只需说出关键词,Tripo即可现场生成对应的3D模型,并以裸眼3D形式即刻呈现。
随着技术的不断迭代,可能过不了几年,类似的内容会在“3D抖音”上随处可见,人人可做。
#04一个极客的“3D内容极乐世界”
VAST对未来的另一个愿景是,将AI从数字世界扩展到物理世界。
一个真正的理解世界对象和物理约束的World Model,是无法通过语言和图像来描述的,世界模拟器的核心是3D。
△ Tripo AI官网
宋亚宸认为:
未来生活将与3D技术深度融合,3D不仅是重要信息载体,更会重构人类的体验方式与价值判断标准,为每个人带来“最优体验”。
从信息载体演进来看,人类最早以石器、玉器等3D形式呈现信息(如3D艺术品),后因互联网初期带宽、算力限制,文字、图片、视频成为主流信息载体。
如今技术成熟,3D正回归为“人类本能喜爱、信息密度最高”的载体。
宋亚宸认为:
我们生活在3D世界里,3D不需要抽象和降维,未来它可能是最终的信息载体答案。
过去人类文明传承长期依赖文字、图像、模型,而AI已推动这些表达方式发生革命性变化,文生/图生3D是“新文明”拼图的最后一块。
关于3D技术带来的体验创新与价值判断,宋亚宸预言,通过UGC+AIGC结合推荐算法,以Feed流形式为用户提供无限专属3D内容,可实现“最优体验”。
△ VAST创始人兼CEO宋亚宸
当内容成本无限低,有足够多UGC加AIGC,通过推荐算法能找到最好内容,那一刻会有极致体验。
他认为未来数字内容将是“Everything”,人的价值取决于“为多少人创造多长时间总量的Optimal Experience(最优体验)”。
农业、工业、服务业很多工作会被机器人替代,但体验价值不会,别人花在你创造内容上的时间,就是对你价值的认可,他的时间就是给你的Currency(货币)。
在虚拟与现实世界的关系上,他指出未来两者并非替代关系,而是互补关系。
人类可自由选择在两个世界的停留时间,如30年在现实,30年在虚拟世界。且虚拟体验或许会比现实世界更具吸引力。
有一天,孙子会说,爷爷你不要沉迷于现实世界了,你能不能去虚拟世界陪陪我?