专访宋亚宸:只招比自己强的人,做出全球大厂买单的AI独角兽

2026 年春天,杭州滨江的一栋写字楼里,VAST 的办公室像一座 3D 打印的主题乐园,休息区摆着龙与地下城的规则书和各种桌游,白板上画满箭头和象限,工位之间随处是擦写板,上面留着各种头脑风暴的痕迹。
创始人宋亚宸没有工位。
他每周往返北京和杭州,看谁不在就坐哪里,日程从早上八点开始,一直排到晚上。他可以在 5 分钟内进入深度睡眠——靠在墙角、躺在汽车里、甚至在见投资人的会议间隙。他刚在公司内部会议上和人吵完架,下一秒就能和你聊得滔滔不绝,仿佛什么都没发生,然后在深夜雷打不动过的打开电脑,玩游戏。
宋亚宸 29 岁,在公司已经属于“ 老登 ”。从约翰霍斯普金斯大学国际关系与经济学毕业后,他回国加盟商汤科技,成为 CEO 徐立的助理,之后成为 MiniMax 的早期联创,2023 年选择创业。
在过去三年,他带领 VAST 成为了全球领先的 AI 3D 大模型公司,这家公司的客户名单上躺着索尼、微软、腾讯、网易,大量的游戏公司和几乎全部的 3D 打印企业。
据知危了解,VAST 有 2000 多万的专业用户。最近,VAST 宣布完成 A+及 A++两轮融资,合计近 2 亿美元,而上次融资,是在短短两个月前,成立 3 年已经融资 5 次。
对于普通人来说,VAST 最吸引人的地方在于可以用一张图片,或者一段自然语言瞬间生成一个精度还不错的 3D 模型,而且这个模型可以用于游戏、动画、3D 打印,甚至创造一个完整的虚拟世界。宋亚宸的终极目标,是让每个人有创造世界的能力,那是一片“ 绿洲 ”,将有无数新的世界。
知危与宋亚宸在 VAST 北京和杭州办公室经历了两次对谈,我们试图第一次深入探寻 VAST 的面貌。这家没有 KPI 和 OKR,不设职级 Title,却喜欢招年轻的全栈式员工的公司是如何保持强大迭代能力,并在腾讯,阿里,字节纷纷进入的 AI 3D 领域保持阶段性领先的?
以及,这位年轻的创始人是如何布道,并逐渐接近那个“人人为我,我为人人”的世界的。
以下是对话的主要内容。
*注:为方便阅读,对话进行了部分不改变原意的修改。本访谈后续将在小宇宙和抖音及B站上线播客版和视频版,在相关平台搜索 “ 知危 ” 即可。

知危:即使你们在行业里已经很有名了,但还是请给知危的读者简单介绍一下VAST。
宋亚宸:我们是一家做 3D 大模型的公司,有自己底层的 3D 大模型,同时也有自己的世界模型。这两个模型可以理解为我们的基模,然后再通过基模能力为创作者提供新的生产力,让大家能更好的实现自己的创意。
另外我们也搭建 UGC 的交互内容平台,帮助这些创意能够端到端的产生商业化价值,让创作者能产生一定的收益。这就是我们在做的事情。
知危:其实普通人对于AI 3D 如果不是特别了解的话,感觉好像你要把 AI 3D 世界的所有东西都吃掉?
宋亚宸:其实不是,我们更多服务的是创作者。我们认为自己不做任何内容和创意,而是帮助创作者实现创意,我们只是为大家提供新生产力和变现的平台。
比如抖音会给大家提供一个 UGC 的平台,它还有比如说推荐算法,引擎,还有剪映等一系列工具去帮助创作者更好的创作,然后能够去在平台上面产生商业化的闭环,这些可能是 C 端感受不到的。
知危:所以这一套体系其实你在 2023 年刚创业的时候就已经想好了?
宋亚宸:最早其实我在商汤负责 AI +动画和 AI +游戏的时候,就发现了一个对当时的我来说是一个挺非共识的事情,我发现游戏也好,动画也罢,都是一个劳动密集型产业,不是一个创意产业。几百人、上千人去做几年其实是完成 1 到 2 个人的创意,大部分人做的其实是非常冗余、重复的工作。
大家其实都很有创意,对这个社会的理解,对一些情绪的捕捉,对一些表达的流露都是非常动人的。但当进入到这个社会的分工当中,进入到游戏动画公司当中,每个人基于一个复杂的合作链路,像螺丝钉一样做很小的一部分,越来越失去灵气。
23 年左右我们发现了一个有意思的机会,就是从文字到图片,再到视频,3D 是唯一没有属于自己的 UGC 交互内容平台的信息载体。
知危:因为门槛太高,离普通人太远了?
宋亚宸:第一它的信息密度在不断提升;第二,它的体验质量在不断地提升;第三,3D 有双向的交互性。所以 3D 对于人们来说,可能就像你说可能太远了,或者说它是一个最终极的信息载体。
但我们往前倒,其实这个世界本来就是 3D 的,只是人类在过去的演进中文字和图片,包括视频才逐渐被发明出来。它们其实都是一种压缩格式,对于本身的所有的 3D 信息的一种压缩。
当回归到 3D,这其实不是一个升维的最终结果,而是一个返璞归真的解压缩的过程,因为 3D 本身就是源文件本身。如果说未来真的出现 AGI,它一定是被训练于世界的,空间的 3D 的源文件之上,3D才是这个世界的内容和信息的本质。
知危:所以 3D 的重要性在那个时候没有被重视?
宋亚宸:对,其实文字、图片、视频最开始都只是精英的艺术,1.0 时代全世界可能只有 100 万人能干,之后 2.0 时代这个世界上出现了一种大众级别的创作工具,比如打字法,比如手机摄像头,因此出现了一些 PGC 和 PUGC。
我认为 3D 会出现自己的 PGC 平台,类似 Steam,或者说 Roblox 这样的平台,有一些非常专业的人能够在平台上去做一些事情。那么到 3.0 时代就是我们所谓的真正的 UGC 了,比如说微博、推特、TikTok、 抖音、快手,那 3D 也会出现这样的 UGC 的交互内容平台,在我们角度上面它叫做世界级的交互体验,或者说是一种交互内容。
知危:这是一个类似于 3D 抖音或者 3D TikTok 的东西吗?
宋亚宸:对,23 年上半年我们就推了一个内测版本,做了一个这样子的产品。纯纯的一个平台,大家都可以在上面去创作、去分享,但是它不是 UGC,而是 PGC,都是极其专业的人。因为制作一个可交互的世界其实不是一件简单的事情,它需要专业的人花可能几个月的时间才能做出来,是一个还不太完整的,不一定可被消费的内容,这是我们当时遇到的一个瓶颈。
知危:所以是某一个时间节点让你发现全是 PGC 用户吗?
宋亚宸:没错,我们发现有一段时间增长变得特别难,同时我们发现另一件有意思的事情,UGC 是一群非常特别的用户, 他们和 OGC 和 PGC 最大的区别就是它的 ROI 是0:0。也就是说用户的“ 收入”理论上来说是 0,他的投入也必须得是 0。当然实际上这个“ 收入 ”其实比 0 稍微高一点,这一点是情绪价值。
但是一定得实现零门槛、零成本实时的去创作,只有这样才会出现真正的UGC。至于之后这些 UGC 的平台,是否会因为流量变大,有一些 PGC 和 OGC 想要来获取流量去产生更多的商业化变现,那是后话。但是如果你想要做一个 UGC 的平台,很关键的就是它的 ROI 是 0:0的。
所以我在 2023 年上半年的时候,内部就做了一次全员分享,这个 PPT 是非常经典的,叫做“ 怎么样创造世界 ”,因为我们就想让零门槛、零成本的创造世界,去做一个大众级别的 AI 3D 创作者工具。

知危:23 年那个时候你们有对标的某些竞品吗?已经出现了一些可以沿用的技术了吗?
宋亚宸:我们是很幸运的,AI 3D 的技术在 22 年诞生,但是到 23 年 24 年左右,这个技术大家是走了弯路的,不管是英伟达、谷歌,还有很多国内的一些创业公司,都是利用当时最火的文生图的技术路线和算法框架,也就是 2D 升维的路线。
因为人总是有思维的惯性,用图片去作为训练数据去做 3D 大模型,但这并没有从本质出发,3D 大模型肯定是用 3D 进行训练,但那个时候大家不这么想。我们是在 23 年 4 月份的时候提出一条技术路线叫做“ 2D+3D ”的融合路线,我们既用 2D 的图片进行训练,也用 3D 去做参考,
所以我们是最早发现 3D模型也可以去做训练 3D大模型的数据的一家创业公司,有点拗口,但这件事情很本质。
知危:听起来很简单。
宋亚宸:对,听起来很简单且很自然,但它让我们从最一开始就非常的重视 AI 和图形学的交叉,所以我们拥有全世界人才密度最高的 AI 图形学的交叉团队。第二就是我们开始非常在意 3D 的数据,以前 3D 数据是极少的,我们积累了超过5500 万个 3D 模型数据,别家大概是在几百万这么一个级别,可能都不一定到。
知危:所以你们做到现在,在“ 造锤子 ”的阶段优势是什么?
宋亚宸:我们希望利用 3D 去精准表达一个静态的状态,通过视频来动态顺畅的表达视觉的变化,所以我们采取了一个新的技术路线。
它的优势第一方面成本非常的低,我们现在生成一个 3D 的模型的成本是 Seedance( 一款AI视频生成工具 ) 生成 5 秒视频的五万分之一,并且在长期我们认为这个世界模型是可以去进行离线推理的。
第二就是可以实现多人的在线。多人在线的时候能够实时的同步这个球在哪里,或者这个子弹飞到哪里了,这件事情是非常重要的。同时这对具身的训练也有非常大的帮助,比如说三个机器人一起叠衣服,你怎么去告诉他这个衣服这个已经折到哪一步了,这种实时互动就很关键。
第三是我们能够长时间稳定的体验这个世界,它不会穿模,不会尺度失调,不会崩溃,不会漂移,它具有3D的一致性,有长时间的记忆。这里 3D+视频的融合路线很关键的一点是,3D 它是有 ground truth( 真值数据 ) 的,所以它就有 true depth( 真实深度 ) 和 physical scale( 物理尺度 ),如果只用视频训练,它只能看起来像真的,但不知道物体之间的真实距离、大小关系、物理规则等等。
知危:你们的首席科学家曹元培其实说过就是 3D 生成最难的一部分可能是拓扑,为什么搞定拓扑这件事情是非常难的?
宋亚宸:其实拓扑它不是在每一个行业都需要的。比如说在工业,在 3D打印,在一些高精度的影视这些场景里,拓扑结构不是最关键的,反而模型本身的精细程度,几何才是最关键的事情,而在游戏行业拓扑结构就是重要的。
那么我们说原来的技术路线主要是有两条,第一条技术路线,把它叫做基于 Diffusion (扩散模型)的一条技术路线,第二 Transformer 路线路线其实已经相对的被淘汰掉了,也就是我们所谓的自回归的路线。
Diffusion 的技术路线生成出来的模型面数非常的高,几百万面,它的拓扑结构是非常混乱,就会导致很难进行二次编辑;由于它面数很高,所以进入到实时渲染管线的时候,这个管线会卡住,会占用这个计算资源。
举个例子,我们玩的《 王者荣耀 》,吃鸡,包括《 原神 》,其实它都是不是高面数的模型,因为不管是你的手机还是电脑,我放个几百万面、上千万面的模型在这个里面,它就会很卡,它占用这个计算资源就太多了。
我们现在 Tripo Studio( VAST一站式 AI 3D 工作台 )的 H3.1 其实就是基于这条路线,要求及其精细和逼真,你可以理解为它有点像在一个沙漠里面在不断的风化,就是增噪的一个过程中,慢慢的把一个石头去雕出来了,这是Diffusion。
而 P1.0采取了全新的技术路线和算法框架,它放弃了之前刚刚讲到的两种技术路线,直接可以生成一个拓扑结构和布线,属于相对来说不错的一个 3D 模型。一方面它生成速度很快,两三秒钟就能生成,方便 UGC 直接的使用和调用;另外就是它的拓扑结构布线非常的完整,让专业的创作者可以比较好的二次编辑。这条技术路线我们觉得是目前当下最好的一个解决方案,也是目前全世界范围内只有我们有的技术路线。
知危:国内除了专业用户或者是游戏公司的话,我还看到一个群体就是农场主,3D 打印这一块的市场。以往国内的农场主面向海外市场,客户给他一张图纸,模型参数就行,农场主凭借打印机的规模优势做生意,但是我发现去年开始他们逐渐在尝试自己打,因为有 VAST 这样的平台,让做3D模型的专业度和门槛降低了,他会自己去设计一些玩具。
宋亚宸:是的,开始先是农场主,然后就是专业的用户,这些 makers 也都开始慢慢的用起来。
我觉得 3D 打印存在一个非常大的福特“ Model T时刻 ”的机会,现在大部分 3D打印机都主要是面对 makers 这个群体,但拓竹可能改变了这个门槛。我认为拓竹就是奔驰,现在大量的 3D 打印机公司其实都在去跟拓竹比,当然现在奔驰做的最好,但它还是针对于 makers, 它一定不是针对于普通用户的。
我们经常开玩笑,我们这个行业大家逢年过节或者生日的时候送礼,经常就送 3D 打印机,因为也不贵,但看起来很 fancy,又跟我们公司相关,但问题就是 3D 打印机的使用率还是上不去,堆灰为主,这肯定是有原因的。
在可见的未来,会出现 AI 原生的 3D 打印机,采用完全 AI 原生的工作流,配上为大众所考虑的硬件产品设计,最终带来的就是 3D 打印机真的走向千家万户。如果有一家能耐心的为大众去定制一个属于他的工作流和 3D 打印机,他就有机会迎来福特“ Model T时刻 ”。
知危:拓竹现在有一个生态叫 MakerWord,一般的小白用户不知道打什么,就会到上面去下载非常多的专业用户给他设计好那些模型,这算是“ Model T时刻 ”的前夜吗?
宋亚宸:其实 MakerWord 的出现就是一个历史的眼泪。过去,3D 打印机厂商做的好不好,其实不完全基于他的机子做的好不好,而是要比谁社区做的好不好,原因是因为 3D 建模的门槛实在是太高了。所以说你就会发现,说谁把所谓的这种社区做得更好,在 3D 打印这个圈子里面就变得无比重要,但是这件事情因为有 了 3D 大模型被完全的改变了。
它让每个人都可以零门槛零成本去生成属于自己的 IP,属于自己的工业设计,这是一种完全不一样的体验,而且速度也是不一样的,在一两分钟就可以生成几百个、上千个属于自己的设计,在这个里面挑就可以了。一下子把目标用户从几百万这个级别,变成了几十亿这个级别,这就是一个非常大的跨越。
知危:另外你们月初还推出了新的通用世界模型研究项目 Project Eden,但实际上大部分普通人完全不知道世界模型到底是什么。
宋亚宸:今天我们就以非常糙的语言、非常不准确的方式给它讲清楚( 笑 ),如果能够在 1.0 的世界造万物,定规则,它非常依赖我们的这些建模的工具,包括一些我们现有的引擎。
2.0 时代,我们认为说它会借助 AI 3D加上世界模型到来,刚刚讲到了 AI 3D 擅长表达 state, 它擅长表达一种状态。那状态和状态之间的变化主要是视觉表达,它是依赖引擎去计算,引擎又是依赖大量的代码去拟合成一个世界。世界模型其实是反过来的,你可以理解为它看过了海量的变化,直接预测给你了下一个状态。
比如我站起来,刚刚光线打过来,AI 3D 要大量的计算,这个阴影长了多少,图形如何变化,世界模型不这么复杂,它看过 1000 亿次人坐着到站起来,所以它就直接给你了一个答案。
这其实有点像西医和中医的区别,西医研究病理,这个分子结构紊乱了,这个地方缺这个维生素,恨不得把那些东西全部检验做切片,搞清楚原理,世界模型特别像中医,它重要的是他黑盒的方式,它不白盒,它其实就是一个非常经验主义的事情。
知危:但经验主义它是有一个边界的问题,比如说我看够 100 个人的面相,我大概知道是这个人可能是某种情况,但是 1000个人和1万个人的程度怎么界限?
宋亚宸:说明你看的不够多,没有足够的数据,当然我把这个过程极度简化了,如果你是一个专业的教授,你可能会喷我,根本不是这样子的,没关系我只是方便大家去做理解。我们认为说当你一手掌握了 AI 3D,一手掌握了世界模型,本质上来讲就可以创造世界了。

知危:过去两年,钱和关注度其实都在语言大模型和具身机器人上,其实你们算是“ 小众创业 ”?
宋亚宸:这对我们来说还是挺幸运的,我们在最早期其实是没有获得太多关注的,因为 3D 大模型是一个短期内很难出圈,作为大众也很难去切身体会的去感觉到有什么技术或者变革的行业,所以在早期我们可以猥琐的发育。
知危:现在竞争压力会大一点么,因为阿里和腾讯在 4 月底的时候,几乎同时发布了自己的世界模型产品,巨头现在对于这个领域越来越关注,会对 VAST 形成冲击么?
宋亚宸:其实对于我们来说是一个非常好的事情,因为我们作为做 AI 3D 大模型比较早的那批,已经把基座已经打牢了,业务已经实实在在的做出来了,并且还在快速的增长,然后发育成为了这个行业里面的最领先的一家公司,这个行业地位目前是没有人撼动的。
并且本身世界模型还在很早期,这是一个长坡厚雪的事情,在早期的增量的状态,不完全涉及到说和大厂非常激烈的竞争,甚至连技术路线现在都还没有完全统一。
知危:像阿里它也有自己的 AI 3D产品了,实际上 VAST 的投资人里头有百度,也有阿里。未来随着赛道入场玩家越来越多,可能这家公司既是你的投资人,也是你未来的潜在竞争对手,这种角色会显得比较复杂吗?
宋亚宸:其实感受还还好,因为在几万人甚至十几万人的大厂,战投部门和所谓的做世界模型的部门可能中间已经隔了非常远,大家的 KPI 也不完全一致,所以说战投肯定更希望的是我们好。

知危:为什么执着于创造世界?
宋亚宸:当每个人都可以创造世界的时候,这个事情会发生一些很本质的变化。人类文明发展到现在,有两件事情一直都是有趋势的,第一叫做人类的平均幸福感的提升,这个幸福感不是大家普遍以为的那种幸福感,它其实是一个经济学的概念,主要指生活指标上,人们选择变多。
第二件事情就是人的工作时间在快速地提升。从采集社会到农耕时代,再到工业时代,现在大家都 996了,卷的要死。但是 AI 时代,理论上来说,最终人的工作时长是归零的,干什么都轮不到你。常识是,但凡一个大趋势,它是正常的直线往前走,但突然啪掉 0 了,那一定是有什么问题。
我认为到AI 时代,一个人的工作时长会变成 16 个小时,因为人要睡 8 个小时。所以人除了睡觉以外,人一直都在工作,这就是 AI 时代。
知危:为什么是工作呢?我也可以消费享受快乐吧?
宋亚宸:但是消费享受快乐是不创造价值的,那人的这个价值怎么来?这是一个非常好的问题,大家在工作什么?大家怎么样去展现自己的价值?我认为未来每一个人的唯一价值体现,其他人在他所创造的这些世界里面存在的时间的总和。
你创造了 12 个世界,这 12 个世界加在一起有的受欢迎,有的不受欢迎,在最近的一年,你这 12 个世界里面 702 个人,每个人玩了一个小时,那你就是 702 个人时的价值,
知危:感觉变成了卷世界了。
宋亚宸:卷创意。因为实现创意变成 0 成本、0 门槛,实时的实现。刚刚说是两个趋势第一个是选择带来的幸福感提升,最极致的选择其实是,这个世界还是那个世界?没有比这更极致的选择了。
知危:那我这样的劳动获得了什么呢?换取了什么呢?
宋亚宸:换取的是价值,不一定是货币,可能是算力或者任何,未来的经济体系怎么打造这个社会其实跟我没关系了,但这个价值很关键。
人除了创造还有消费,那消费的可能就是时间,你在每一个瞬间、每一个当下,都有权利从无数个世界中选择你想要在的世界里面去花时间。
知危:我两个月前和一位经济和人口学的教授也聊过这个问题,他也提出了一个反常识的一个想法,他觉得未来在AI 世界物质极大丰富的时候,人的劳动价值趋近于零,人的价值主要在于消费以及他的消费带来的数据。
宋亚宸:我觉得人能够给生产力提供的东西是有限的,农业和工业都将变得不重要,服务业都会变得不重要,机器人的制造也不重要,这些GDP 的指标没有一个是重要的。
未来这个世界只有一个产业,这个产业就叫体验。或者我们把它叫做创造美好生活。
这个世界就叫做人人为我,我为人人。我想最大化我的价值,所以我就尽可能的在想方设法去把我的创意去实现,然后去尽可能的为别人的体验去服务。
这个东西其实在全民直播的时候实现过,尽可能的去取悦别人,你给我点赞,你给我发弹幕,你给我礼物,但是这件事情它不极致。因为第一它不能交互,第二它都在同一个世界里面。
知危:有限交互吧。
宋亚宸:有限的时空,它的材料是有限的。老实说我觉得那个人人为我,我为人人的世界肯定会实现,这其实就是天堂,每个人都是圣人,这是一个我觉得非常好的事。
知危:那我们聊的再远一点,如果技术层面都解决了,我们可以在一个你设计的这样的一个 3D 版的 TikTok 里遨游,每个人都可以创造自己的世界,你觉得第一个爆款场景会是什么?
宋亚宸:我不去定义,这个事情不是我做的,我非常知道我的边界是什么,就是给大家提供尽可能好的新生产力工具,同时去搭建这样子的平台,至于说最好的内容模板是什么?什么是第一个内容范式?创作者会喜欢哪些内容品类?这其实是你,我,他每一个人去做的事情。
知危:听你描述它有点像在一个游戏世界里头,那其他的娱乐,比如视频的抖音会被摒弃吗?
宋亚宸:不会,它是一个强交互,轻内容的世界。画一个象限,上面是重内容,下面是轻内容,左边是弱交互,右边是强交互。迪士尼,《王者荣耀》是强交互,重内容,京剧是弱交互的重内容,抖音,故事会是弱交互的轻内容,但是强交互的轻内容目前是空缺的。
这四个象限有个特点,它们从来不跨象限竞争,它们基本上都是在本象限中去抢占场景和市场。
知危:但是它抢占的是你的时间,一天只有 24 小时。
宋亚宸:很好的问题。抖音从来没抢占电影的时间,电影有了短视频以后,电影的市场是蓬勃发展的。
知危:我觉得要看的是两个上下象限的增长的百分比,如果上面的增长比下面快的话,那说明还是有竞争关系。
宋亚宸:原因其实非常简单,因为你看抖音和你看电影,就不是为了一件事,他们的场景是有极大区别的,在同个象限,它其实服务的是同个场景,不同象限服务不同场景。
知危:我没有办法想象这个场景的未来是什么,我会觉得你是为了自己的这个产品去设定的这样的一个象限。
宋亚宸:没关系,你没有想象是对的,就像在短视频出来之前,你也很难讲清楚这是什么,这很正常。

知危:如果我是投资人的话,我都想象不到你讲的是什么东西,那我怎么给你钱?
宋亚宸:所以你不是投资人嘛,总有人是先相信再看见。
知危:现在以 VAST 目前的体量和它的成绩,其实这个问题就不复存在了,但是我相信早期的时候还是会有这样的一些质疑的,你不可能只拿这套去跟别人说。
宋亚宸:布道呀,多讲,一定是多讲,耶稣一开始只有 12 个门徒,所以我理解是讲给相信你这句话的人听,可能 100 个人里头可能只有 3 个人相信你,那他们就是你的受众。
知危:所以你当时创业的时候找的第一个你的合伙人你是怎么跟他沟通的?
宋亚宸:其实就一直在讲一样的事情,我们从 23 年到 24 年,到 25 年,到今年,现在开始每个月都要做 all hands meeting。我讲的东西从来不是说很具体的事情,我其实就是一遍遍讲一模一样的事情。
我记得非常清楚,去年我讲完了以后,我问我们 CTO 梁鼎,你觉得讲得怎么样?他说没什么新东西,我说那就对了,我PPT 都是复用的。
你刚问我个问题,这群人是怎么聚在一起的?其实很简单,就是我们有个使命,不断的往前走,我,Simon, 我存在,我就是为了这件事情存在的,我就是为了为世界进文明,为人类造幸福。
知危:所以你 PPT 上还是这几个字。
宋亚宸:我就是为了这件事情,我就是来打造天堂的。
知危:有同事说你是布道者,看起来确实如此,而且你在 MiniMax 的花名也叫“ 牧师 ”,那个时候你就喜欢布道,跟大家讲这些东西。
宋亚宸:对,我是 001 号员工。这其实不是喜不喜欢的事情,是需要做的事情。我之前从在商汤的时候,就有东西在从我心中会流淌出来,我就开始跟周围的人沟通,我们要往这个方向去努力。
知危:但那个时候还不一定是用 AI 3D 这个方式去达成。
宋亚宸:这是路径,可以是 AI 3D,AI 4D, 也可以是 3D BI,3D CI。
知危: 我们再往前找,你这种有点“中二 ”的使命感是怎么来的呢?或者是说你最后做的事业和游戏有关系吗?
宋亚宸:我觉得喜欢玩游戏也好,其他也罢,都是一种自然的结果。我在创业之前,包括现在,经常会觉得过去的每时每刻都是为了去做成这一件事情而准备的。胡适曾经把佛家一个词“ 功不唐捐 ”发扬光大了,就是过去的所有的事情,都是为了现在的当下,包括我坐在这里和你聊天。
知危:有没有可能是你过去太顺了,导致你的想法和现在的路径一步一步的按你想象的那个目标在往前走,所以你会觉得,没错,我就是那个人。
宋亚宸:你觉得会有创业特别顺的吗?创业要解决太多的问题,创业是不是一件开心和舒服的事情。
知危:聊聊你的痛苦。
宋亚宸:它不一定是痛苦,其实也没那么重要,当你没有足够的使命感的时候,你就会觉得这不是一个非常大的问题,这些问题其实不太适合跟所有人讲,比如说公司有发不出工资的时候,甚至我自己也出过很多问题,但是我觉得这些不是关键,我也不是很在意。
唐僧西行的时候,从来没跟李世民说,我过了九九八十一难,分别是什么,这是最不关键的事情。
知危:你们现在缺钱吗?
宋亚宸:说实话我们赶上了一个非常好的时代,刚融了一轮资嘛,我们其实是非常感恩的,当然我也知道可能不会一直都是好的时候,这也是为什么我们需要去提前准备很多有底气的东西,花大部分钱做底层的基础设施,或者说底层的大模型本身,不管是 3D 大模型还是世界模型,其实是我们投入最大的地方。
知危:坦白说,当初投你们的人是主要是看人还是看公司,还是看技术?
宋亚宸:最早期的时候,大家看的肯定是人;到了第二阶段,看的更多的是事,靠不靠谱,这个团队怎么样。第三个阶段,看这个技术在世界的领先性和创新性。第四个阶段,基于这样的技术,是不是已经形成了被这个行业客户所认可的产品,有足够服务能力和解决方案。第五个阶段就是产生了一定的商业收入。第六个阶段,收入已经达到了一个比较高的一个状态了,更多的看怎样去形成行业的壁垒,成为行业的最领先的这个玩家,到上市阶段。
VAST其实已经到了相对靠后的阶段。
知危:投资人对你的评价是什么?
宋亚宸:我记得非常深的是我们天使轮的投资人,绿洲资本的张津剑,他评价我是一个非常善良的,一个非常的有愿力的一个人。
知危:你觉得这个评价是比较恰如其分的?
宋亚宸:我觉得不同的人在不同的角度都能看到这个人的某一个相,慢慢地拼凑起大家对于这个人的理解,这个评价肯定是我很重要的一面。
知危:我看到一个文章说你曾经被评价,你是一个很脆弱的人,可能不太适合创业,有这回事吗?
宋亚宸:我父亲也是一个创业者,他那一代的创业者确实是非常坚韧的,对于各种困难都有经历,在他眼里我其实就是一个小孩。
知危:这是他评价你的是吧?
宋亚宸:对,那时候我创业大概二十五六岁,本身也刚走进社会没有多久,但超乎他意料的,也超乎我的意料的是,我很擅长用一种平常心在逆境当中去解决问题,我相对来说是一个坚韧的人,我们团队有很多人都比我厉害,我是 97 年的,不管是工作经验还是能力还是积累,可能都是不如我们公司的各个岗位同事的。

知危:所以什么时候你会发现哎,好像布道没那么累了,相信的人变得多了起来。
宋亚宸:一直都是累的。
知危:现在也是累的吗?
宋亚宸:我觉得这个事情,肯定会有很多正反馈,但不同阶段有不同的挑战,组织大了怎么样形成组织架构?其实大家都是一群非常优秀,极致聪明的人,怎么样让极致聪明的一群人形成一个拳头往前打,这其实挑战也很大。
知危:去年你接受采访的时候说 VAST 没有KPI,也没有 OKR,主要在沙发上或者办公室里做辩论决策,那个时候团队才 50 多人,现在可能急剧膨胀到快 200人,这会对原来组织管理方式有影响吗?
宋亚宸:我觉得是需要沟通的,比如说我们团队现在大家都不写 OKR,但是我会写,我写不是为了逼大家写,其实是告诉大家什么目标是重要的。
以前人少的时候,大家踢个足球可能就都知道了,但是现在不行,所以我们做了很多措施让信息更对齐,比如说我每个月会做全员分享会,开始发全员透明的邮件,算法技术的全员分享,我们尽可能想让信息流动起来,其实很多的摩擦力和阻力来自于信息的不畅。
知危:听说你还会收集大家的一些问题,然后在全员大会上去回答?
宋亚宸:是所有的人的匿名问题,我们都会收集上来,不会筛选,当然有很多很犀利的问题,我们都会回答,如果回答不上来的,我就会说答不上来。
知危:真的是会有那些非常犀利的一些问题出现?
宋亚宸:那绝对的,比如遇到过“ 这个团队到底在干嘛?是不是不干活?到底有没有存在的意义哦?”包括“ Simon,你是不是参与业务参与度太少了,你到底懂不懂业务?”
再比如说觉得我们公司的组织的 AI 化不够,效率不够高,我们应该怎么办?
还有是我们组织比较特别带来的一些问题,比如说我们公司没有职级,没有职称,那可能有些同学会问怎么样去看到一个人在不断的成长?我们怎么样去培养人才等等,非常的明确和指向性,这些问题我尽可能的都会回答。
知危:刚才那个问题你会怎么回答?怎么去培养人才?没有职级的话,好像天花板很低,员工也不知道未来会成为一个什么样的人。
宋亚宸:这确实我们公司和其他公司很不一样的地方,我们鼓励校招生,鼓励年轻人,所以我们不希望像传统的公司一样有比如说职级或者是职称,论资排辈,包括一些经验的考虑,没有什么助理、经理还是高级专员,或者副总监,我们没有这些 title。
我们就是谁来负责什么,一个职责为导向的工作,我们会有不同的大方向的负责人。举个例子,比如说要达到某一个目标,那可能就会涉及到不同的团队的一些资源需求,增长这一块需要一个负责自然流量增长的负责人,自然流量里面可能很重要的一部分是 SEO,就有人负责 SEO 这件事情,但是不代表说这个 SEO 的人,他就是有什么样的级别职称,谁更高谁更低。
这样子有一些好处,我们每个季度会进行调薪,已经延续了几年了,去按大家的贡献和岗位的变化发期权,甚至每个季度我们都会调整组织架构。很有可能这个月你负责几十个人,下个月你可能就只负责 5 个人,这是很正常的,因为你负责的内容发生了变化,核心来说,我们是一家负责制的公司。
知危:其实有一些公司会推崇超级员工,一个员工通过 AI 可以做非常多的事情。
宋亚宸:我们其实也非常支持,之前特别有意思,每次内推,包括对外招聘的时候,VAST 会设置一个岗位叫做六边形战士,既会运营,又会产品,又会增长,又会项目管理,甚至还懂一些财务法务,全栈式的你都可以搞定。我们团队里面专门有一个团队,就叫 Triplolabs,每个人都是全栈负责去做一些自己喜欢做的事情,但你一定要用 AI。
甚至他们会作为特种兵去空降到很多部门,比如说让你来支持我们增长团队的 AI 化,然后特种兵就开始大量的搭这个 AI 的中台。
知危:原部门的人不会有一些意见吗,怎么突然过来一个同事,可能会影响我本来的工作进度。
宋亚宸:不会,比如说我们公司之前的 API 平台一直没有很好的更新,因为大家都在忙我们的主产品 Tripo Studio ,这个时候我们就有 Tripolabs 的同学说,来去负责这个事情,他就快速的用 AI coding,几天就把整个东西全部翻新了一遍。
知危:是不是有可能是因为现在的团队规模比较小,所以部门阻力摩擦会小,当你空降一个这样的人进去之后,不会有太大的压力,当你组织变得非常庞大的时候,就会有一些问题?
宋亚宸:我觉得这就是我们所谓强调的实事求是带来的好处,有需要改进来帮助你,他因为是负责这件事情的,只要这个人来帮他,那就是抢 credit ( 功劳 )吗? 这就是 territory ( 职责范围 )的和 responsibility ( 责任 )的区别,你是掌握这个 scope ( 职责边界 )还是你是为这个结果负责?这是两件不同的事情,这也带来了不同的心态。
知危:你们公司非常年轻,CMO 都是 00 后;这个聊天的桌子我是从你同事那里借的,当时她正盘腿坐在上面疯狂敲键盘。
宋亚宸:VAST 是一个非常强调年轻人的公司,我们经常说老炮加上 00 后的组合,老炮指 95 后,我都属于老炮,我们有很多很年轻的 leader,他下面带年纪比他大很多的同事都是很正常的。
知危:之前你说你大部分的工作是在招人和找钱,你招人的标准是什么?
宋亚宸:我们现在公司文化主要有四个,第一个是热爱,我们觉得热爱是本质上来说是一个非常内核的事情,对于一件事,对于一个人,对于一个世界的热爱,这个我们是非常看重的。
第二就是长期主义,我们肯定不是在做个一两年的事情,我们至少在做 5 到10 年甚至更长的事情。但长期不代表说短期节奏不快,也不代表说不忙,这是两件事情,你可以快速的做长期主义的事情。
第三就是实事求是,对自己实事求是,对于别人实事求是,对于事情实事求是。
第四个点是我们一个同事提出来的,叫故意创新,不只是很自然的创新,我们要故意创新把看上去好像不需要创新的东西也创新一下。
知危:故意创新这怎么理解?普通人乍一听好像感觉这不是屎上雕花吗?
宋亚宸:哈哈创新肯定不是屎,屎上雕花就是一个典型的不创新的事情。比如说这里有面墙,屎上雕花是说我把这个墙抹的更白一点看起来很新,故意创新就是这个墙拆了,我们再来造一遍,哪怕很多人觉得这个墙不需要重新造。
知危:那你去怎么判断这些创新,它是真的创新?
宋亚宸:还是那句话,这件事情你是知道的,我也是知道的,不是说通过 KPI来判断。对于聪明的人,对于实事求是的人来说,对于有热爱的人来说,他一定不是这样子。你看一个人就知道他是不是热爱,非常简单,除非你不实事求是,或者你不够聪明,要么蠢,要么坏。

知危:我很好奇你是怎么喜欢上《 率土之滨 》的?
宋亚宸:我是一个很容易进入到一个世界的人,我觉得《 率土之滨 》是一个做的很好的游戏。当时我有几个不同的公会,我是盟主,也是金主,大家还是挺有成组织的。我记得特别有意思,有人专门发会邀,记签到,甚至还有人记会议纪要,做什么样决策 To do ,还是很讲纪律。
知危:游戏里面有没有点像开公司?你要做管理,然后再抉择到底要不要打另一个城,包括怎么去动员这些人,选择什么样的时间?
宋亚宸:不太一样,像我创业,我们更多的是往一个目标上走,《 率土之滨 》或者之类的游戏有点像下围棋,它是我干掉你,或者你干掉我的事情,零和博弈,有点像黑风山的妖怪打架,不像唐僧取经。
知危:所以这个快感是你占领了城池,把这个地块儿都填满,还是说在这个过程中和你的朋友的互动呢?
宋亚宸:其实当你 Cosplay 的时候,人就会很爽了,因为你体验的维度增加了。我其实打了很好几个赛季了,我是一个比较容易代入的人,所谓的不停地进入到下个世界去体验,就跟睡觉一样,我也是特别容易睡着的人,也可以睡五分钟,立刻起来就给你开会。
知危:但是你也会很快抽离。
宋亚宸:对,我体验游戏会特别有代入感,包括玩《 龙与地下城 》,短团可能你就扮演一次就结束了,下一次来就是另外一个人了,今天矮人盗贼,明天你可能就是巨人、野蛮人了。
知危:还是挺不一样的,我认识的的两个很年轻的创业者,他们也非常喜欢玩游戏。但是他们玩游戏的阈值会越来越高,对于机制的要求非常高,某方面一定要达到他的要求他才会玩,不然的话会立马 Pass。
宋亚宸:我很少有不喜欢玩的游戏。《 金铲铲 》、《 月圆之夜 》我也能玩,《 杀戮尖塔 》、《 鬼谷八荒 》我也能玩,无厘头的像《 中国式家长 》要玩,《 王者荣耀 》、《 英雄联盟 》、《 DOTA 》、 吃鸡、《 原神 》都玩。
知危:所以你每天你现在还玩,是吗?
宋亚宸:对,我还是要玩游戏的。
知危:但是你每天晚上回去的时候,会怎么选择你今天要玩哪款游戏,进入哪个世界呢?
宋亚宸:那就是当下,当下随便,我不会觉得玩着玩着好像很烂,这游戏有点浪费时间,甚至小游戏我也经常玩。还有什么《 咸鱼之王 》,《 无尽冬日 》,再小的游戏我都可以。
知危:这些游戏对于你来说其实没有什么功利性的东西在里面,就是放松,还是说你就是缺少不了,就跟你吃饭一样?
宋亚宸:我不会觉得这是放不放松的事情,其实就是进入到另外一个世界,然后体验另外的东西,我觉得这是一个非常好的值得我花时间的地方。
知危:你觉得你比较喜欢的,或者是你玩过的比较好的游戏世界观是什么样子的?
宋亚宸:我觉得两个世界观我觉得还是挺牛,一个就是《 龙与地下城 》的世界观,它非常的有影响力,甚至影响了未来的这些 RPG 的游戏;另外一个我觉得有态度,在输出自己的想法的是《 极乐迪斯科 》。

知危:其实我还蛮好奇,因为你之前跟媒体聊过你在美国读高中那段经历,那所学校因为远离城市,在山谷里,对你的影响非常大,其中有一点是教导大家绝不撒谎。我觉得和我之前采访的一个叫好奇社区的类似,它也是一个非常纯粹的一个新式教育社区,年轻的朋友都特别的真诚、真实,但有一个问题就是当他们在这个社区毕业了之后,他又会回到现实社会,很多孩子会出现难以自洽的情况。
宋亚宸:我明白你的意思,其实我的高中没有教我很多习惯性的东西,高中校训叫做“ Character before Career ”( 品行优于事业 ),就是培养一个人的品性,我们的老师都是人生非常精彩的一群人,但他们因为共同的理念,然后走在了一起,在一个类似于世外桃源的地方,我们都跟老师住在一起。
从我角度看,硬要说一个词,我觉得是曾经和一群很善的人在一起,其实也不一定是善良的善,在某种意义上来说,比较纯粹。善其实是一种本体,善良其实是一种相。
知危:所以我在想,会不会你觉得这个真实的世界,它可能没有那么的美好,所以你希望去创造一个更接近于内心天堂的这样的一个世界,这可能是你创意的一些原点。
宋亚宸:其实我没有觉得这个世界有那么灰暗,我觉得这个世界还是很不错的,从某种意义上来说,这个世界是最好的妥协的结果了。无非就是它在变化,我们希望去带来更好的变化。
知危:你作为一个文科背景,但在其实是技术主导的行业创业其实是蛮难的,你是怎么迭代自己的?
宋亚宸:很好的问题,我是一个对信息不是很敏感的人,但是我对于“ 连线 ”很敏感。
可以理解为你给我很多点,我不是很擅长去背那么多点,但是我很擅长发现点与点之间的线,然后只要发现一次,这就会进入到我的迭代系统当中,我很容易悟到一些事情,我会对一些 insight 很在意,对很多思维方式很在意。
就像你找一个人给你解释大模型是什么,可能有人会把百度百科的东西背出来,但这事儿我干不了。我觉得大模型是一种思考方式,1.0 时代就是用大量的小模型去解决常规问题,2.0 时代就是用通用模型去解决所有,我觉得这是核心。
知危:那你怎么做自我的纠偏呢?
宋亚宸:自我纠偏就是我知道我很菜,因为团队的每一个人能力都比我强。我其实跟他们都讲过,我不太能接受招能力比我差的人,你一定有什么东西比我强,我其实是非常开放的去学习和尝试理解,并且指正我自己的。
知危:但是最终的判断是来自于你?
宋亚宸:最终的决策来自我,我愿意去做这样一个相信队友的决策。当然擅长决策不是说决策就都是对的,首先让你做决策的时候,你可以直接做决策,第二是另外我也会承认那些自己做错的决策。这件事情我们公司经常发生,我们承认,我们复盘,想办法把它弄对。
知危:最后一个问题,过去一年里,你觉得自己最重要的成长是什么?
宋亚宸:( 陷入了长时间思考 )
我为什么想了很久呢?是因为我觉得我每天其实没有在特别的打造我,我每天心心念念的事情就是怎么打造一个更好的团队,往那个目标去努力。所以如果要让我说团队有哪些进步,我可能可以说非常非常多,但是说我怎么自己成长了,可能我无意识中肯定也会有很多成长,但我真没想过。
知危:这个回答很真实,因为 VAST 真的正在一个非常重要的一个快速发展的阶段,就是还有一些你的竞争对手,未来的竞争对手······
宋亚宸:他们还没出现呢。



知危官方账号




