中美Token价格大战定生死
高盛:2030年全球每月Token消耗量会是2026年的24倍。中美Token价格大战定生死
高盛5月5日发了个《即将到来的智能体经济——AI 使用率与利润率拐点》的唱多报告,预计2030年达到每月120 quadrillion(120 千万亿)tokens。这个数字有够吓人的,算是最新的tokenomics唱多框架,有量化的数字了。
智能体用的token数量远多于聊天,这是肯定的。一次对话,大模型输出1000个token正常。如果是工具软件里在线辅助的Copilot,每天5000个tokens正常,都不多。但是持续在线Agent,每天消耗超过10万个token,到处找信息、多轮调用。
如果每月这么多token能卖钱,是可以成为大生意。现在比较熟悉的定价量是“百万token"(MTok)输入输出各多少钱,120 quadrillion是1200亿MTok。
2026 年全球AI API市场(包括OpenAI、Anthropic、Azure、AWS)的混合均价约为 $2.50/MTok,对应全球年化收入约1500亿美元。注意中国公司在里面份额还很少(因此潜力极大),差美国公司两个数量级,中国几家头部公司是一年10-20亿人民币的预期收入。
MTok的价格在以每年40%的速度下降。如果降成现在DeepSeek V4的价格水平,1200亿MTok只能卖到60亿美元,那年营收只有720亿美元,经济模式肯定崩了。因此,如果中国开源模型性能够强、价格够低,把市场平均价格杀到底,是可以毁灭tokenomics,谁也别想靠卖token赚大钱。这是我估计的,高盛报告没说。
另一方面,如果不降价,还是2.5美元每百万token的天价,2030年卖token收入3.6万亿美元,这太贵了,不符合不断降价的技术规律。
高盛的模型假设是,全球token定价,会是每月600亿 –1200 亿美元,年收入7000亿-1.4万亿美元的水平。如果有这个收入,那tokenomics是可以跑通的,硬件、软件、算力、基建各方去分这个钱,每年有这么多收入可以补上所有投入还有余。这对应每MTok价格0.5-1美元,和现在的2.5美元比也没便宜多少。
还有综合推理成本,硬件性能、算法效率不断进步,要低于这个成本,这应该没有问题,每Token推理成本在以每年 60–70%下降,技术进步空间很大。DeepSeek V4的定价就说明了推理降本空间很大。但关键还是卖价,推理效率再高,也有电费、数据中心基建、买卡的成本要覆盖。
一个可能的情况是,2030 年全球每月1200亿MTok中,有50%以上是中国模型跑的,全球混合均价被压到0.10–0.25美元每MTok,对应的年收入只有 1400亿 – 3600 亿美元,那远低于高盛的中性预期,这个收入就不太够了。
总体来说,高盛这个报告有意义,可以进行数值估算了。但我的结论正相反,美国tokenomics感觉够呛。高盛把理想的价格区间定得太死,2.5美元只降到0.5-1美元,这不符合IT技术进步的规律。中国公司技术在进步,降本是拿手好戏,在无数个行业已经证明了能力。
如果要唱多美国tokenomics,就必须假设中国大模型能力不行,没法把平均成本降到0.5美元每MTok以下去,对于中国搞大模型研发的人看来,这是荒谬的。对中国技术封锁是没用的,何况现在中美大模型性能差距就是几个月。美国大公司可以互相商量闭源定高价,但没法阻止中国公司把高性能大模型开源出来。
总体感觉,如果没有中国开源大模型杀价,美国tokenomics是可以跑通的,合伙商量一个合适的价格,需求也起来了。但就和别的行业一样,怕中国公司进来杀死行业。美国方面一定会狠狠黑中国开源大模型,已经投钱搞了些舆论,不是分胜负,而是定生死了。




亚洲视觉科技研发总监



