AI算力进入分层时代:Meta卖算力、Palantir炮轰Token经济、中国模型成企业降本利器
Meta卖算力:不是过剩,而是节奏调整
AI行情近期剧烈回调,导火索是Meta透露可能将闲置AI算力对外出售。这一举动在云计算领域本不稀奇——亚马逊、微软、谷歌早已将服务器资源商品化。但Meta不同:它过去购买芯片、建设数据中心的核心目标是支撑自身AI模型、广告系统与扎克伯格所称的“超级智能”,而非作为云服务商盈利。如今考虑出租算力,虽未正式落地(内部项目名为Meta Compute),却释放出微妙信号:千亿美元级AI投入需更近的收入来源支撑。
Palantir炮轰Token收费:企业AI支出遭遇“财富税”质疑
几乎同步,Palantir CEO Alex Karp在CNBC采访中激烈批评OpenAI、Anthropic等公司的Token计费模式,称其为“压在企业身上的财富税”。他指出,企业不仅为未创造实际价值的Token付费,还被迫交出核心数据。Palantir主张“AI主权”,强调应将AI嵌入业务流程,按结果付费,而非按消耗量买单。此举反映企业决策层对AI ROI(投资回报率)的日益敏感。
Capex仍在增长,但逻辑已变:从“抢资源”到“看利用率”
尽管市场担忧AI Capex见顶,但数据并不支持崩塌论。AWS、Google Cloud、Azure一季度云收入均高速增长,三大巨头2026年资本开支指引继续上调(亚马逊或达2000亿美元,Alphabet 1800–1900亿,Meta 1250–1450亿)。真正的变化在于:资本开支的叙事重心从“谁买得多”转向“谁用得满”。云厂商因提供确定性基础设施仍可涨价(如AWS GPU预留服务年内两次提价超35%),而模型公司则面临“强模型缺机器、弱模型机器闲置”的分化。
Token变“电表”:企业开始给AI装刹车
随着AI从试点走向规模化部署,企业CFO开始严审账单。UBS调研显示,约60%的企业正压缩Token开支、增设使用护栏。AI Agent的兴起加剧了这一趋势——自动化任务消耗的Token可达普通对话的千倍。Token不再代表“先进”,而成了类似电表的成本指标:转得快未必好,关键看产出效率。这迫使企业重新评估模型选择策略。
中国开源模型成降本利器:智谱GLM跻身硅谷采购清单
在此背景下,智谱GLM、Kimi、DeepSeek、Qwen等中国开源模型迎来机遇。a16z合伙人马克·安德森称GLM-5.2已在多任务中媲美甚至超越美国主流模型。Coinbase CEO Brian Armstrong证实,切换至GLM 5.2等开源模型后,配合路由与缓存优化,AI支出削减近半。企业开始“分档采购”:高难度任务用高价闭源模型,常规任务交由低成本开源方案,实现“够用就好”的成本控制。
AI基础设施进入分层时代:铁路泡沫的历史镜鉴
当前局面并非算力过剩,而是结构性分层:顶层(最强模型+顶级云)依然紧缺;中层面临利用率与定价压力;底层被开源与优化技术挤压。这如同19世纪铁路泡沫——铁轨本身有价值,但修早、修多、修错地方的公司终将出局。AI数据中心亦如此:GPU会折旧,但真正决定资产价值的,是每日是否有应用将其跑满。Meta卖算力的意义,正是揭开这一现实:AI故事的主角,正从“买机器最快的人”变为“让机器持续转下去的人”。






