人工智能淘金热正在迅速耗尽一种AI开发者不可或缺的资源:算力。
这场严重的算力紧缺已经让重度用户陷入焦虑,迫使企业放弃部分产品,并引发服务稳定性问题。这些问题为AI热潮敲响了警钟——正当海量用户开始依靠先进AI工具提升生产力时,算力瓶颈却可能限制这些强大新工具的实际效用。
过去几个月,“智能体AI”需求呈现爆发式增长。这类自主型AI工具能独立完成各类任务,从编写软件代码到为房产经纪人安排看房行程。企业正争相抢占算力资源,以服务不断扩大且使用强度显著提升的用户群体。
“所有人都在谈论石油,但我认为全球真正短缺的是Token。”洛杉矶工程师兼科技投资者Ben Pouladian表示。Token是AI中用于衡量任务消耗算力的计量单位。“如今的AI早已不只是我们站在冰箱前问菜谱的聊天机器人,它在统筹任务,变得越来越智能。”
这一切都指向了科技繁荣史上反复出现的经典问题:从19世纪铁路扩张到21世纪初电信与互联网爆发,需求增速始终远超企业获取资源、搭建基础设施的速度。历史上,涨价往往是解决供应紧缺的唯一手段,但此举对前沿AI公司而言风险巨大——它们正为争夺用户展开激烈竞争。
用于训练和运行AI模型的图形处理器(GPU)时租价格自去年秋季以来大幅飙升。热门聊天机器人Claude及其爆红的编程工具Claude Code的开发公司Anthropic近期频繁遭遇服务中断。该公司已开始在高峰时段对用户实行Token用量限制,但这一措施引发大量用户抱怨,称自己很快就触达用量上限。
据报道,OpenAI叫停其视频生成应用Sora,部分原因便是腾出算力,以支持代号为Spud的全新AI模型驱动的编程与企业级产品。
OpenAI面向企业用户的API平台Token用量从去年10月的每分钟60亿飙升至3月下旬的150亿。
“我确实花了大量时间寻找一切能临时调用的算力。”OpenAI首席财务官萨拉・弗莱尔在近期一次面向投资者的公开视频采访中表示,“由于算力不足,我们眼下正被迫放弃一些项目,做出非常艰难的取舍。”
去年年底,规模最大的上市AI云计算公司之一CoreWeave将价格上调逾20%,并要求小型客户签订至少三年的服务合约,此前这一期限仅为一年。美国银行分析师上月末恢复对该公司的评级并给予“买入”评级,称其服务需求至少在2029年前都将持续供不应求。
纽约数据提供商Ornn的数据显示,近几个月来,英伟达全系列GPU在云端数据中心的现货租赁价格均大幅上涨。Ornn Compute价格指数显示,英伟达最先进的Blackwell系列芯片单小时租金已达4.08美元,较两个月前的2.75美元上涨48%。
自2月中旬以来,Anthropic全系统频繁宕机,部分企业客户已转而使用其他AI厂商的模型。
软件开发平台Retool创始人兼首席执行官David Hsu表示,他原本更倾向使用Anthropic的Opus 4.6模型驱动公司的AI智能体工具,因为他认为这是最适合企业场景的模型。但他近期已切换至OpenAI的模型。“Anthropic的服务一直在频繁中断。”
互联网核心服务的可靠性通常用“几个九”衡量,四个九即99.99%的在线率,也是软件公司对客户的常见承诺。截至4月8日,Anthropic的Claude API近90天在线率仅为98.95%。
“这很不正常。”AI推理初创公司Baseten联合创始人兼首席技术官Amir Haghighat表示,“想想AWS、数据库、RDS或Stripe,它们都需要极高的稳定性和在线率。但AI领域目前并非如此,这不是你希望从为应用提供智能能力的公司那里获得的服务质量。”
在服务频繁中断的同时,Anthropic正经历爆发式增长。2025年末,该公司年度营收年化规模达90亿美元;到今年2月,这一数字飙升至140亿美元;两个月后再度翻倍,达到300亿美元。
3月下旬,Anthropic突然宣布,将在太平洋时间工作日早5点至11点的高峰时段限制用户Token消耗额度。用户纷纷在社交平台抱怨。一位用户在X上写道:“我好几周都没触达Claude Code限额,结果这周45分钟就用完了。”
“我们正全力满足Claude日益增长的需求。”Claude Code负责人兼开发者鲍里斯・切尔尼在X上表示,“算力是我们审慎管理的资源,我们会优先保障使用产品与API的客户。”