算力紧缺引发企业客户焦虑 GPU租金飙升48%

lnradio.com 2026年04月13日 16:12 38 0

　　人工智能淘金热正在迅速耗尽一种AI开发者不可或缺的资源：算力。

　　这场严重的算力紧缺已经让重度用户陷入焦虑，迫使企业放弃部分产品，并引发服务稳定性问题。这些问题为AI热潮敲响了警钟——正当海量用户开始依靠先进AI工具提升生产力时，算力瓶颈却可能限制这些强大新工具的实际效用。

　　过去几个月，“智能体AI”需求呈现爆发式增长。这类自主型AI工具能独立完成各类任务，从编写软件代码到为房产经纪人安排看房行程。企业正争相抢占算力资源，以服务不断扩大且使用强度显著提升的用户群体。

　　“所有人都在谈论石油，但我认为全球真正短缺的是Token。”洛杉矶工程师兼科技投资者Ben Pouladian表示。Token是AI中用于衡量任务消耗算力的计量单位。“如今的AI早已不只是我们站在冰箱前问菜谱的聊天机器人，它在统筹任务，变得越来越智能。”

　　这一切都指向了科技繁荣史上反复出现的经典问题：从19世纪铁路扩张到21世纪初电信与互联网爆发，需求增速始终远超企业获取资源、搭建基础设施的速度。历史上，涨价往往是解决供应紧缺的唯一手段，但此举对前沿AI公司而言风险巨大——它们正为争夺用户展开激烈竞争。

　　用于训练和运行AI模型的图形处理器（GPU）时租价格自去年秋季以来大幅飙升。热门聊天机器人Claude及其爆红的编程工具Claude Code的开发公司Anthropic近期频繁遭遇服务中断。该公司已开始在高峰时段对用户实行Token用量限制，但这一措施引发大量用户抱怨，称自己很快就触达用量上限。

　　据报道，OpenAI叫停其视频生成应用Sora，部分原因便是腾出算力，以支持代号为Spud的全新AI模型驱动的编程与企业级产品。

　　OpenAI面向企业用户的API平台Token用量从去年10月的每分钟60亿飙升至3月下旬的150亿。

　　“我确实花了大量时间寻找一切能临时调用的算力。”OpenAI首席财务官萨拉・弗莱尔在近期一次面向投资者的公开视频采访中表示，“由于算力不足，我们眼下正被迫放弃一些项目，做出非常艰难的取舍。”

　　去年年底，规模最大的上市AI云计算公司之一CoreWeave将价格上调逾20%，并要求小型客户签订至少三年的服务合约，此前这一期限仅为一年。美国银行分析师上月末恢复对该公司的评级并给予“买入”评级，称其服务需求至少在2029年前都将持续供不应求。

　　纽约数据提供商Ornn的数据显示，近几个月来，英伟达全系列GPU在云端数据中心的现货租赁价格均大幅上涨。Ornn Compute价格指数显示，英伟达最先进的Blackwell系列芯片单小时租金已达4.08美元，较两个月前的2.75美元上涨48%。

　　自2月中旬以来，Anthropic全系统频繁宕机，部分企业客户已转而使用其他AI厂商的模型。

　　软件开发平台Retool创始人兼首席执行官David Hsu表示，他原本更倾向使用Anthropic的Opus 4.6模型驱动公司的AI智能体工具，因为他认为这是最适合企业场景的模型。但他近期已切换至OpenAI的模型。“Anthropic的服务一直在频繁中断。”

　　互联网核心服务的可靠性通常用“几个九”衡量，四个九即99.99%的在线率，也是软件公司对客户的常见承诺。截至4月8日，Anthropic的Claude API近90天在线率仅为98.95%。

　　“这很不正常。”AI推理初创公司Baseten联合创始人兼首席技术官Amir Haghighat表示，“想想AWS、数据库、RDS或Stripe，它们都需要极高的稳定性和在线率。但AI领域目前并非如此，这不是你希望从为应用提供智能能力的公司那里获得的服务质量。”

　　在服务频繁中断的同时，Anthropic正经历爆发式增长。2025年末，该公司年度营收年化规模达90亿美元；到今年2月，这一数字飙升至140亿美元；两个月后再度翻倍，达到300亿美元。

　　3月下旬，Anthropic突然宣布，将在太平洋时间工作日早5点至11点的高峰时段限制用户Token消耗额度。用户纷纷在社交平台抱怨。一位用户在X上写道：“我好几周都没触达Claude Code限额，结果这周45分钟就用完了。”

　　“我们正全力满足Claude日益增长的需求。”Claude Code负责人兼开发者鲍里斯・切尔尼在X上表示，“算力是我们审慎管理的资源，我们会优先保障使用产品与API的客户。”