人工智能基础设施市场正在同步出现两个新信号:服务器租赁成本持续下行,算力Token支出增速趋于稳定。这两个信号共同指向AI领域一个核心命题——AI成本下降,究竟是催生更多需求,还是侵蚀现有定价能力?
日本AI实验室Sakana推出颠覆性"编排"框架模型Fugu,以协调多个前沿模型取代暴力扩参路线,在主流基准测试中超越Claude和GPT-5.5。
Sakana Fugu在SWE-Bench Pro测试中得分73.7,超越Claude Opus 4.8的69.2和GPT-5.5的58.6。Fugu并非单一大模型,而是一个动态调度器——通过单次API调用,决定将任务的不同部分路由至最适配的前沿模型并行处理,最终整合输出优于任何单一模型的结果。
高盛1-Delta台席负责人Rich Privorotsky将计算资源租赁价格视为追踪AI硬件投资逻辑是否成立的核心指标:市场的核心前提是算力稀缺;若供给上升导致租赁价格持续下行,将直接挑战稀缺性叙事。目前,服务器租赁成本已呈现明显下行走势。
然而Privorotsky同时指出,在Token支出格局发生根本性转变之前,硬件板块的交易逻辑料将延续。半导体ETF上周录得异常高的资金流入,印证了市场当前的定位偏好。
他表示,超大规模云计算商的价格动向将日益成为关键观察点,本周的市场焦点更多将落在美光财报数据上,而非PCE。
Sakana是一家总部位于东京的AI实验室,其联合创始人之一参与撰写了原始Transformer论文。
Sakana推出的Fugu框架颠覆了当下行业主流的"暴力扩参"逻辑。作为一个协调器,Fugu在接收单次API请求后,动态决策将任务的不同部分分配给不同前沿模型并行处理,最终输出一个优于任何单一模型独立作答的结果。
Rich Privorotsky将这一方法概括为通过"模型编排与融合"而非暴力扩参来实现前沿级性能。这一方法论若得到更广泛验证,将对算力军备竞赛的底层逻辑构成挑战——因为其性能增益并不依赖于更多的训练算力投入。
在出口管制风险日益上升的背景下,Fugu的模型池支持动态替换,赋予其额外的战略韧性:若某一提供商因管制受限,框架可自动绕开切换,降低供应链单点风险。这一特性使其在地缘博弈加剧的环境下具有独特的架构优势。
智谱发布的GLM-5.2在FrontierSWE长程编程基准上得分74.4,与Anthropic顶级模型Opus 4.8的75.1仅差约1个百分点,同时超越GPT-5.5的72.6,成为目前评分最高的开源权重模型,定价比Opus 4.8低约72%至82%。
Privorotsky指出,开源与闭源模型之间的差距正持续收窄。GLM-5.2采用MIT许可证,支持权重开放、模型蒸馏、量化与复现,代表能力的重大跃升,是该领域差距加速收窄的清晰信号。
随着能力更强的开源模型不断涌现,Token成本压缩进程正在加速。然而,Privorotsky强调,当前的激励机制仍指向更多资本支出而非更少。
在Privorotsky的分析框架中,计算资源租赁价格是观察AI硬件投资逻辑是否成立的核心变量。
其逻辑链条清晰:若算力稀缺持续,价格应保持坚挺,从而为持续的资本支出提供正当性;反之,若供给上升导致租赁价格持续下行,将直接挑战稀缺性叙事,且"最先承压的是硬件"。
目前,服务器租赁成本已呈下行走势。Sakana Fugu此类编排框架的出现,或许正与这一趋势相互印证——通过更高效的资源调度而非单纯堆砌算力来提升性能,从技术层面折射出供给扩张的现实。
Privorotsky表示,市场注意力将越来越多地转向超大规模云计算商的价格动向,一旦后者释放战略调整信号,AI投资周期的底层逻辑将面临重新评估。
风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。