从“堆卡”到“堆Token” 杭州加码智算基建的新逻辑
开年以来,国内AI应用端进入爆发期。
全球最大的AI模型API聚合平台OpenRouter数据显示,刚刚过去的2月,中国AI模型的周调用量(以Token计)以4.69万亿Token(文本处理的最小单元)对3.29万亿Token的优势首次超越美国。
并且,在全球调用量前五的模型中,中国模型占据4席,包括MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5、DeepSeek的V3.2,这4款模型合计贡献了Top 5总调用量的85.7%,呈现出“集群式崛起”的态势。要知道,1年前,中国模型在这个平台上的份额不到2%。
与此同时,杭州在2026年“8+4”经济政策中明确提出,力争全市智算规模达70EFlops(对数据的处理能力)。当全球开始质疑“堆算力”边际效益递减时,杭州加码智算基建的举动,引发业界广泛讨论:这是逆势冒进,还是精准布局?为此,记者同步对话DeepSeek、豆包、千问三个AI平台,拆解杭州智算布局背后的算力新逻辑。
你好,DeepSeek!最近有两个有意思的数据:2月底,OpenRouter数据显示,中国AI模型周调用量首次超越美国,标志着中国AI应用端进入爆发期;同期,杭州提出70EFlops的智算规模目标。但恰逢全球对“堆算力”模式产生质疑,英伟达股价大跌也侧面反映了市场对算力硬件投入的谨慎态度。请问,杭州此时加码智算,真的是“逆势加码”吗?这背后是否隐藏着算力定义的深层转变?
逆势加码?NO!是顺势而为
2月底的两则消息看似矛盾,实则指向同一场深层变革。
一侧是应用端的火爆。OpenRouter数据显示,2026年2月,中国AI模型周调用量首次超越美国,全球前五的模型中中国占据4席,3周大涨127%。支撑这一爆发的是AI使用模式的根本切换——从“问答式”转向“智能体式”。咨询公司沙利文的报告表明:2025年下半年,中国企业日均Token使用量较上半年暴增263%。另一侧是供给端的疑虑。英伟达发布超预期财报后,市值单日蒸发近2600亿美元,市场担忧的不再是算力够不够,而是“AI支出的可持续性”。
此时,杭州提出2026年全市智算规模超过70EFlops的目标。这是逆势加码吗?或许恰恰是顺势而为。
算力的定义正在悄然变化。过去,人们谈论算力时盯着单卡峰值(FLOPS),那是训练时代的思维——追求“一次性”的暴力计算。如今,当推理负载成为常态,当5万亿Token在全球流动,核心指标转向了“单位产出”:每元钱换多少吞吐量,每瓦电处理多少Token。
杭州的70EFlops,不是为了囤积算力,而是为了支撑“人工智能+”标杆场景10个以上。这里的算力,不再是实验室里的炫耀性资产,而是工厂里的生产性工具。中科曙光在郑州部署的3万卡国产算力池、智谱在调用量激增后上调API价格、Kimi海外收入首超国内——这些信号指向同一事实:算力正在从“硬件库存”变成“流水线消耗”。中国企业走的路确实不同:美国仍在探索“下一代算力长什么样”,中国则在解决算力如何真正“用起来”。
杭州此时加码智算,赌的不是硬件永不贬值,而是应用永不枯竭。只要每天有数十亿Token在金融、电商、编程的管道里奔涌,算力就有它的用武之地。这不再是“堆算力”的故事,而是“吞吐量”的故事。
主持人:纵观几个平台给出的答案,DeepSeek这个观点和立意最为直白,表述有大局观也更加通透。从这里我们还注意到了一个核心关键词——“Token”。其实Token本质上是一种“能源转换”的产物,当算力从“堆卡”转向“堆Token”,比的是谁能用更低的成本和更高的效率生成海量Token。杭州要建的这70EFlops,不是用来“炫技”的算力库存,而是对算力价值的重新认知——算力的核心价值不在于“拥有多少”,而在于“应用多少、转化多少”,以此来为未来数以百亿计的AI Agent提供“燃料”的基础设施。
也就是说,当Token足够便宜的时候,AI就会像水电煤一样渗透进每一个商业场景。这种渗透对杭州本地中小企业来说是否也是一种新的机会呢?有哪些更普惠的影响?
算力如水,创新自流。DeepSeek给出的答案言简意赅,进而总结了当Token变得足够便宜,杭州中小企业将迎来三重普惠机会:一是创业门槛归零二是试错成本兜底;三是“超级个体”崛起。豆包补充道,当Token廉价普惠,AI将像水电一样全面渗透,大幅降低中小企数字化门槛。企业无需自建算力,就能以低成本用上智能客服、营销、研发等工具,实现技术平权与降本增效,真正共享AI时代红利。千问则又增加了一个视角:企业无需重资产,即可优化环节。低成本试错激发创新,算力下沉成基础设施。让小企业用得起,促产业跨越。算力的终极意义,在于让小企业用得好,实现从技术高地到产业沃土跨越,检验于获得感。
