2026年04月13日

大家都在抢 GPU，但真正稀缺的是晶体管文明

今天大家聊 AI，嘴上说的是模型，真到产业竞争里，拼的却是另一套东西：从晶体管、芯片、并行计算一路堆出来的硬件文明。GPU 之所以贵，不只是因为英伟达会卖卡，而是因为 AI 热潮把这条老技术链重新推到了台前。

Zampo 约 10 分钟阅读

大家都在聊大模型、英伟达、算力战，像是 AI 世界里最重要的东西突然变成了 GPU。

但如果你再往前追一步，会发现今天最贵的根本不是“模型想法”，而是把这些想法真正变成计算的那套底层硬件。说得更直白一点：AI 看起来像软件革命，但它真正踩着的，还是从晶体管开始的硬件文明。

从真空管、晶体管到 GPU，决定 AI 上限的从来不只是模型

今天很多人有一种错觉：AI 的突破主要靠算法，硬件只是配套。这个判断在聊产品体验时不算离谱，但一旦进入产业现实，就明显太轻了。

大模型为什么一训练就烧钱？为什么 AI 公司会被 GPU 卡脖子？为什么市场盯着的不是“哪家又发了一个新模型”，而是哪家手里有多少卡、多少带宽、多少机房电力？答案都指向同一件事：AI 不是在真空里跑的，它是一场被硬件边界严格约束的计算游戏。

我更愿意把今天这一轮 AI 热理解成一次迟到的提醒：过去几十年里，那条从真空管、晶体管、芯片到 GPU 的技术链，一直都在，只是大多数人直到大模型爆发，才第一次意识到它到底有多贵、多慢、也多难复制。

AI 最贵的不是想象力，而是把想象力落成算力的那层硬件。

GPU 为什么会突然变成时代主角

AI 这两年最真实的产业情绪，不是兴奋，而是焦虑。

模型厂商在卷参数，创业公司在卷效果，应用层在卷速度，但真正让所有人都紧张起来的，往往不是提示词，也不是论文，而是 GPU 够不够、租不租得到、训练一轮要烧掉多少钱。

这不是市场情绪过头，而是大模型的计算方式天然就偏向并行。训练一个模型，不是像人在纸上做一道题那样一步一步往下推，它更像是把海量相似的矩阵运算，铺到成千上万个计算单元上同时开工。谁能并行地吃下这些重复而密集的计算，谁就更适合做 AI 的底座。

这也是为什么 CPU 很重要，却不是今天 AI 训练的主角。CPU 更像一个全能型调度员，处理复杂控制、分支判断、系统协调这些活很强；GPU 则更像一整排算术工人，单个不一定多聪明，但一起干同一类活时，效率高得多。

对大模型来说，后者恰好更值钱。

一个很现实的场景是：你做一个 AI 产品 demo，也许几张卡就能跑起来；但只要你开始认真训练、微调、反复试验，成本结构马上就变了。钱不再主要花在“有没有人想到一个好点子”，而是花在“你有没有能力把这个点子重复计算几十亿次”。这时候，GPU 就不是配角，而是门票。

很多人把 GPU 当成 AI 时代的新贵，这种看法只说对了一半。

GPU 的确因为 AI 而被重新定价，但它之所以能承担这件事，不是因为某一天突然被发明出来，而是因为更早之前那条硬件演进线已经铺好了路。

计算机最底层干的事，其实非常朴素：控制电流的开和关。真空管时代，人类第一次把这种开关做成了电子计算，但它又大、又热、又容易坏。后来晶体管出现了，本质上还是在做“控制电流”这件事，只不过尺度更小、稳定性更高、功耗更低，还能被大规模塞进硅片里。

一旦这个开关足够小，事情就变了。

你不再是用一屋子的设备去完成一个简单运算，而是可以把几十亿个开关装进一块芯片里，再把这些开关组织成不同的架构：有的更适合做通用控制，有的更适合做图形渲染，有的则更适合吞下海量并行计算。GPU 后来能接住 AI，并不是命运眷顾显卡，而是晶体管微缩和芯片架构演进，把它一步步推到了那个位置。

真空管、晶体管、芯片、GPU 到大模型的演进主线示意图

所以今天再看 GPU，最好别只把它理解成一块贵卡。

它其实是几十年硬件工程压缩出来的结果：晶体管越做越小，芯片上能塞进去的计算单元越来越多；架构不断调整，越来越擅长处理同一种计算的大规模并发；再往上，才轮到图形、科学计算、机器学习这些应用一层层叠上来。

GPU 之所以贵，不只是因为它能算，而是因为它背后压着几十年才长出来的硬件积累。

英伟达这几年当然吃到了时代红利，但真正值得看的从来不是某家公司股价有多夸张，而是一个更冷的事实：AI 的竞争正在越来越像硬件竞争。

原因很简单。过去那套“靠晶体管不断缩小、性能自然上涨”的增长逻辑，已经没有以前那么顺了。摩尔定律放缓，不只是工程师嘴里的行业常识，它直接意味着：你想继续把算力往上堆，代价会越来越高，难度也越来越大。

问题也不只在晶体管数量本身。

今天做 AI，真正卡人的还有功耗、带宽、显存、封装、互连、散热、机房供电，甚至物理极限。你就算模型思路很好，如果数据搬不动、卡之间连不顺、电费扛不住、热设计压不住，最后也跑不出一个体面的结果。很多人把 AI 看成“模型能力大战”，但在更真实的工程世界里，它更像一整条硬件供应链和系统能力的总和。

这也是为什么市场最后会盯着 GPU，却又不能只看 GPU。

GPU 只是那个最容易被看见的入口。它后面真正稀缺的，是晶体管工艺、先进封装、高速互连、数据中心基础设施，以及一整套把并行计算稳定交付出来的工业能力。没有这些，显卡就是显卡；有了这些，它才会变成 AI 时代的基础设施。

CPU 与 GPU 在任务分工上的差异：前者偏控制，后者偏大规模并行

所以我不太认同那种说法：AI 是一次纯软件革命，硬件只是跟着受益。

更准确的说法应该是，AI 把软件的想象力推到了一个新高度，但决定这件事能不能持续扩张的，依然是硬件。模型能继续变大、推理能继续变快、成本能不能继续往下压，最后都绕不开那条从晶体管开始的老问题。

如果你把今天的 AI 热潮只看成模型热，那你看到的只是浪头；如果你把它放回晶体管、芯片、并行计算这条长线里看，才会明白为什么全世界会突然对 GPU 这么紧张。

AI 不是凭空出现的革命，它只是把硬件文明又往上推了一层，而且推得更贵了。