讨论
AI算力瓶颈转向数据搬运能力,HBM等环节成关键
2026-05-16 11:57
3 阅读
0 评论
0 点赞
相关行业:
集成电路
PC、服务器及硬件
云服务(含IDC、CDN)
经过大量思考和研究, 我最近终于更清楚地理解了“ CPU 短缺” 的真正原因。
它缺的未必是核心数量, 也未必只是核心算得有多快, 而是带宽: 更准确地说, 是把数据及时、 低延迟、 低功耗地送到正确位置的能力。
这件事不只发生在 CPU 上, GPU 也是一样。 今天的 GPU 核心已经非常能算, 但真正限制它发挥的, 往往是数据搬运速度。 数据进不来、 搬不动、 同步慢, 再强的计算核心也只能等待。
这也是为什么 HBM 如此紧缺。 高带宽内存的价值, 不只是“ 内存更快” , 而是它能把大量数据以极高带宽、 较低功耗、 较短物理距离供应给计算核心。
如果沿着这个角度看, AI 产业链里真正值得关注的, 是所有能提升数据搬运能力的环节:
HBM、 RDIMM、 内存通道、 PCIe、 CXL、 NVLink、 CoWoS、 先进封装、 SerDes、 交换机、 光模块、 光纤。
它们本质上都在解决同一个问题:
如何把数据更快、 更稳、 更低功耗地从一个地方搬到另一个地方。
但不是所有“ 搬运组件” 都会长期短缺。 越靠近高带宽、 低延迟、 低功耗、 先进封装、 复杂测试和高良率要求的环节, 越容易成为真正瓶颈。
这也让我意识到, 过去我对“ 算力” 的理解可能有偏差。
我们习惯把算力理解成核心数量、 主频、 FLOPS、 TOPS, 但在今天的 AI 和云计算系统里, 这个理解已经不够了。
算力并不只是“ 计算” 。 更准确地说, 现代算力的经济瓶颈, 越来越表现为数据的搬运、 同步、 存储和状态更新能力。
计算不是抽象世界里免费的符号操作, 而是物理世界中的真实状态改变。 它要占用空间, 要消耗能量, 要产生热量, 也要在存储、 内存、 封装、 互联、 网络和计算核心之间不断移动。
从兰道尔极限的角度看, 这一点尤其清楚。 兰道尔极限并不是当前产业瓶颈的直接原因, 但它提醒我们: 信息处理最终一定落在物理世界里, 必然对应能量代价和状态变化。
所以今天 AI 产业链最值得问的问题, 可能不是:
哪里还有更多核心?
而是:
谁能更快、 更便宜、 更低功耗地搬运数据?
从这个角度回看早期 PoW 体系也很有意思。 比特币的 SHA-256 更偏纯哈希吞吐, 而当年的以太坊 Ethash 因为更依赖内存和显存, 某种程度上更早把“ 算力竞争” 从单纯计算拉回到了内存容量、 显存带宽和数据访问能力上。
这对今天理解 AI 硬件周期很有启发。
现代算力竞争的底层问题, 正在从“ 谁有更多计算核心” , 转向“ 谁能更高效地完成数据搬运和状态更新”
它缺的未必是核心数量
这件事不只发生在 CPU 上
这也是为什么 HBM 如此紧缺
如果沿着这个角度看
HBM
它们本质上都在解决同一个问题
如何把数据更快
但不是所有
这也让我意识到
我们习惯把算力理解成核心数量
算力并不只是
计算不是抽象世界里免费的符号操作
从兰道尔极限的角度看
所以今天 AI 产业链最值得问的问题
哪里还有更多核心
而是
谁能更快
从这个角度回看早期 PoW 体系也很有意思
这对今天理解 AI 硬件周期很有启发
现代算力竞争的底层问题