AI：英伟达正式推出LPU，AI进入推理+Agent时代（附股）

泡股发表于 2026-3-17 17:48:40

当模型越来越大，上下文长度从十万Token 飙升到数百万，还要同时处理结构化和非结构化的数据，AI进入推理+Agent时代，未来每一家公司都会认真思考自己token 工厂的效率问题，因为算力就是收入本身。重视AI硬件板块投资机会！# 光+ PCB+存储+服务器代工板块业绩、估值有望再重估！

Rubin系列：从节奏来看，Rubin将于26年下半年量产；Rubin Ultra采用全新Kyber机架，支持144颗GPU构成单一NVLink域。计算节点从正面插入，#NVLink交换机从背面通过中板连接，整体构成一台巨型计算机，Rubin Ultra将于27年下半年出货。到2027年底，# Blackwell和Rubin芯片将至少创造1万亿美元收入，而且这还是保守估计，实际计算需求会远超这个数字。

英伟达正式推出了 Groq LPU。Groq 3 LPU拥有500MB SRAM缓存和150 TB/s的片上带宽，远超Rubin GPU的22 TB/s。黄仁勋用一款名为 Dynamo 的软件，把这两者完美捏合，首创了解耦推理。AI 推理前半段的 Prefill和极其耗费算力的 Attention，全部交给 Vera Rubin；后半段的 Decode直接卸载给 Groq LPU 来降低延迟，组合后在极高token速率下实现35倍的每兆瓦吞吐提升。# 256颗LPU组成的Groq 3 LPX机架设计为与Vera Rubin NVL72并排部署。Groq 3 LPU将于26Q3出货。

Feynman系列：存储性能是制约 AI 推理的瓶颈，为此 NVIDIA 改变了以往使用标准 HBM 的策略，转而为 Feynman GPU 配备定制化 HBM 技术。Feynman 将跳过通用规格，可能采用基于 HBM4E 的定制增强版甚至提前布局定制化 HBM5 方案。这种定制化方案允许 NVIDIA 将部分 GPU 的数据处理逻辑直接嵌入存储底层的 Base Die中，从而实现超高的带宽与极低的延迟。此外，Feynman将搭配Rosa的全新CPU。Feynman将于2028年出货。#Feynman平台将同时支持铜和CPO扩展。

相关标的：

光互连产业链：东山精密（索尔思）、炬光科技、源杰科技、天孚通信、中际旭创、新易盛、长光华芯、仕佳光子、光迅科技、永鼎股份、太辰光、光库科技、致尚科技等

PCB：胜宏科技，沪电股份，东山精密，深南电路，生益科技，菲利华，东材科技，大族数控，鼎泰高科，联瑞新材等

服务器代工：工业富联

存储：存储模组如香农芯创、国科微、佰维存储、江波龙等；存储芯片如兆易创新、澜起科技、东芯股份、普冉股份、聚辰股份、恒烁股份等

风险提示：需求不及预期、研发进展不及预期

页: [1]

MACD888量化www.macd888.com -MACD量化论坛-MACD股票论坛-MACD888股票论坛-macd论坛-macd网站-macd官网-Macd888论坛官方-macd俱乐部's Archiver

AI：英伟达正式推出LPU，AI进入推理+Agent时代（附股）