AI:英伟达正式推出LPU,AI进入推理+Agent时代(附股)
当模型越来越大,上下文长度从十万Token 飙升到数百万,还要同时处理结构化和非结构化的数据,AI进入推理+Agent时代,未来每一家公司都会认真思考自己token 工厂的效率问题,因为算力就是收入本身。重视AI硬件板块投资机会!# 光+ PCB+存储+服务器代工板块业绩、估值有望再重估!Rubin系列:从节奏来看,Rubin将于26年下半年量产;Rubin Ultra采用全新Kyber机架,支持144颗GPU构成单一NVLink域。计算节点从正面插入,#NVLink交换机从背面通过中板连接,整体构成一台巨型计算机,Rubin Ultra将于27年下半年出货。到2027年底,# Blackwell和Rubin芯片将至少创造1万亿美元收入,而且这还是保守估计,实际计算需求会远超这个数字。
英伟达正式推出了 Groq LPU。Groq 3 LPU拥有500MB SRAM缓存和150 TB/s的片上带宽,远超Rubin GPU的22 TB/s。黄仁勋用一款名为 Dynamo 的软件,把这两者完美捏合,首创了解耦推理。AI 推理前半段的 Prefill和极其耗费算力的 Attention,全部交给 Vera Rubin;后半段的 Decode直接卸载给 Groq LPU 来降低延迟,组合后在极高token速率下实现35倍的每兆瓦吞吐提升。# 256颗LPU组成的Groq 3 LPX机架设计为与Vera Rubin NVL72并排部署。Groq 3 LPU将于26Q3出货。
Feynman系列:存储性能是制约 AI 推理的瓶颈,为此 NVIDIA 改变了以往使用标准 HBM 的策略,转而为 Feynman GPU 配备 定制化 HBM 技术。Feynman 将跳过通用规格,可能采用基于 HBM4E 的定制增强版 甚至提前布局 定制化 HBM5 方案。这种定制化方案允许 NVIDIA 将部分 GPU 的数据处理逻辑直接嵌入存储底层的 Base Die中,从而实现超高的带宽与极低的延迟。此外,Feynman将搭配Rosa的全新CPU。Feynman将于2028年出货。#Feynman平台将同时支持铜和CPO扩展。
相关标的:
光互连产业链:东山精密(索尔思)、炬光科技、源杰科技、天孚通信、中际旭创、新易盛、长光华芯、仕佳光子、光迅科技、永鼎股份、太辰光、光库科技、致尚科技等
PCB:胜宏科技,沪电股份,东山精密,深南电路,生益科技,菲利华,东材科技,大族数控,鼎泰高科,联瑞新材等
服务器代工:工业富联
存储:存储模组如香农芯创、国科微、佰维存储、江波龙等;存储芯片如兆易创新、澜起科技、东芯股份、普冉股份、聚辰股份、恒烁股份等
风险提示:需求不及预期、研发进展不及预期
页:
[1]