返回列表 发布新帖
查看: 1|回复: 0

DeepSeek V4正式发布,华为超节点支撑利好国产算力链(附股)

[复制链接] [复制链接]

1817

主题

13

回帖

5708

积分

超级版主

积分
5708
发表于 1 小时前 | 查看全部 |阅读模式
开源模型性能与性价比实现双重突破: DeepSeek‑V4系列模型于2026年4月24日正式发布并开源,包含V4‑Pro与V4‑Flash两大版本,均原生支持100万token超长上下文,采用MIT开源协议。其中V4‑Pro参数规模达1.6万亿、激活参数49B,V4‑Flash参数规模284B、激活参数13B,预训练数据量均超32T。性能层面,V4系列在代码、数学、STEM领域达到开源模型顶尖水平,权威评测中超越多款主流闭源模型,长文本处理、Agent能力显著提升,且性价比突出。

华为昇腾950超节点深度适配:V4‑Pro单请求时延低至20ms、多并发吞吐达388TPS@21ms,V4‑Flash 单请求时延低于10ms、多并发吞吐达 4722TPS@20.15ms,可稳定支撑 8K 至 1M 全长度长序列应用,支持万卡级无收敛全互联扩展。华为950超节点支持V4核心优势源于三大底层技术突破:1)是原生精度加速,全面支持 FP8、MXFP8、MXFP4 格式,在保障精度前提下内存占用降低 50% 以上、算力翻倍;2)是稀疏访存优化,针对 MoE 模型离散访存特征强化硬件级稀疏访存,破解专家路由带宽瓶颈;3)是Vector与Cube共享 Memory,创新存储架构消除片上数据搬运开销,显著降低端到端时延。该超节点与模型联合定义架构,系统性解决超长上下文推理的时延、吞吐与成本痛点,完成国产算力对万亿参数大模型的全流程支撑验证。

国产算力全产业链受益:我们认为 1)加速高端AI硬件国产替代,为高端封装载板等零部件提供替代空间;2)超节点规模化放量,带动液冷设备等温控配套需求激增;3)模型Token调用量提升推动算力扩容,进一步增加载板、液冷等上游环节的增量需求。

相关公司:

算力:海光信息、禾盛新材、寒武纪等;

上游:凌玮科技、德福科技、东材科技、宏和科技、联瑞新材、华正新材、川环科技、飞龙股份等;

第三方芯片测试:利扬芯片;

服务器:中科曙光;

算力租赁:利通电子、盈峰环境、协创数据、东阳光等。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

admin@discuz.vip

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 添加微信客服
  • 关注公众号
MACD888量化www.macd888.com -MACD量化论坛-MACD股票论坛-MACD888股票论坛-macd论坛-macd网站-macd官网-Macd888论坛官方-macd俱乐部 © 2001-2026 Discuz! Team. Powered by Discuz! W1.5 闽ICP备2025120954号-1
关灯 在本版发帖
扫一扫添加微信客服
返回顶部
快速回复 返回顶部 返回列表