猿代码 — 科研/AI模型/高性能计算
0

地球最强的计算性能怪兽,炸裂的H100 GPU性能参数全分析

摘要: 双精度性能达到34TFlops了!天啊FP16达到2TFlops,间接是AI怪兽!访存带宽达到3.35TBNVLINK带宽达到900 GB/s,天啊可能很多年还会是领先的存在。原因是:1)美国把我们禁止了,否则 我国可以超过。2)其他国家没有能 ...

双精度性能达到34TFlops了!天啊

FP16达到2TFlops,间接是AI怪兽!

访存带宽达到3.35TB

NVLINK带宽达到900 GB/s,天啊  

内置800亿晶体管使用尖端的台积电4N为客户量身定制的流程NVIDIA的加速计算需求,H100是世界上有史以来制造的最先进的芯片。它在加速人工智能方面取得了重大进展,HPC、内存带宽、互连和数据中心规模的通信。



可能很多年还会是领先的存在。原因是:

1)美国把我们禁止了,否则 我国可以超过。

2)其他国家没有能力搞这个。

GPT-3 1750亿参数训练速度是A100的4倍,3950亿参数的MoE Switch XXL训练速度是A100的5-9倍,推理速度提升高达30倍。


说点什么...

已有0条评论

最新评论...

本文作者
2023-6-18 10:40
  • 0
    粉丝
  • 513
    阅读
  • 0
    回复
资讯幻灯片
热门评论
热门专题
排行榜
Copyright   ©2015-2023   猿代码-超算人才智造局 高性能计算|并行计算|人工智能      ( 京ICP备2021026424号-2 )