Nvidia 架构 #
-
- Fahrenheit
-
- Celsius
-
- Kelvin
-
- Rankine
-
- Curie
-
- 2008 Tesla: 市面已经没有相关显卡
-
- 2010 Fermi: GeForce 400, 500, 600, GT-630
-
- 2012 Kepler: K40/K80, GeForce 700, GT-730
-
- 2014 Maxwell: Tesla/Quadro M series GeForce 900, GTX-970
-
- 2016 Pascal: P4, P100, GTX 1080, GTX 1070, GTX 1060
-
- 2017 Volta: V100, GTX 1180, TiTan V
- 首次引入
Tensor Core
-
- 2018 Turing: T4, GTX 1660 Ti, RTX 2060, RTX 5000
-
- 2020 Ampere: A2, A10, A16, A30, A40, A100, GTX 3080
-
- 2022 Hopper: H100, H200
-
- 2022 Ada Lovelace: 4090, L4, L40, L40S
-
- 2024 Blackwell: B40, B100, B200
14. Blackwell #
13. Ada Lovelace
vs Hopper
#
Ada Lovelace (consumer) #
officially announced on 2022-09-20
- RTX 40 系列
- GeForce RTX 4090
Hopper (professional) #
- H100
- 今年 3 月,英伟达发布了新一代基于 4nm 工艺,拥有 800 亿个晶体管、18432 个核心的 H100 GPU
- H100 加速卡是 NVIDIA 当前最强的,售价 3.65 万美元,约合 26.4 万元人民币
- 芯片的数据传输速率为 800GB/s
- H800
- 芯片的数据传输速率为 400GB/s
12. Ampere (consumer, professional) #
安培微架构(Ampere)是 NVIDIA 于 2020 年 5 月发布的一个 GPU 架构。用以取代图灵微架构(Turing microarchitecture)。命名为“安培”以向法国物理学家安德烈-马里·安培(André-Marie Ampère
)致敬。Ampere 架构拥有晶体管达 540 亿,是三星 8nm 级芯片。是世界上晶体管最多的芯片,直到后来被苹果 M1 Max
击败。
-
RTX 30 系列
-
GeForce MX series
- GeForce MX570 (mobile) (GA107)
-
GeForce 20 series
- GeForce RTX 2050 (mobile) (GA107)
-
GeForce 30 series
- GeForce RTX 3050 Laptop GPU (GA107)
- GeForce RTX 3050 (GA106 or GA107)
- GeForce RTX 3050 Ti Laptop GPU (GA107)
- GeForce RTX 3060 Laptop GPU (GA106)
- GeForce RTX 3060 (GA106 or GA104)
- GeForce RTX 3060 Ti (GA104 or GA103)
- GeForce RTX 3070 Laptop GPU (GA104)
- GeForce RTX 3070 (GA104)
- GeForce RTX 3070 Ti Laptop GPU (GA104)
- GeForce RTX 3070 Ti (GA104 or GA102)
- GeForce RTX 3080 Laptop GPU (GA104)
- GeForce RTX 3080 (GA102)
- GeForce RTX 3080 12GB (GA102)
- GeForce RTX 3080 Ti Laptop GPU (GA103)
- GeForce RTX 3080 Ti (GA102)
- GeForce RTX 3090 (GA102)
- GeForce RTX 3090 Ti (GA102)
-
Nvidia Workstation GPUs (formerly Quadro)
- RTX A1000 (mobile) (GA107)
- RTX A2000 (mobile) (GA107)
- RTX A2000 (GA106)
- RTX A3000 (mobile) (GA104)
- RTX A4000 (mobile) (GA104)
- RTX A4000 (GA104)
- RTX A4500 (GA102)
- RTX A5000 (mobile) (GA104)
- RTX A5000 (GA102)
- RTX A5500 (GA102)
- RTX A6000 (GA102)
-
Nvidia Data Center GPUs (formerly Tesla)
- Nvidia A2 (GA107)
- Nvidia A10 (GA102), 24GB 显存
- Nvidia A16 (4 × GA107)
- Nvidia A30 (GA100)
- Nvidia A40 (GA102)
- Nvidia A100 (GA100) / NVIDIA A100 Tensor Core GPU
- 芯片的数据传输速率为 600GB/s
- NVIDIA A800 40GB
- 芯片的数据传输速率为 400GB/s
- A800 只影响多卡互联的性能,而计算能力完全保留
11. Turing vs Volta #
Turing(consumer 消费) #
2018
-
RTX 20 系列
-
GTX 16 系列
-
Tesla T4
- 按照英伟达的说法,Tesla T4 是为推理而生的。
- 在语音识别模型 DeepSpeech 2 上,T4 比 P4 的 5 倍还要快;
- 在神经网络翻译模型 GNMT 上,T4 的速度接近 P4 的 4 倍;
- 在图像识别模型 ResNet-50 上,T4 也接近 P4 的 3 倍。
- 在 T4 诞生之前,P4 在深度学习界的地位,也是很崇高的。
- 按照英伟达的说法,Tesla T4 是为推理而生的。
Volta( professional 专业) #
2017
- V100 32GB
- V100 16GB
10 Pascal #
2016
- GTX 10 系列
- P100
- Tesla P4
- 2016 年 9 月 13 日,GTC China 大会上,NVIDIA 发布了 Tesla P4 GPU。这是一块采用 Pascal 架构、2560 个 CUDA 核心、8GB GDDR5 显存、显存带宽 192.0GB/S 半高 Data Center 系列 GPU。
- Tesla P4 的 GPU 算力为 6.1,核心代号为 GP104,同 GTX1080 一样。具有 4 个 GPC,20 个 SM 单元,每个 GPC 有 5 个 SM,每个 SM 有 128 个 CUDA 核心,共计 2560 个 CUDA 核心,提供 5.5TFLOPS 的单精度计算性能,,256KB 寄存器,96KB 的 Shared Memory,总共 48KB 的 L1 缓存和 8 个纹理单元。
- P4 是专业卡,其实就是老黄为了坑钱给专业人士弄的卡。性能和 1080 一样。做某些程序时 1080 会负优化,但有办法可以解除这个限制。所以专业卡一般等于智商税
9. Maxwell #
2014
- GTX 900 系列
8. Kepler #
2012
7. Fermi #
2010
6. Tesla #
2008
叶王 © 2013-2024 版权所有。如果本文档对你有所帮助,可以请作者喝饮料。