Nvidia 架构 #

1. Fahrenheit
1. Celsius
1. Kelvin
1. Rankine
1. Curie
1. 2008 Tesla: 市面已经没有相关显卡
1. 2010 Fermi: GeForce 400, 500, 600, GT-630
1. 2012 Kepler: K40/K80, GeForce 700, GT-730
1. 2014 Maxwell: Tesla/Quadro M series GeForce 900, GTX-970
1. 2016 Pascal: P4, P100, GTX 1080, GTX 1070, GTX 1060
1. 2017 Volta: V100, GTX 1180, TiTan V
- 首次引入 Tensor Core
1. 2018 Turing: T4, GTX 1660 Ti, RTX 2060, RTX 5000
1. 2020 Ampere: A2, A10, A16, A30, A40, A100, GTX 3080
1. 2022 Hopper: H100, H200
1. 2022 Ada Lovelace: 4090, L4, L40, L40S
1. 2024 Blackwell: B40, B100, B200

13. `Ada Lovelace` vs Hopper #

Ada Lovelace (consumer) #

officially announced on 2022-09-20

RTX 40 系列
- GeForce RTX 4090

Hopper (professional) #

H100
- 今年 3 月，英伟达发布了新一代基于 4nm 工艺，拥有 800 亿个晶体管、18432 个核心的 H100 GPU
- H100 加速卡是 NVIDIA 当前最强的，售价 3.65 万美元，约合 26.4 万元人民币
- 芯片的数据传输速率为 800GB/s
H800
- 芯片的数据传输速率为 400GB/s

12. Ampere (consumer, professional) #

安培微架构（Ampere）是 NVIDIA 于 2020 年 5 月发布的一个 GPU 架构。用以取代图灵微架构（Turing microarchitecture）。命名为“安培”以向法国物理学家安德烈-马里·安培（André-Marie Ampère）致敬。Ampere 架构拥有晶体管达 540 亿，是三星 8nm 级芯片。是世界上晶体管最多的芯片，直到后来被苹果 M1 Max 击败。

RTX 30 系列
GeForce MX series
- GeForce MX570 (mobile) (GA107)
GeForce 20 series
- GeForce RTX 2050 (mobile) (GA107)
GeForce 30 series
- GeForce RTX 3050 Laptop GPU (GA107)
- GeForce RTX 3050 (GA106 or GA107)
- GeForce RTX 3050 Ti Laptop GPU (GA107)
- GeForce RTX 3060 Laptop GPU (GA106)
- GeForce RTX 3060 (GA106 or GA104)
- GeForce RTX 3060 Ti (GA104 or GA103)
- GeForce RTX 3070 Laptop GPU (GA104)
- GeForce RTX 3070 (GA104)
- GeForce RTX 3070 Ti Laptop GPU (GA104)
- GeForce RTX 3070 Ti (GA104 or GA102)
- GeForce RTX 3080 Laptop GPU (GA104)
- GeForce RTX 3080 (GA102)
- GeForce RTX 3080 12GB (GA102)
- GeForce RTX 3080 Ti Laptop GPU (GA103)
- GeForce RTX 3080 Ti (GA102)
- GeForce RTX 3090 (GA102)
- GeForce RTX 3090 Ti (GA102)
Nvidia Workstation GPUs (formerly Quadro)
- RTX A1000 (mobile) (GA107)
- RTX A2000 (mobile) (GA107)
- RTX A2000 (GA106)
- RTX A3000 (mobile) (GA104)
- RTX A4000 (mobile) (GA104)
- RTX A4000 (GA104)
- RTX A4500 (GA102)
- RTX A5000 (mobile) (GA104)
- RTX A5000 (GA102)
- RTX A5500 (GA102)
- RTX A6000 (GA102)
Nvidia Data Center GPUs (formerly Tesla)
- Nvidia A2 (GA107)
- Nvidia A10 (GA102), 24GB 显存
- Nvidia A16 (4 × GA107)
- Nvidia A30 (GA100)
- Nvidia A40 (GA102)
- Nvidia A100 (GA100) / NVIDIA A100 Tensor Core GPU
  - 芯片的数据传输速率为 600GB/s
- NVIDIA A800 40GB
  - 芯片的数据传输速率为 400GB/s
  - A800 只影响多卡互联的性能，而计算能力完全保留

11. Turing vs Volta #

Turing（consumer 消费） #

2018

RTX 20 系列
GTX 16 系列
Tesla T4
- 按照英伟达的说法，Tesla T4 是为推理而生的。
  - 在语音识别模型 DeepSpeech 2 上，T4 比 P4 的 5 倍还要快；
  - 在神经网络翻译模型 GNMT 上，T4 的速度接近 P4 的 4 倍；
  - 在图像识别模型 ResNet-50 上，T4 也接近 P4 的 3 倍。
- 在 T4 诞生之前，P4 在深度学习界的地位，也是很崇高的。

Volta（ professional 专业） #

2017

V100 32GB
V100 16GB

10 Pascal #

2016

GTX 10 系列
P100
Tesla P4
- 2016 年 9 月 13 日，GTC China 大会上，NVIDIA 发布了 Tesla P4 GPU。这是一块采用 Pascal 架构、2560 个 CUDA 核心、8GB GDDR5 显存、显存带宽 192.0GB/S 半高 Data Center 系列 GPU。
- Tesla P4 的 GPU 算力为 6.1，核心代号为 GP104，同 GTX1080 一样。具有 4 个 GPC，20 个 SM 单元，每个 GPC 有 5 个 SM，每个 SM 有 128 个 CUDA 核心，共计 2560 个 CUDA 核心，提供 5.5TFLOPS 的单精度计算性能，，256KB 寄存器，96KB 的 Shared Memory，总共 48KB 的 L1 缓存和 8 个纹理单元。
- P4 是专业卡，其实就是老黄为了坑钱给专业人士弄的卡。性能和 1080 一样。做某些程序时 1080 会负优化，但有办法可以解除这个限制。所以专业卡一般等于智商税

Nvidia 架构

Nvidia 架构 #

14. Blackwell #

13. `Ada Lovelace` vs Hopper #

Ada Lovelace (consumer) #

Hopper (professional) #

12. Ampere (consumer, professional) #

11. Turing vs Volta #

Turing（consumer 消费） #

Volta（ professional 专业） #

10 Pascal #

9. Maxwell #

8. Kepler #

7. Fermi #

6. Tesla #

5. Curie #

4. Rankine #

3. Kelvin #

2. Celsius #

1. Fahrenheit #

Nvidia 架构 #

14. Blackwell #

13. Ada Lovelace vs Hopper #

Ada Lovelace (consumer) #

Hopper (professional) #

12. Ampere (consumer, professional) #

11. Turing vs Volta #

Turing（consumer 消费） #

Volta（ professional 专业） #

10 Pascal #

9. Maxwell #

8. Kepler #

7. Fermi #

6. Tesla #

5. Curie #

4. Rankine #

3. Kelvin #

2. Celsius #

1. Fahrenheit #

13. `Ada Lovelace` vs Hopper #