Nvidia 架构

Nvidia 架构 #

    1. Fahrenheit
    1. Celsius
    1. Kelvin
    1. Rankine
    1. Curie
    1. 2008 Tesla: 市面已经没有相关显卡
    1. 2010 Fermi: GeForce 400, 500, 600, GT-630
    1. 2012 Kepler: K40/K80, GeForce 700, GT-730
    1. 2014 Maxwell: Tesla/Quadro M series GeForce 900, GTX-970
    1. 2016 Pascal: P4, P100, GTX 1080, GTX 1070, GTX 1060
    1. 2017 Volta: V100, GTX 1180, TiTan V
    • 首次引入 Tensor Core
    1. 2018 Turing: T4, GTX 1660 Ti, RTX 2060, RTX 5000
    1. 2020 Ampere: A2, A10, A16, A30, A40, A100, GTX 3080
    1. 2022 Hopper: H100, H200
    1. 2022 Ada Lovelace: 4090, L4, L40, L40S
    1. 2024 Blackwell: B40, B100, B200

14. Blackwell #

13. Ada Lovelace vs Hopper #

Ada Lovelace (consumer) #

officially announced on 2022-09-20

  • RTX 40 系列
    • GeForce RTX 4090

Hopper (professional) #

  • H100
    • 今年 3 月,英伟达发布了新一代基于 4nm 工艺,拥有 800 亿个晶体管、18432 个核心的 H100 GPU
    • H100 加速卡是 NVIDIA 当前最强的,售价 3.65 万美元,约合 26.4 万元人民币
    • 芯片的数据传输速率为 800GB/s
  • H800
    • 芯片的数据传输速率为 400GB/s

12. Ampere (consumer, professional) #

安培微架构(Ampere)是 NVIDIA 于 2020 年 5 月发布的一个 GPU 架构。用以取代图灵微架构(Turing microarchitecture)。命名为“安培”以向法国物理学家安德烈-马里·安培(André-Marie Ampère)致敬。Ampere 架构拥有晶体管达 540 亿,是三星 8nm 级芯片。是世界上晶体管最多的芯片,直到后来被苹果 M1 Max 击败。

  • RTX 30 系列

  • GeForce MX series

    • GeForce MX570 (mobile) (GA107)
  • GeForce 20 series

    • GeForce RTX 2050 (mobile) (GA107)
  • GeForce 30 series

    • GeForce RTX 3050 Laptop GPU (GA107)
    • GeForce RTX 3050 (GA106 or GA107)
    • GeForce RTX 3050 Ti Laptop GPU (GA107)
    • GeForce RTX 3060 Laptop GPU (GA106)
    • GeForce RTX 3060 (GA106 or GA104)
    • GeForce RTX 3060 Ti (GA104 or GA103)
    • GeForce RTX 3070 Laptop GPU (GA104)
    • GeForce RTX 3070 (GA104)
    • GeForce RTX 3070 Ti Laptop GPU (GA104)
    • GeForce RTX 3070 Ti (GA104 or GA102)
    • GeForce RTX 3080 Laptop GPU (GA104)
    • GeForce RTX 3080 (GA102)
    • GeForce RTX 3080 12GB (GA102)
    • GeForce RTX 3080 Ti Laptop GPU (GA103)
    • GeForce RTX 3080 Ti (GA102)
    • GeForce RTX 3090 (GA102)
    • GeForce RTX 3090 Ti (GA102)
  • Nvidia Workstation GPUs (formerly Quadro)

    • RTX A1000 (mobile) (GA107)
    • RTX A2000 (mobile) (GA107)
    • RTX A2000 (GA106)
    • RTX A3000 (mobile) (GA104)
    • RTX A4000 (mobile) (GA104)
    • RTX A4000 (GA104)
    • RTX A4500 (GA102)
    • RTX A5000 (mobile) (GA104)
    • RTX A5000 (GA102)
    • RTX A5500 (GA102)
    • RTX A6000 (GA102)
  • Nvidia Data Center GPUs (formerly Tesla)

    • Nvidia A2 (GA107)
    • Nvidia A10 (GA102), 24GB 显存
    • Nvidia A16 (4 × GA107)
    • Nvidia A30 (GA100)
    • Nvidia A40 (GA102)
    • Nvidia A100 (GA100) / NVIDIA A100 Tensor Core GPU
      • 芯片的数据传输速率为 600GB/s
    • NVIDIA A800 40GB
      • 芯片的数据传输速率为 400GB/s
      • A800 只影响多卡互联的性能,而计算能力完全保留

11. Turing vs Volta #

Turing(consumer 消费) #

2018

  • RTX 20 系列

  • GTX 16 系列

  • Tesla T4

    • 按照英伟达的说法,Tesla T4 是为推理而生的。
      • 在语音识别模型 DeepSpeech 2 上,T4 比 P4 的 5 倍还要快;
      • 在神经网络翻译模型 GNMT 上,T4 的速度接近 P4 的 4 倍;
      • 在图像识别模型 ResNet-50 上,T4 也接近 P4 的 3 倍。
    • 在 T4 诞生之前,P4 在深度学习界的地位,也是很崇高的。

Volta( professional 专业) #

2017

  • V100 32GB
  • V100 16GB

10 Pascal #

2016

  • GTX 10 系列
  • P100
  • Tesla P4
    • 2016 年 9 月 13 日,GTC China 大会上,NVIDIA 发布了 Tesla P4 GPU。这是一块采用 Pascal 架构、2560 个 CUDA 核心、8GB GDDR5 显存、显存带宽 192.0GB/S 半高 Data Center 系列 GPU。
    • Tesla P4 的 GPU 算力为 6.1,核心代号为 GP104,同 GTX1080 一样。具有 4 个 GPC,20 个 SM 单元,每个 GPC 有 5 个 SM,每个 SM 有 128 个 CUDA 核心,共计 2560 个 CUDA 核心,提供 5.5TFLOPS 的单精度计算性能,,256KB 寄存器,96KB 的 Shared Memory,总共 48KB 的 L1 缓存和 8 个纹理单元。
    • P4 是专业卡,其实就是老黄为了坑钱给专业人士弄的卡。性能和 1080 一样。做某些程序时 1080 会负优化,但有办法可以解除这个限制。所以专业卡一般等于智商税

9. Maxwell #

2014

  • GTX 900 系列

8. Kepler #

2012


7. Fermi #

2010


6. Tesla #

2008


5. Curie #


4. Rankine #


3. Kelvin #


2. Celsius #


1. Fahrenheit #


本文访问量

本站总访问量

本站总访客数