Wenn es um GPUs geht, ist Nvidia ein führender Experte. Nvidia ist seit 1993 im Geschäft und hat eine breite Palette von professionellen und Verbraucher-GPUs von höchster Qualität produziert. Die angesehenen Architekturen ihrer Prozessoren stehen hinter dem Erfolg ihres Produkts, insbesondere ihrer Hauptlinie, der Geforce. Der GPUs von Nvidia ging über den Spielraum hinaus und erweiterte ihre Präsenz in Deep Learning, KI (künstliche Intelligenz) und beschleunigte Analysen. Nvidia infiltrierte vor einem Jahrzehnt den Rechenzentrenmarkt, beginnend mit den Fermi -Chips. Nachfolgende Iterationen wurden durchgeführt, und das Unternehmen veröffentlichte kontinuierlich GPU. Die GPUs von Nvidia haben sich im Laufe der Jahre weiterentwickelt, und die Architektur entwirft hauptsächlich die Evolution.
Nvidias Ampere -Architektur
Der Wettbewerb ist bei GPU -Herstellern sehr eng, aber Nvidia hält nichts zurück, um den ersten Platz zu belegen. Tatsächlich hat Nvidia den KI -Markt in den letzten zehn Jahren dominiert. Im Jahr 2020 machten die Nachrichten über die erste 7 -nm -GPU von NVIDIA (8 nm für Verbraucherteile) mit 54 Milliarden Transistoren, die in einem so kleinen Würfel komprimiert wurden. Codenamen Ampere Nach dem französischen Mathematiker André-Marie Ampère, Die Prozessorarchitektur von NVIDIA erhöht eine massive Verbesserung gegenüber seinen Vorgängern Turing und Volta und verspricht mehr Funktionen, bessere Effizienz und höhere Leistung bei niedrigeren Leistungsstufen. Ampere steht hinter der zweiten Generation von Nvidia von RTX GPUs, der RTX 30 -Serie, und soll doppelt so schnell sind wie ihre Gegenstücke der RTX 20 -Serie. Die Ampere -Architektur ist auch die Kraft hinter Nvidia A100 Rechenzentrums -GPUs.
Amperes Spezifikationen
Ampere ist die erste 7nm/8nm -GPU von Nvidia, die zweite Generation der Verbraucherstrahlverfolgung, und hat die dritte Generation von Tensorkernen. Ampere ist die zugrunde liegende Architektur von GA100, GA102 und GA104 GPUs, die in Geforce RTX 3090, RTX 3080, RTX 3070 und zuletzt die RTX 3060 eingebettet sind. Nvidia soll in den folgenden Monaten auch RTX 3050 freigeben. In der Zwischenzeit bietet die GPU der Enterprise GPU 20 -fache mehr Computerleistung als frühere Generationen von GPUs des Rechenzentrums. Hier ist ein Überblick über den ampere ansässigen Professional- und Verbraucher-GPUs von Nvidia [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Grafikkarte | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Prozess (NM) | TSMC N7 | Samsung 8n | Samsung 8n | Samsung 8n |
Transistoren (Milliarden) | 54 | 28.3 | 28.3 | 17.4 |
Die Größe (mm^2) | 826 | 628.4 | 628.4 | 392.5 |
GPC -Konfiguration | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
SMS | 108 | 82 | 68 | 46 |
Cuda -Kerne | 6912 | 10496 | 8704 | 5888 |
RT -Kerne | Keiner | 82 | 68 | 46 |
Tensorkerne | 432 | 328 | 272 | 184 |
Boost Clock (MHz) | 1410 | 1700 | 1710 | 1730 |
VRAM -Geschwindigkeit (Gbps) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (48 max) | 24 | 10 | 8 |
Busbreite | 5120 (6144 max) | 384 | 320 | 256 |
Rops | 128 | 112 | 96 | 96 |
Tmus | 864 | 656 | 544 | 368 |
Gflops FP32 | 19492 | 35686 | 29768 | 20372 |
Rt tflops | N / A | 69 | 58 | 40 |
Tensor tflops fp16 (Sparsity) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Bandbreite (GB/s) | 1555 | 936 | 760 | 448 |
TBP (Watts) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Die Nvidia A100 ist die erste GPU, die die Ampere -Architektur verwendet hat. Der Enterprise-Chip richtet sich an Rechenzentren und für GPU-intensive Aufgaben wie Deep Learning und AI. Der 7 -nm -Prozess von TSMC erbaut und beherbergt einen enormen Betrag von 54 Milliarden Transistoren. Es hat die früheren Generationen von Enterprise-GPUs mit einer Leistung von 20-fachen mit 6.912 Cuda-Kernen, 432 Textur-Mapping-Einheiten, 160 ROPs, Tensor-Kernen der dritten Generation und einem 40-GB-VRAM mit Speicherbandbreite mit 1 über 1 übertroffen, das sich bei 1 über 1 GB VRAM befindet.6tb/Sek. DGX A100 ist das erste KI -System der Welt mit einem Cluster von acht A100 und einem hohen Preis von 199.000 US -Dollar.
Geforce RTX 30 Serie
Abgesehen davon, dass Nvidia den Unternehmensmarkt dominiert, hat die Verbraucher, insbesondere Spieler und Schöpfer, immer im Auge. Die Ampere -Architektur wird auch in den Verbrauchergrafikkarten von Nvidia übernommen. Die zweite Generation von Geforce RTX trägt den ampere basierten GPUs, der die Leistung auf doppelt so stark wie die vorherige Generation erhöht.
In den meisten Aspekten hat Ampere mehr als doppelt so hoch wie die Verarbeitungsleistung von Turing. Es hat die Shader -Leistung von Turing mit der doppelten Anzahl der FP32 -Cuda -Kerne verdoppelt. Insbesondere hat es 30 Shader-Tlops, 2.7x mehr als Turing's, was nur 11 Shader-Tlops sind. Ebenso misst Turings Tensor-Kern bei 89 Tensor-Tlops, aber Ampere hat diese Rate mit seinen 238 Tensor-Tlops mehr als verdoppelt. Nicht zu vergessen, dass die Kernraten von Strahlen verfolgt werden, was 58 RT-Tlops ist, 1.7x schneller als die 34 RT-Tlops von Turing, und um GPUs noch schneller laufen zu lassen, verbindet sich der Ampere-Chip mit dem schnellsten Speicher der Welt, dem Mikron G6X.
Die RTX 30 -Serie wird unter Verwendung von Samsung 8N NVIDIA Custom Process mit 28 Milliarden Transistoren für GA102 und 17 Milliarden Transistoren für GA104 erstellt. Die Titan Class RTX 3090 wird von der GPU GA102 angetrieben und liefert eine extrem leistungsstarke Leistung der Verbraucherkarten. Im Gegensatz zu den vorherigen Generationen ist RTX 3090 für kundenspezifische Designs für Dritte geöffnet.
RTX 3080 verwendet auch eine GPU GA102, die die doppelte Leistung von RTX 2080 und eine beeindruckende 4K -Spielkunst liefert. RTX 3070, angetrieben von GA104 -GPU, ist mit RTX 2080 TI zum Hälfte des Preises vergleichbar. Der kürzlich veröffentlichte RTX 3060 beeindruckt mit seiner erstaunlichen Leistung, die durch verbesserte Strahlverfolgungskerne, Tensorkerne, neue Streaming-Multiprozessoren und Hochgeschwindigkeits-G6-Speicher angetrieben wird.
Trotz der massiven Leistungserhöhung ist der neue RTX -GPUs nicht schwer in die Tasche. Die viel schnelleren Grafikkarten sind bei der Preisgestaltung leicht zugänglich. Das Flaggschiff der Nvidia Geforce, RTX 3080, startet bei 699 US -Dollar, der RTX 3070 verkauft sich bei 499 US. Die höhere RTX 3090 kostet 1.499 USD; In Anbetracht seiner Leistung auf Titan-Ebene immer noch erheblich kostengünstig.
Nur wenige Monate nach seiner Veröffentlichung gab es Berichten zufolge einen Mangel an Ampere-basierten Grafikkarten, und es ist keine Überraschung mit der atemberaubenden Leistung von Ampere zu einem vernünftigen Preis. Für diejenigen, die ein GPU-Upgrade in Betracht ziehen, ist jetzt die beste Zeit, um Nvidias Ampere-basierte GPUs in die Hände zu bekommen.
Quellen
[1] Walton, Jarred. "NVIDIA RTX 30-Serie Ampere Architecture Deep Dive: Alles, was wir wissen". https: // www.Tomshardware.com/features/nvidia-pree-architecture-tive dive. 13. Oktober 2020.