Détails des accélérateurs IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans une merveille d’emballage avancée

2023/11/13

Les AMD Instinct MI300X et MI300A font partie des accélérateurs les plus attendus du segment de l’IA et seront lancés le mois prochain. Il y a beaucoup d’attente autour du premier chef-d’œuvre d’IA à part entière d’AMD et aujourd’hui, nous avons pensé à vous donner un aperçu de ce que vous pouvez attendre de cette merveille technique.

AMD Instinct MI300X est conçu pour les charges de travail d’IA accélérées par GPU tandis que le MI300A s’attaque au HPC avec le package APU le plus avancé techniquement

Le 6 décembre, AMD organisera son discours d’ouverture « Advancing AI » , dont l’un des principaux objectifs est de dévoiler complètement la famille d’accélérateurs Instinct de nouvelle génération, nommée MI300. Cette nouvelle famille accélérée par GPU et CPU sera le produit phare du segment IA qui est le n°1 d’AMD et la priorité stratégique la plus importante à l’heure actuelle, car elle déploie enfin un produit non seulement avancé, mais également conçu pour répondre aux exigences critiques. Exigence en matière d’IA au sein de l’industrie. La classe MI300 d’accélérateurs d’IA sera une autre centrale de chipsets, utilisant les technologies d’emballage avancées de TSMC. Voyons donc ce qui se cache sous le capot de ces monstres d’IA.

AMD Instinct MI300X – Défier la suprématie de l’IA de NVIDIA avec CDNA 3 et une mémoire énorme

L’AMD Instinct MI300X est certainement la puce qui sera le plus mise en avant puisqu’elle est clairement destinée aux accélérateurs Hopper de NVIDIA et Gaudi d’Intel au sein du segment de l’IA. Cette puce a été conçue uniquement sur l’architecture CDNA 3 et il se passe beaucoup de choses. La puce va héberger un mélange d’IP de 5 nm et de 6 nm, tous combinés pour fournir jusqu’à 153 milliards de transistors (MI300X).

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 2 — Accélérateur AMD Instinct MI300X.

Dès la conception, l’interposeur principal est doté d’une puce passive qui abrite la couche d’interconnexion à l’aide d’une solution Infinity Fabric de nouvelle génération. L’interposeur comprend un total de 28 puces, dont huit packages HBM3, 16 puces factices entre les packages HBM et quatre puces actives, et chacune de ces puces actives reçoit deux puces de calcul.

Chaque GCD basé sur l’architecture GPU CDNA 3 comprend un total de 40 unités de calcul, ce qui équivaut à 2 560 cœurs. Il y a huit matrices de calcul (GCD) au total, ce qui nous donne un total de 320 unités de calcul et 20 480 unités de base. Pour les rendements, AMD réduira une petite partie de ces cœurs et nous obtiendrons plus de détails sur les configurations exactes dans un mois.

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 4 — Accélérateur AMD Instinct MI300X avec matrices CDNA 3.

La mémoire est un autre domaine dans lequel vous constaterez une énorme mise à niveau avec le MI300X offrant une capacité HBM3 50 % supérieure à celle de son prédécesseur, le MI250X (128 Go). Pour atteindre un pool de mémoire de 192 Go, AMD équipe le MI300X de 8 piles HBM3 et chaque pile est de 12-Hi tout en intégrant des circuits intégrés de 16 Go, ce qui nous donne une capacité de 2 Go par circuit intégré ou 24 Go par pile. La mémoire offrira jusqu’à 5,2 To/s de bande passante et 896 Go/s de bande passante Infinity Fabric. À titre de comparaison, le prochain accélérateur H200 AI de NVIDIA offre des capacités de 141 Go, tandis que Gaudi 3 d’Intel offrira des capacités de 144 Go. Les grands pools de mémoire sont très importants dans les LLM qui sont pour la plupart liés à la mémoire et AMD peut certainement montrer ses prouesses en matière d’IA en étant leader dans le département de mémoire.

232328650_instinct_mi300a_exploded_view_01-custom

232328650_instinct_mi300x_exploded_view_01-personnalisé

En termes de consommation d’énergie, l’AMD Instinct MI300X est évalué à 750 W, soit une augmentation de 50 % par rapport aux 500 W de l’Instinct MI250X et 50 W de plus que le NVIDIA H200.

AMD Instinct MI300A – Les APU exascale densément emballés sont désormais une réalité

Nous attendons depuis des années qu’AMD tienne enfin la promesse d’un APU de classe Exascale et le jour approche à mesure que nous nous rapprochons du lancement de l’Instinct MI300A. Le packaging du MI300A est très similaire à celui du MI300X, sauf qu’il utilise des capacités de mémoire optimisées pour le TCO et des cœurs Zen 4.

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 3 — Accélérateur AMD Instinct MI300A.

L’une des matrices actives comporte deux GCD CDNA 3 découpés et remplacés par trois CCD Zen 4 qui offrent leur propre pool séparé de cache et d’adresses IP principales. Vous obtenez 8 cœurs et 16 threads par CCD, soit un total de 24 cœurs et 48 threads sur la puce active. Il existe également 24 Mo de cache L2 (1 Mo par cœur) et un pool de cache séparé (32 Mo par CCD). Il faut rappeler que les GCD CDNA 3 ont également le cache L2 séparé.

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 5 — Accélérateur AMD Instinct MI300A avec matrices CDNA 3 et Zen 4.

Pour résumer certaines des fonctionnalités mises en avant des accélérateurs AMD Instinct MI300, nous avons :

Premier package CPU + GPU intégré
Viser le marché des supercalculateurs exascale
AMD MI300A (CPU + GPU intégrés)
AMD MI300X (GPU uniquement)
153 milliards de transistors
Jusqu’à 24 cœurs Zen 4
Architecture GPU CDNA3
Jusqu’à 192 Go de mémoire HBM3
Jusqu’à 8 chipsets + 8 piles de mémoire (processus 5 nm + 6 nm)

En réunissant tous ces éléments, AMD travaillera avec ses facilitateurs et partenaires de l’écosystème pour proposer des accélérateurs d’IA MI300 dans des configurations à 8 voies comportant des conceptions SXM qui se connectent à la carte mère avec des connecteurs mezzanine. Il sera intéressant de voir dans quels types de configurations elles seront proposées et bien que les cartes SXM soient une évidence, nous pouvons également nous attendre à quelques variantes dans les facteurs de forme PCI-E.

amd-instinct-mi300-ai-accélérateurs-serveurs-_2

amd-instinct-mi300-ai-accélérateurs-serveurs-_1

Pour l’instant, AMD devrait savoir que ses concurrents se lancent également à toute vapeur dans l’engouement pour l’IA, NVIDIA annonçant déjà des chiffres énormes pour ses GPU Blackwell 2024 et Intel préparant également ses GPU Guadi 3 et Falcon Shores pour le lancement dans les années à venir. Une chose est sûre à l’heure actuelle, les clients de l’IA engloutiront presque tout ce qu’ils peuvent obtenir et tout le monde en profitera. Mais AMD dispose d’une solution très redoutable qui ne vise pas seulement à être une alternative à NVIDIA mais aussi un leader dans le segment de l’IA et nous espérons que le MI300 pourra les aider à atteindre ce succès.

Accélérateurs AMD Radeon Instinct

Nom de l’accélérateur	AMD Instinct MI400	AMD Instinct MI300	AMD Instinct MI250X	AMD Instinct MI250	AMD Instinct MI210	AMD Instinct MI100	AMD Radeon Instinct MI60	AMD Radeon Instinct MI50	AMD Radeon Instinct MI25	AMD Radeon Instinct MI8	AMD Radeon Instinct MI6
Architecture du processeur	Zen 5 (APU exascale)	Zen 4 (APU Exascale)	N / A	N / A	N / A	N / A	N / A	N / A	N / A	N / A	N / A
Architecture GPU	ADNC 4	Aqua Vanjaram (ADNC 3)	Aldébaran (ADNC 2)	Aldébaran (ADNC 2)	Aldébaran (ADNC 2)	Arcturus (ADNC 1)	Véga 20	Véga 20	Véga 10	Fidji XT	Polaris10
Nœud de processus GPU	4 nm	5nm+6nm	6 nm	6 nm	6 nm	FinFET 7 nm	FinFET 7 nm	FinFET 7 nm	FinFET 14 nm	28 nm	FinFET 14 nm
Chiplets GPU	À déterminer	8 (CMM)	2 (MCM) 1 (par dé)	2 (MCM) 1 (par dé)	2 (MCM) 1 (par dé)	1 (Monolithique)	1 (Monolithique)	1 (Monolithique)	1 (Monolithique)	1 (Monolithique)	1 (Monolithique)
Cœurs GPU	À déterminer	Jusqu’à 19 456	14 080	13 312	6656	7680	4096	3840	4096	4096	2304
Vitesse d’horloge du GPU	À déterminer	À déterminer	1 700 MHz	1 700 MHz	1 700 MHz	1 500 MHz	1 800 MHz	1725 MHz	1 500 MHz	1 000 MHz	1237 MHz
Calcul FP16	À déterminer	À déterminer	383 HAUTS	362 HAUTS	181 HAUTS	185 TFLOP	29,5 TFLOP	26,5 TFLOP	24.6 TFLOP	8.2 TFLOP	5.7 TFLOP
Calcul FP32	À déterminer	À déterminer	95,7 TFLOP	90,5 TFLOP	45.3 TFLOP	23.1 TFLOP	14.7 TFLOP	13.3 TFLOP	12.3 TFLOP	8.2 TFLOP	5.7 TFLOP
Calcul FP64	À déterminer	À déterminer	47,9 TFLOP	45.3 TFLOP	22.6 TFLOP	11.5 TFLOP	7.4 TFLOP	6.6 TFLOP	768 GFLOP	512 GFLOP	384 GFLOP
VRAM	À déterminer	192 Go HBM3	128 Go HBM2e	128 Go HBM2e	64 Go HBM2e	32 Go HBM2	32 Go HBM2	16 Go HBM2	16 Go HBM2	4 Go HBM1	16 Go GDDR5
Horloge mémoire	À déterminer	5,2 Gbit/s	3,2 Gbit/s	3,2 Gbit/s	3,2 Gbit/s	1200 MHz	1 000 MHz	1 000 MHz	945 MHz	500 MHz	1 750 MHz
Bus mémoire	À déterminer	8192 bits	8192 bits	8192 bits	4096 bits	Bus 4096 bits	Bus 4096 bits	Bus 4096 bits	Bus 2048 bits	Bus 4096 bits	Bus 256 bits
Bande passante mémoire	À déterminer	5,2 To/s	3,2 To/s	3,2 To/s	1,6 To/s	1,23 To/s	1 To/s	1 To/s	484 Go/s	512 Go/s	224 Go/s
Facteur de forme	À déterminer	OAM	OAM	OAM	Carte à double emplacement	Double fente, pleine longueur	Double fente, pleine longueur	Double fente, pleine longueur	Double fente, pleine longueur	Double fente, demi-longueur	Emplacement unique, pleine longueur
Refroidissement	À déterminer	Refroidissement passif	Refroidissement passif	Refroidissement passif	Refroidissement passif	Refroidissement passif	Refroidissement passif	Refroidissement passif	Refroidissement passif	Refroidissement passif	Refroidissement passif
TDP (maximum)	À déterminer	750W	560W	500W	300W	300W	300W	300W	300W	175W	150W

AMD Instinct MI300X est conçu pour les charges de travail d’IA accélérées par GPU tandis que le MI300A s’attaque au HPC avec le package APU le plus avancé techniquement

AMD Instinct MI300X – Défier la suprématie de l’IA de NVIDIA avec CDNA 3 et une mémoire énorme

AMD Instinct MI300A – Les APU exascale densément emballés sont désormais une réalité

Accélérateurs AMD Radeon Instinct

Laisser un commentaire Annuler la réponse