Détails des accélérateurs IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans une merveille d’emballage avancée

Détails des accélérateurs IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans une merveille d’emballage avancée

Les AMD Instinct MI300X et MI300A font partie des accélérateurs les plus attendus du segment de l’IA et seront lancés le mois prochain. Il y a beaucoup d’attente autour du premier chef-d’œuvre d’IA à part entière d’AMD et aujourd’hui, nous avons pensé à vous donner un aperçu de ce que vous pouvez attendre de cette merveille technique.

AMD Instinct MI300X est conçu pour les charges de travail d’IA accélérées par GPU tandis que le MI300A s’attaque au HPC avec le package APU le plus avancé techniquement

Le 6 décembre, AMD organisera son discours d’ouverture « Advancing AI » , dont l’un des principaux objectifs est de dévoiler complètement la famille d’accélérateurs Instinct de nouvelle génération, nommée MI300. Cette nouvelle famille accélérée par GPU et CPU sera le produit phare du segment IA qui est le n°1 d’AMD et la priorité stratégique la plus importante à l’heure actuelle, car elle déploie enfin un produit non seulement avancé, mais également conçu pour répondre aux exigences critiques. Exigence en matière d’IA au sein de l’industrie. La classe MI300 d’accélérateurs d’IA sera une autre centrale de chipsets, utilisant les technologies d’emballage avancées de TSMC. Voyons donc ce qui se cache sous le capot de ces monstres d’IA.

AMD Instinct MI300X – Défier la suprématie de l’IA de NVIDIA avec CDNA 3 et une mémoire énorme

L’AMD Instinct MI300X est certainement la puce qui sera le plus mise en avant puisqu’elle est clairement destinée aux accélérateurs Hopper de NVIDIA et Gaudi d’Intel au sein du segment de l’IA. Cette puce a été conçue uniquement sur l’architecture CDNA 3 et il se passe beaucoup de choses. La puce va héberger un mélange d’IP de 5 nm et de 6 nm, tous combinés pour fournir jusqu’à 153 milliards de transistors (MI300X).

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 2
Accélérateur AMD Instinct MI300X.

Dès la conception, l’interposeur principal est doté d’une puce passive qui abrite la couche d’interconnexion à l’aide d’une solution Infinity Fabric de nouvelle génération. L’interposeur comprend un total de 28 puces, dont huit packages HBM3, 16 puces factices entre les packages HBM et quatre puces actives, et chacune de ces puces actives reçoit deux puces de calcul.

Chaque GCD basé sur l’architecture GPU CDNA 3 comprend un total de 40 unités de calcul, ce qui équivaut à 2 560 cœurs. Il y a huit matrices de calcul (GCD) au total, ce qui nous donne un total de 320 unités de calcul et 20 480 unités de base. Pour les rendements, AMD réduira une petite partie de ces cœurs et nous obtiendrons plus de détails sur les configurations exactes dans un mois.

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 4
Accélérateur AMD Instinct MI300X avec matrices CDNA 3.

La mémoire est un autre domaine dans lequel vous constaterez une énorme mise à niveau avec le MI300X offrant une capacité HBM3 50 % supérieure à celle de son prédécesseur, le MI250X (128 Go). Pour atteindre un pool de mémoire de 192 Go, AMD équipe le MI300X de 8 piles HBM3 et chaque pile est de 12-Hi tout en intégrant des circuits intégrés de 16 Go, ce qui nous donne une capacité de 2 Go par circuit intégré ou 24 Go par pile. La mémoire offrira jusqu’à 5,2 To/s de bande passante et 896 Go/s de bande passante Infinity Fabric. À titre de comparaison, le prochain accélérateur H200 AI de NVIDIA offre des capacités de 141 Go, tandis que Gaudi 3 d’Intel offrira des capacités de 144 Go. Les grands pools de mémoire sont très importants dans les LLM qui sont pour la plupart liés à la mémoire et AMD peut certainement montrer ses prouesses en matière d’IA en étant leader dans le département de mémoire.

232328650_instinct_mi300a_exploded_view_01-custom232328650_instinct_mi300x_exploded_view_01-personnalisé232328650_instinct_mi300a_exploded_view_02-custom232328650_instinct_mi300x_exploded_view_02-personnalisé232328650_instinct_mi300a_cross_section_angle_01-custom232328650_instinct_mi300x_cross_section_angle_01-personnalisé232328650_instinct_mi300a_exploded_view_03-custom232328650_instinct_mi300x_exploded_view_03-personnalisé

En termes de consommation d’énergie, l’AMD Instinct MI300X est évalué à 750 W, soit une augmentation de 50 % par rapport aux 500 W de l’Instinct MI250X et 50 W de plus que le NVIDIA H200.

AMD Instinct MI300A – Les APU exascale densément emballés sont désormais une réalité

Nous attendons depuis des années qu’AMD tienne enfin la promesse d’un APU de classe Exascale et le jour approche à mesure que nous nous rapprochons du lancement de l’Instinct MI300A. Le packaging du MI300A est très similaire à celui du MI300X, sauf qu’il utilise des capacités de mémoire optimisées pour le TCO et des cœurs Zen 4.

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 3
Accélérateur AMD Instinct MI300A.

L’une des matrices actives comporte deux GCD CDNA 3 découpés et remplacés par trois CCD Zen 4 qui offrent leur propre pool séparé de cache et d’adresses IP principales. Vous obtenez 8 cœurs et 16 threads par CCD, soit un total de 24 cœurs et 48 threads sur la puce active. Il existe également 24 Mo de cache L2 (1 Mo par cœur) et un pool de cache séparé (32 Mo par CCD). Il faut rappeler que les GCD CDNA 3 ont également le cache L2 séparé.

Détails des accélérateurs d'IA AMD Instinct MI300X et MI300A : CDNA 3 et Zen 4 réunis dans un packaging avancé Marvel 5
Accélérateur AMD Instinct MI300A avec matrices CDNA 3 et Zen 4.

Pour résumer certaines des fonctionnalités mises en avant des accélérateurs AMD Instinct MI300, nous avons :

  • Premier package CPU + GPU intégré
  • Viser le marché des supercalculateurs exascale
  • AMD MI300A (CPU + GPU intégrés)
  • AMD MI300X (GPU uniquement)
  • 153 milliards de transistors
  • Jusqu’à 24 cœurs Zen 4
  • Architecture GPU CDNA3
  • Jusqu’à 192 Go de mémoire HBM3
  • Jusqu’à 8 chipsets + 8 piles de mémoire (processus 5 nm + 6 nm)

En réunissant tous ces éléments, AMD travaillera avec ses facilitateurs et partenaires de l’écosystème pour proposer des accélérateurs d’IA MI300 dans des configurations à 8 voies comportant des conceptions SXM qui se connectent à la carte mère avec des connecteurs mezzanine. Il sera intéressant de voir dans quels types de configurations elles seront proposées et bien que les cartes SXM soient une évidence, nous pouvons également nous attendre à quelques variantes dans les facteurs de forme PCI-E.

amd-instinct-mi300-ai-accélérateurs-serveurs-_2amd-instinct-mi300-ai-accélérateurs-serveurs-_1amd-instinct-mi300-ai-accélérateurs-serveurs-_4amd-instinct-mi300-ai-accélérateurs-serveurs-_5amd-instinct-mi300-ai-accélérateurs-serveurs-_3

Pour l’instant, AMD devrait savoir que ses concurrents se lancent également à toute vapeur dans l’engouement pour l’IA, NVIDIA annonçant déjà des chiffres énormes pour ses GPU Blackwell 2024 et Intel préparant également ses GPU Guadi 3 et Falcon Shores pour le lancement dans les années à venir. Une chose est sûre à l’heure actuelle, les clients de l’IA engloutiront presque tout ce qu’ils peuvent obtenir et tout le monde en profitera. Mais AMD dispose d’une solution très redoutable qui ne vise pas seulement à être une alternative à NVIDIA mais aussi un leader dans le segment de l’IA et nous espérons que le MI300 pourra les aider à atteindre ce succès.

Accélérateurs AMD Radeon Instinct

Nom de l’accélérateur AMD Instinct MI400 AMD Instinct MI300 AMD Instinct MI250X AMD Instinct MI250 AMD Instinct MI210 AMD Instinct MI100 AMD Radeon Instinct MI60 AMD Radeon Instinct MI50 AMD Radeon Instinct MI25 AMD Radeon Instinct MI8 AMD Radeon Instinct MI6
Architecture du processeur Zen 5 (APU exascale) Zen 4 (APU Exascale) N / A N / A N / A N / A N / A N / A N / A N / A N / A
Architecture GPU ADNC 4 Aqua Vanjaram (ADNC 3) Aldébaran (ADNC 2) Aldébaran (ADNC 2) Aldébaran (ADNC 2) Arcturus (ADNC 1) Véga 20 Véga 20 Véga 10 Fidji XT Polaris10
Nœud de processus GPU 4 nm 5nm+6nm 6 nm 6 nm 6 nm FinFET 7 nm FinFET 7 nm FinFET 7 nm FinFET 14 nm 28 nm FinFET 14 nm
Chiplets GPU À déterminer 8 (CMM) 2 (MCM)
1 (par dé)
2 (MCM)
1 (par dé)
2 (MCM)
1 (par dé)
1 (Monolithique) 1 (Monolithique) 1 (Monolithique) 1 (Monolithique) 1 (Monolithique) 1 (Monolithique)
Cœurs GPU À déterminer Jusqu’à 19 456 14 080 13 312 6656 7680 4096 3840 4096 4096 2304
Vitesse d’horloge du GPU À déterminer À déterminer 1 700 MHz 1 700 MHz 1 700 MHz 1 500 MHz 1 800 MHz 1725 MHz 1 500 MHz 1 000 MHz 1237 MHz
Calcul FP16 À déterminer À déterminer 383 HAUTS 362 HAUTS 181 HAUTS 185 TFLOP 29,5 TFLOP 26,5 TFLOP 24.6 TFLOP 8.2 TFLOP 5.7 TFLOP
Calcul FP32 À déterminer À déterminer 95,7 TFLOP 90,5 TFLOP 45.3 TFLOP 23.1 TFLOP 14.7 TFLOP 13.3 TFLOP 12.3 TFLOP 8.2 TFLOP 5.7 TFLOP
Calcul FP64 À déterminer À déterminer 47,9 TFLOP 45.3 TFLOP 22.6 TFLOP 11.5 TFLOP 7.4 TFLOP 6.6 TFLOP 768 GFLOP 512 GFLOP 384 GFLOP
VRAM À déterminer 192 Go HBM3 128 Go HBM2e 128 Go HBM2e 64 Go HBM2e 32 Go HBM2 32 Go HBM2 16 Go HBM2 16 Go HBM2 4 Go HBM1 16 Go GDDR5
Horloge mémoire À déterminer 5,2 Gbit/s 3,2 Gbit/s 3,2 Gbit/s 3,2 Gbit/s 1200 MHz 1 000 MHz 1 000 MHz 945 MHz 500 MHz 1 750 MHz
Bus mémoire À déterminer 8192 bits 8192 bits 8192 bits 4096 bits Bus 4096 bits Bus 4096 bits Bus 4096 bits Bus 2048 bits Bus 4096 bits Bus 256 bits
Bande passante mémoire À déterminer 5,2 To/s 3,2 To/s 3,2 To/s 1,6 To/s 1,23 To/s 1 To/s 1 To/s 484 Go/s 512 Go/s 224 Go/s
Facteur de forme À déterminer OAM OAM OAM Carte à double emplacement Double fente, pleine longueur Double fente, pleine longueur Double fente, pleine longueur Double fente, pleine longueur Double fente, demi-longueur Emplacement unique, pleine longueur
Refroidissement À déterminer Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif Refroidissement passif
TDP (maximum) À déterminer 750W 560W 500W 300W 300W 300W 300W 300W 175W 150W

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *