Comment les processeurs ‘Wafer-Scale’ pourraient révolutionner le calcul intensif

Comment les processeurs ‘Wafer-Scale’ pourraient révolutionner le calcul intensif
Au fil des années, les processeurs deviennent plus rapides grâce à des composants de plus en plus petits. Mais alors que nous nous rapprochons des limites de ce que les petites chaînes peuvent faire, où allons-nous ? Une solution consiste à faire en sorte que vos puces aient la taille d’une plaquette.

Qu’est-ce que « l’échelle de gaufre » ?

Les dispositifs à circuits intégrés, tels que les processeurs, sont fabriqués à partir de puces en silicium. Pour créer l’appareil, un énorme cristal de silicium cylindrique est découpé en tranches circulaires. Ensuite, plusieurs puces sont gravées sur la surface de la tranche. Une fois que les puces sont prêtes, elles sont vérifiées pour trouver des blocs défectueux et elles sont marquées.

Les puces de travail sont découpées dans la plaquette et conditionnées en tant que produit fini destiné à la vente. « Sortie » est le nombre de puces de travail que vous obtenez de la plaquette. Toute partie de la plaquette qui est perdue en raison de puces défectueuses ou parce qu’il s’agit de ferraille doit être remplacée par de l’argent généré par des puces de travail.

Une puce à l’échelle d’une tranche utilise toute la tranche pour un seul processeur. Cela semble être une excellente idée, mais il y avait quelques problèmes majeurs.

Les chips à l’échelle des gaufres semblaient impossibles

Au fil des ans, il y a eu plusieurs tentatives pour « intégrer » une plaquette de silicium entière. Le problème est que le processus de fabrication des puces n’est pas parfait. Il y a forcément des défauts sur toute plaque finie.

Si vous imprimez plusieurs copies de la même puce sur une plaquette, quelques puces cassées ne sont pas la fin du monde. Cependant, un processeur doit être sans défaut pour fonctionner. Donc, si vous essayez d’intégrer la totalité de la tranche, ces inconvénients inévitables rendront toute la puce géante inutile.

Pour contourner ce problème, les ingénieurs ont dû repenser la façon de concevoir un processeur massif qui devrait fonctionner comme un tout. Jusqu’à présent, une seule entreprise a réussi à créer un processeur fonctionnel à l’échelle d’une plaquette, et elle a dû résoudre de sérieux problèmes techniques pour y parvenir.

Cerebra WSE-2

cerveau

Wafer-Scale Engine 2 de Cerebras Systems est une puce absolument massive. Il utilise un processus 7 nm similaire aux puces 7 nm et 5 nm utilisées dans divers appareils tels que les smartphones, les ordinateurs portables et les ordinateurs de bureau.

WSE-2 est conçu comme un réseau de cœurs connectés les uns aux autres par un réseau massif de connexions à haut débit. Ce réseau de modules de cœur de processeur peut communiquer même si certains des cœurs sont défaillants. Le WSE est conçu pour avoir plus de cœurs qu’annoncé pour correspondre à la sortie attendue de chaque plaquette. Cela signifie que bien qu’il y ait des défauts sur chaque puce, ils n’affectent en rien les performances calculées.

WSE-2 est conçu spécifiquement pour accélérer les applications d’IA à l’aide d’une technique d’apprentissage automatique appelée « apprentissage en profondeur ». Comparé aux superordinateurs modernes utilisés pour les tâches d’apprentissage en profondeur, WSE-2 est plus rapide de plusieurs ordres de grandeur tout en consommant moins d’énergie.

Avantages des processeurs à l’échelle des tranches

cerveau

Les processeurs à l’échelle de la tranche résolvent de nombreux problèmes de conception de supercalculateurs modernes. Les superordinateurs sont constitués de nombreux ordinateurs plus petits et plus simples connectés à un réseau. En concevant soigneusement les tâches pour ce type de conception, toute cette puissance de calcul peut être combinée.

Cependant, chaque ordinateur de cette gamme de supercalculateurs a besoin de ses propres composants de support, et la distance accrue entre les nombreux packages de CPU individuels sur ce réseau crée de nombreux problèmes de performances et limite les types de charges de travail pouvant être exécutées en temps réel.

Un processeur de la taille d’une tranche intègre efficacement la puissance de traitement de dizaines ou de centaines d’ordinateurs dans un seul circuit intégré, contrôlé par une seule alimentation, le tout logé dans un seul châssis. De plus, vous pouvez toujours mettre en réseau plusieurs ordinateurs de la taille d’une tranche pour créer un superordinateur traditionnel, mais à une vitesse exponentielle.

Des processeurs à l’échelle des tranches pour le reste ?

Il est peu probable que nous obtenions un produit à l’échelle d’une plaquette pour les utilisateurs grand public qui n’essaient pas de construire un supercalculateur, mais il existe également des éléments de la philosophie « plus c’est gros, mieux c’est » dans l’électronique grand public.

Un bon exemple est le M1 Ultra System-on-a-Chip (SoC) d’Apple, qui est constitué de deux SoC M1 Max connectés par une interconnexion haut débit pour former un système unique avec deux fois plus de ressources.

Les conceptions de CPU AMD tirent également parti des « chiplets », qui sont des blocs d’un cœur de processeur qui peuvent être fabriqués indépendamment puis «collés» ensemble à l’aide d’un autre type d’interconnexion à grande vitesse. Maintenant que les circuits sur les processeurs ont cessé de rétrécir, il est temps de les construire, et peut-être même plus, avec des circuits 3D complexes plutôt que les circuits 2D plus courants que nous utilisons aujourd’hui.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *