Table of Contents
Huawei a officiellement dévoilé son cluster d’IA CloudMatrix 384 lors de la World AI Conference qui s’est tenue à Shanghai. Annoncé en avril dernier, ce système est présenté comme un concurrent sérieux au GB200 NVL72 de Nvidia, bien qu’il soit réputé pour sa forte consommation énergétique.
Caractéristiques techniques du CloudMatrix 384
Le CloudMatrix 384 est équipé de 384 GPU Ascend 910C, offrant une densité de calcul impressionnante avec une précision de calcul BF16 atteignant 300 Pflops, soit 1,7 fois plus que le modèle GB200 NVL72 de Nvidia. Selon Semianalysis, Huawei dispose d’une capacité de mémoire agrégée plus de 3,6 fois supérieure à celle de son concurrent, ainsi qu’une bande passante mémoire 2,1 fois plus importante.
Cependant, cette innovation a un coût : le CloudMatrix 384 consomme 4,1 fois plus d’énergie que le GB200 NVL72, avec des performances par Flop et par bande passante mémoire inférieures.
Architecture et interconnexion
La plateforme CloudMatrix 384 est organisée sur 16 racks, dont 12 dédiés au calcul, chacun comprenant 32 GPU, entourés de 4 armoires de commutateurs. L’interconnexion est gérée par un réseau UB (Unified Bus) à très haut débit, permettant une communication efficace entre tous les nœuds et un regroupement dynamique des ressources. Cette structure optimise les performances pour des opérations intensives en communication, comme le parallélisme entre les mélanges d’experts (MoE) à grande échelle.
Réponse aux restrictions américaines
Face aux restrictions américaines sur l’exportation des GPU les plus performants, Huawei voit une opportunité de se démarquer sur le marché chinois. Ren Zhengfei, CEO de Huawei, souligne que bien que les accélérateurs Ascend soient moins puissants que ceux de Nvidia, l’optimisation mathématique et le calcul en grappe peuvent compenser cette différence pour les charges de travail réelles.
Chaque année, Huawei investit environ 25 milliards d’euros dans la recherche et le développement, ce qui témoigne de son engagement à innover rapidement dans le domaine de l’IA.
Alliances industrielles pour l’IA
Lors de la WAIC, plusieurs fournisseurs chinois ont formé deux alliances industrielles visant à promouvoir un écosystème national d’IA. La première, Model-Chip Ecosystem Innovation Alliance, regroupe des acteurs comme Huawei et a pour objectif de relier l’ensemble de la chaîne technologique, des puces aux modèles. La seconde alliance, le Shanghai General Chamber of Commerce AI Committee, vise à intégrer profondément les technologies d’intelligence artificielle dans l’industrie.