La puce d’intelligence artificielle la plus rapide du monde compte 4 billions de transistors et 900 000 cœurs d’intelligence artificielle

Cerebras Systems a lancé le Wafer Scale Engine 3 (WSE-3), la puce d’intelligence artificielle la plus rapide au monde, dotée de 4 billions de transistors et de 900 000 cœurs d’intelligence artificielle. Le WSE-3, construit sur un processus de 5 nm, alimente le supercalculateur d’IA Cerebras CS-3, qui est capable d’atteindre des performances d’IA de 125 pétaflops. Cette nouvelle puce est conçue pour entraîner efficacement de grands modèles d’IA, prenant en charge des modèles allant jusqu’à 24 billions de paramètres sans qu’il soit nécessaire de les partitionner, ce qui simplifie le processus d’entraînement.

Cette puce d’IA est une véritable centrale électrique, dotée de 4 000 milliards de transistors et de 900 000 cœurs d’IA. C’est le cœur du superordinateur d’IA Cerebras CS-3, qui offre une performance d’IA de pointe étonnante de 125 pétaflops. Cette puce devrait transformer la façon dont les grands modèles d’IA sont formés, en gérant facilement jusqu’à 24 billions de paramètres. Le Wafer Scale Engine (WSE-3) detroisième génération en5nm équipe les superordinateurs d’IA les plus évolutifs de l’industrie, jusqu’à 256 exaFLOPs via 2048 nœuds.

« Lorsque nous nous sommes lancés dans cette aventure il y a huit ans, tout le monde disait que les processeurs à l’échelle de la plaquette étaient une chimère. Nous ne pourrions être plusfiers de présenter la troisième génération de notre puce d’IA révolutionnaire à l’échelle de l’eau  » ,a déclaré Andrew Feldman, PDG et cofondateur de Cerebras. WSE-3 est la puce d’IA la plus rapide au monde, conçue pour les derniers travaux d’IA depointe , du mélange d’experts aux modèles à 24 billions de paramètres. Nous sommes ravis de commercialiser le WSE-3 et le CS-3 pour aider à résoudre les plus grands défis de l’IA d’aujourd’hui. »

Le WSE-3 est construit à l’aide d’une technologie de pointe de 5 nm, qui a permis l’intégration de 44 Go de SRAM sur la puce. Mais ce n’est pas tout : il est possible d’étendre la mémoire externe de la puce jusqu’à 1,2 pétaoctet. Cela signifie que même les tâches nécessitant un grand nombre de données peuvent être traitées sans problème. La conception de la puce est hautement évolutive et permet de connecter jusqu’à 2048 systèmes CS-3. Cela la rend polyvalente pour diverses utilisations, des entreprises aux environnements informatiques à grande échelle.

Cerebras dévoile la puce d’IA la plus rapide au monde

Cerebras ne s’est pas contenté de se concentrer sur les performances brutes, il a également veillé à ce que sa technologie soit conviviale. Le cadre logiciel de Cerebras prend désormais en charge PyTorch 2.0, qui simplifie la programmation des grands modèles de langage (LLM). Les développeurs peuvent donc faire plus avec moins de code, ce qui réduit la complexité et accélère le développement de nouvelles applications. Le WSE-3 introduit également l’accélération matérielle pour la sparsité dynamique et non structurée, ce qui pourrait potentiellement rendre les temps d’apprentissage jusqu’à huit fois plus rapides.

Caractéristiques

  • 4 billions de transistors
  • 900 000 cœurs d’IA
  • 125 pétaflops de performances IA maximales
  • 44 Go de SRAMsur la puce
  • Processus TSMC 5 nm
  • Mémoire externe: 1,5 To, 12 To ou 1,2 Po
  • Entraînement des modèles d’IA jusqu’à 24 billions de paramètres
  • Taille des clusters : jusqu’à 2048 systèmes CS-3

Dans le monde de l’informatique, l’efficacité énergétique est cruciale. Il est impressionnant de constater que le WSE-3 a doublé les performances de son prédécesseur tout en conservant la même consommation d’énergie. C’est essentiel, car cela signifie que nous pouvons continuer à repousser les limites de l’IA sans grever nos budgets énergétiques.

L’impact du WSE-3 et du supercalculateur d’IA CS-3 se fait déjà sentir dans différents secteurs. Cerebras dispose d’un important carnet de commandes provenant de secteurs tels que les entreprises, les gouvernements et les services d’informatique en nuage internationaux. La technologie joue un rôle clé dans les partenariats avec des institutions de premier plan telles que l’Argonne National Laboratory et la Mayo Clinic, contribuant à la recherche sur l’IA et à l’amélioration des soins aux patients.

À l’avenir, Cerebras prévoit de collaborer avec G42 pour construire certains des plus grands superordinateurs d’IA au monde. L’un des projets en cours de réalisation, le Condor Galaxy 3, devrait fournir un incroyable calcul d’IA de 8 exaFLOPs, démontrant ainsi l’immense potentiel du WSE-3.

Le Wafer Scale Engine 3 de Cerebras constitue une avancée majeure dans la technologie de l’IA. Avec sa puissance de calcul inégalée, son évolutivité et ses performances énergétiques, ainsi que le soutien d’un cadre logiciel avancé, c’est un outil indispensable pour tous ceux qui cherchent à exploiter toute la puissance de l’IA. Alors que Cerebras continue à repousser les limites, l’avenir du développement et de l’application de l’IA semble plus prometteur que jamais.

Lire plus Guide:

Étiquettes :

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *