El chip de IA más rápido del mundo tiene 4 billones de transistores y 900 núcleos de IA

Cerebras Systems ha lanzado Wafer Scale Engine 3 (WSE-3), el chip de IA más rápido del mundo con 4 billones de transistores y 900 núcleos de IA. El WSE-000, construido sobre un proceso de 3 nm, impulsa la supercomputadora de IA Cerebras CS-5, que es capaz de alcanzar un rendimiento de IA de 3 petaflops. Este nuevo chip está diseñado para entrenar de manera eficiente grandes modelos de IA, admitiendo modelos con hasta 125 billones de parámetros sin necesidad de particiones, simplificando el proceso de entrenamiento.

Este chip de IA es una verdadera potencia, con 4 billones de transistores y 000 núcleos de IA. Este es el corazón de la supercomputadora de IA Cerebras CS-900, que ofrece la asombrosa cifra de 000 petaflops de rendimiento máximo de IA. Se espera que este chip transforme la forma en que se entrenan los grandes modelos de IA, manejando fácilmente hasta 3 billones de parámetros. EL Motor de escala de obleas (WSE-3) detroisième Generacion en5nm equipa las supercomputadoras de IA más escalables de la industria, a 256 exaFLOP a través de 2048 nodos.

« Cuando nos embarcamos en esta aventura hay huit años, todos dijeron eso los procesadores en la escala del plaquette eran una quimera. Nosotros no pudo ser masorgulloso de presentamos la tercera generación de nuestra chip de inteligencia artificial revolucionario aescala de agua  » ,dijo Andrew Feldman, director ejecutivo y cofundador de Cerebras. WSE-3 es el chip AI más rápido del mundo, diseñado para los Derniers La IA funciona depunchline , du mezcla experta o a las modelos à 24 mil millones configuraciones. Estamos entusiasmados de lanzar al mercado WSE-3 y CS-3 para ayudar a resolver los mayores desafíos de la IA actual. »

El WSE-3 está construido con tecnología de punta de 5 nm, que permitió la integración de 44 GB de SRAM en el chip. Pero eso no es todo: es posible ampliar la memoria externa del chip hasta 1,2 petabytes. Esto permite procesar sin problemas incluso tareas que requieren una gran cantidad de datos. El diseño del chip es altamente escalable y puede conectar hasta 2048 sistemas CS-3. Esto lo hace versátil para una variedad de usos, desde empresas hasta entornos de TI a gran escala.

Cerebras presenta el chip de IA más rápido del mundo

Cerebras no sólo se centró en el rendimiento bruto, sino que también se aseguró de que su tecnología fuera fácil de usar. El marco de software de Cerebras ahora es compatible con PyTorch 2.0, que simplifica la programación de modelos de lenguajes grandes (LLM). Por lo tanto, los desarrolladores pueden hacer más con menos código, reduciendo la complejidad y acelerando el desarrollo de nuevas aplicaciones. WSE-3 también introduce aceleración de hardware para escasez dinámica y no estructurada, lo que podría hacer que los tiempos de entrenamiento sean hasta ocho veces más rápidos.

Especificaciones

  • 4 billones de transistores
  • 900 núcleos de IA
  • 125 petaflops de rendimiento máximo de IA
  • 44 GB de SRAMen el chip
  • Proceso TSMC de 5nm
  • Memoria externa: 1,5 TB, 12 TB ou 1,2 po
  • Entrene modelos de IA con hasta 24 billones de parámetros
  • Tamaño del clúster: hasta 2048 sistemas CS-3

En el mundo de la informática, la eficiencia energética es crucial. Sorprendentemente, el WSE-3 ha duplicado el rendimiento de su predecesor manteniendo el mismo consumo de energía. Esto es fundamental porque significa que podemos seguir superando los límites de la IA sin sobrecargar nuestros presupuestos energéticos.

El impacto de WSE-3 y la supercomputadora de IA CS-3 ya se está sintiendo en diferentes sectores. Cerebras tiene una importante cartera de pedidos de sectores como el empresarial, el gubernamental y el de servicios internacionales de computación en la nube. La tecnología desempeña un papel clave en asociaciones con instituciones líderes como el Laboratorio Nacional Argonne y la Clínica Mayo, contribuyendo a la investigación de la IA y a la mejora de la atención al paciente.

En el futuro, Cerebras planea colaborar con G42 para construir algunas de las supercomputadoras de inteligencia artificial más grandes del mundo. Se espera que uno de los proyectos en curso, el Condor Galaxy 3, proporcione un increíble cálculo de IA de 8 exaFLOP, lo que demuestra el inmenso potencial de WSE-3.

Wafer Scale Engine 3 de Cerebras representa un avance importante en la tecnología de inteligencia artificial. Con su potencia informática, escalabilidad y rendimiento energético inigualables, así como el soporte de un marco de software avanzado, es una herramienta indispensable para cualquiera que busque aprovechar todo el poder de la IA. A medida que Cerebras continúa superando los límites, el futuro del desarrollo y la aplicación de la IA parece más brillante que nunca.

Leer más Guía:

Etiquetas:

Dejar un comentario

Su dirección de correo electrónico no será publicada. Los campos necesarios están marcados con *