OpenAI et Broadcom lancent la puce 'Jalapeño' pour les LLM
OpenAI et Broadcom ont annoncé 'Jalapeño', une puce accélératrice conçue pour l'inférence des LLM, avec un déploiement prévu fin 2026. Les tests initiaux montrent une performance par watt supérieure aux solutions actuelles. Microsoft s'est engagé à acheter 40% des puces pour la première phase.
« OpenAI says Jalapeño isn't a modified general-purpose chip. It was designed from scratch for modern LLM inference. » — The Decoder
Que faut-il retenir ?
- La puce 'Jalapeño' est conçue spécifiquement pour l'inférence des LLM.
- Le déploiement à grande échelle est prévu pour fin 2026.
- Microsoft a garanti l'achat de 40% des puces pour la première phase.
- Le développement de la puce a pris seulement neuf mois.
Pourquoi cette nouvelle compte-t-elle ?
Cette puce spécialisée pourrait révolutionner l'inférence des LLM en offrant des performances supérieures et des coûts réduits. Les entreprises utilisant des LLM pourraient bénéficier de gains significatifs en efficacité. Cela marque aussi l'entrée d'OpenAI dans le hardware, consolidant sa position dans l'écosystème IA.
Microsoft garantit l'achat de 40% des puces pour la première phase.
💬 Hock Tan, PDG de Broadcom
Public concerné : entreprises, développeurs