OpenAI et Broadcom lancent la puce 'Jalapeño' pour les LLM

4 min de lecture · The Decoder · Maximilian Schreiner · 24/06/2026 IA générative 9/10 Élevé

OpenAI et Broadcom ont annoncé 'Jalapeño', une puce accélératrice conçue pour l'inférence des LLM, avec un déploiement prévu fin 2026. Les tests initiaux montrent une performance par watt supérieure aux solutions actuelles. Microsoft s'est engagé à acheter 40% des puces pour la première phase.

« OpenAI says Jalapeño isn't a modified general-purpose chip. It was designed from scratch for modern LLM inference. » — The Decoder

Que faut-il retenir ?

La puce 'Jalapeño' est conçue spécifiquement pour l'inférence des LLM.
Le déploiement à grande échelle est prévu pour fin 2026.
Microsoft a garanti l'achat de 40% des puces pour la première phase.
Le développement de la puce a pris seulement neuf mois.

Pourquoi cette nouvelle compte-t-elle ?

Cette puce spécialisée pourrait révolutionner l'inférence des LLM en offrant des performances supérieures et des coûts réduits. Les entreprises utilisant des LLM pourraient bénéficier de gains significatifs en efficacité. Cela marque aussi l'entrée d'OpenAI dans le hardware, consolidant sa position dans l'écosystème IA.

Microsoft garantit l'achat de 40% des puces pour la première phase.

💬 Hock Tan, PDG de Broadcom

Public concerné : entreprises, développeurs

Quels sont les avantages de la puce 'Jalapeño' pour les LLM ?

La puce 'Jalapeño' est conçue spécifiquement pour l'inférence des LLM, offrant une meilleure performance par watt et réduisant les coûts. Son architecture optimise le mouvement des données et l'utilisation des ressources.

Voir l'article original → Lire en français

← Retour aux actualités

Accueil

Outils

Annuaire

Apprendre