
DeepX (PDG Nok-won Kim), une société spécialisée dans les semi-conducteurs IA sur appareil, a annoncé le 13 avoir signé un accord de processus avec Samsung Foundry et Gaonchips pour le développement du semi-conducteur IA génératif de nouvelle génération « DX-M2 » basé sur un processus de 2 nanomètres (nm).
Grâce à cet accord, DeepX entamera le développement à grande échelle du DX-M2, un semi-conducteur d'inférence embarqué ultra-basse consommation doté de capacités d'IA générative. DeepX deviendra un client commercial du procédé 2 nm de Samsung Foundry, et la production de prototypes MPW (Multi Project Wafer) est prévue pour le premier semestre 2026, la production en série étant prévue pour 2027.
DeepX souligne que son procédé 2 nm basé sur la technologie Gate-All-Around (GAA) affiche une efficacité (consommation d'énergie par rapport aux performances) environ deux fois supérieure à celle du procédé 5 nm utilisé dans le DX-M1 actuel. Les modèles d'IA générative nécessitent un volume de calcul important, et leur exploitation dans un environnement embarqué avec des contraintes énergétiques et thermiques importantes est considérée comme un défi technique.
DeepX a mené une analyse complète de l'efficacité énergétique, du coût de fabrication et du rendement basé sur le processus 2 nm de Samsung Foundry depuis fin 2023, et a décidé de poursuivre le développement du DX-M2 après avoir déterminé qu'il peut répondre aux conditions de performance requises pour l'IA générative pour une utilisation sur appareil.
Le DX-M2 est conçu pour effectuer des inférences en temps réel sur des modèles d'IA génératifs comportant environ 20 milliards de paramètres, à une vitesse maximale de 20 à 30 jetons par seconde (TPS), tout en consommant moins de 5 W. Cela permettra l'exécution autonome de modèles d'IA de niveau expert, même sur des appareils aux capacités de traitement limitées, tels que les robots, les appareils électroménagers et les ordinateurs portables.
Grâce à ce produit, DeepX vise à réaliser des performances quasi-AGI de classe 100B sur l'appareil en exécutant des modèles d'IA génératifs de classe 20B tels que « DeepSeek » et « LLaMA 4 » avec la structure MOE (Mixture of Experts).
À cet égard, DeepX a commencé à concevoir un nouveau processeur d'IA générative début 2024 et a désormais achevé le développement d'un premier prototype. DeepX vise à lancer un semi-conducteur d'IA offrant des performances de calcul, une intelligence et une efficacité énergétique supérieures à celles de ses concurrents mondiaux.
Le PDG de DeepX, Kim Nok-won, a déclaré : « Le DX-M2 est un produit qui réalise la possibilité d'une mise en œuvre sur appareil de l'IA générative » et « DeepX continuera d'accélérer la popularisation et l'industrialisation de l'IA grâce à une technologie de semi-conducteurs IA haute performance et haute efficacité. »
- Voir plus d'articles connexes
You must be logged in to post a comment.