
专门从事设备上AI半导体的公司DeepX(代表:金鹿元)13日宣布,已与三星代工厂和Gaonchips签署了工艺协议,将开发基于2纳米(nm)工艺的下一代生成AI半导体“DX-M2”。
通过此次协议,DeepX 将全面开发 DX-M2,这是一款配备生成式 AI 功能的超低功耗设备推理半导体产品。DeepX 将成为三星代工厂 2nm 工艺的商业客户,用于原型生产的 MPW(多项目晶圆)计划于 2026 年上半年完成,并计划于 2027 年实现量产。
DeepX 指出,其基于全栅环绕 (GAA) 的 2nm 工艺的效率(单位性能功耗)约为现有 DX-M1 所用 5nm 工艺的两倍。生成式 AI 模型需要大量计算,在功率和散热受限的设备环境中运行这些模型一直被认为是一项技术挑战。
DeepX 自 2023 年底以来就基于三星代工厂的 2nm 工艺对功率效率、制造成本和产量进行了全面分析,并在确定其能够满足设备使用生成 AI 所需的性能条件后,决定继续开发 DX-M2。
DX-M2 旨在对约 200 亿个参数的生成式 AI 模型进行实时推理,最高速度可达每秒 20-30 个令牌 (TPS),同时功耗低于 5W。即使在机器人、家用电器和笔记本电脑等功率处理能力有限的设备上,也能自主执行专家级 AI 模型。
通过该产品,DeepX 旨在通过运行“DeepSeek”和“LLaMA 4”等 20B 级生成式 AI 模型以及 MOE(专家混合)结构,在设备上实现 100B 级准 AGI 性能。
为此,DeepX 于 2024 年初开始设计一款新型生成式 AI 处理器,目前已完成初始原型的开发。DeepX 的目标是推出一款计算性能、智能化程度和能效均优于全球竞争对手的 AI 半导体。
DeepX首席执行官Kim Nok-won表示,“DX-M2是一款实现了生成式AI在设备上实现可能性的产品”,“DeepX将继续通过高性能、高效的AI半导体技术,加速AI的普及和产业化。”
- 查看更多相关文章
You must be logged in to post a comment.