面壁智能发布全球首个AI自主编写的生产级预训练框架ForgeTrain
面壁智能宣布全球首个由AI完全自主编写的生产级大模型预训练框架ForgeTrain诞生,并用其成功训练出MiniCPM5-1B端侧模型。ForgeTrain性能超越英伟达Megatron,在相同硬件下训练速度提升10%,并在华为昇腾平台上实现10%加速。MiniCPM5-1B仅1B参数,在AA-Index上超越所有2B以下模型,支持131K长上下文和混合推理,可部署于手机到服务器多种设备。面壁智能提出Forge Engineering新范式,通过AI为不同模型、硬件和任务定制专用代码,将数周的人工代码开发压缩至数十分钟。相关模型与框架已全面开源,标志着"AI制造AI"从概念进入可复现工程阶段。
阅读原文