谷歌开源Gemma 4模型,AIME数学测试从20.8%飙升至89.2%
谷歌发布开源大模型Gemma 4系列,包含四个版本:31B Dense旗舰版(310亿参数,支持256K上下文)、26B A4B MoE(仅激活38亿参数)、以及面向边缘设备的E4B和E2B(内存占用低至1.5GB)。相比前代Gemma3-27B,性能大幅跃升:AIME2026数学测试从20.8%升至89.2%,Codeforces ELO从110升至2150,LiveCodeBench从29.1%升至80.0%,GPQA Diamond科学推理近翻倍至84.3%。模型原生支持140+语言、内置推理模式、智能体功能及多模态输入,并配套开源Agent开发工具包。
阅读原文