返回往期
2026年6月13日星期六
10 点要闻3 分钟阅读

今日要闻

1

MiniMax发布M3开源模型,4280亿参数支持100万token上下文

开源模型MiniMax

中国AI公司MiniMax于6月11日发布开源混合专家模型M3,总参数4280亿,每次推理激活230亿参数,原生支持文本、图像和视频输入。该模型采用自研稀疏注意力技术MSA,实现100万token上下文窗口,预填充速度提升9.7倍,解码速度提升15.6倍。在SWE-Bench Pro测试中得分59%,Terminal Bench 2.1得分66%,MCP Atlas得分74.2%。模型权重无门槛发布在Hugging Face,支持本地部署。API超过512K token后费率翻倍。NVIDIA Blackwell基础设施已提供部署支持。

阅读原文
2

智源发布全球首个通用世界基座模型,原生多模态Emu3.5开源

世界模型智源

北京智源研究院在2026年智源大会上发布两大世界模型「悟界·Physis-v0.1」和「悟界·RoboBrain Orca-v0」,前者采用「下一物理状态预测」范式,统一处理视频、RGB-D、3D点云、力触反馈等多模态信息,支持50多个物理场景推演。同时开源原生多模态世界模型Emu3.5,参数34B,基于Decoder-only Transformer架构,在超10万亿Token数据上预训练,集成扩散解码器支持2K分辨率重建。Emu3.5在多项基准测试中性能媲美或超越Gemini-2.5-Flash-Image,离散扩散适配技术使图像推理速度提升近20倍。

阅读原文
3

贝佐斯AI公司Prometheus完成120亿美元融资,估值410亿美元

融资物理AI

杰夫·贝佐斯与前Verily联合创始人Vik Bajaj共同创立的物理AI公司Prometheus于6月11日宣布完成120亿美元融资,估值达410亿美元。本轮由贝佐斯、摩根大通、高盛和贝莱德等参与,是该公司继去年62亿美元融资后的第二轮。公司致力于打造「人工通用工程师」,开发能自动化设计制造喷气发动机、药物化合物、摩天大楼等复杂物理系统的AI软件。公司目前150名员工,分布在旧金山、伦敦和苏黎世,大部分资金将用于满足算力需求。该估值使其成为史上最高估值的AI初创企业之一。

阅读原文
4

SpaceX完成1.77万亿美元估值IPO,首日股价上涨11%

IPOSpaceX

SpaceX于6月12日以135美元/股完成史上最大规模IPO,融资750亿美元,发行5.556亿股,估值达1.77万亿美元,超越特斯拉成为美国第七大市值公司。开盘首日股价上涨约11%-25.5%,市值一度突破2.21万亿美元。马斯克持有约40%股权但掌握85%投票权,净资产接近1万亿美元,成为全球首位万亿富翁。SpaceX股票代码SPCX登陆纳斯达克,整合了Starlink、xAI和X平台。尽管CFRA分析师给出「卖出」评级,散户订单超1000亿美元远超预留额度,预示后续Anthropic和OpenAI的IPO进程。

阅读原文
5

谷歌开源端侧多模态Gemma 3n,2GB显存即可运行

开源模型端侧AI

谷歌发布开源端侧多模态模型Gemma 3n,包含5B(E2B)和8B(E4B)两种型号,采用创新MatFormer架构实现嵌套式弹性推理,有效参数分别相当于2B和4B模型,最低仅需2GB显存即可运行。在大模型竞技场取得1303分,成为首个突破1300分的10B以下模型。原生支持文本、图像和音视频输入,配备基于USM的音频编码器,支持语音识别与翻译,采用新型视觉编码器MobileNet-V5-300M。通过逐层嵌入PLE技术和KV缓存共享优化显著降低内存占用。模型已通过谷歌AI Studio、Ollama、Hugging Face等平台开放。

阅读原文
6

Moonshot发布万亿参数开源编码模型Kimi-K2.7-Code

开源模型AI编程

Moonshot AI于6月发布开源编码模型Kimi-K2.7-Code,采用混合专家架构,总参数量达1万亿,激活参数320亿。相比前代K2.6模型,推理token使用量减少30%,有效降低计算成本与延迟。在多个基准测试中显著提升:Kimi Code Bench v2提高21.8%,Program Bench提升11.0%,MLS Bench Lite多语言任务跃升31.5%,在Python、Rust、Go等编程任务中准确率大幅增强。模型已上线Kimi平台API及Hugging Face,采用允许商业使用的Modified MIT许可证。此为该公司不到一年内推出的第五个主要版本,聚焦智能体能力与长上下文处理。

阅读原文
7

Claude独立攻克高德纳图论猜想,31步发现「纤维分解」通解

AI数学Claude

Claude Opus 4.6在31次探索后成功解决高德纳提出的未解图论猜想:在m×m×m三维环形网格中寻找三条互不重叠的哈密顿环以覆盖所有有向边。该问题搜索空间高达3^(m³),此前仅对小规模情况有解。Claude通过提出「纤维分解」方法,利用s = (i + j + k) mod m将图分层,最终发现基于s、i、j值的「bump」规则构造通解。高德纳在斯坦福官网发布论文称此为「Shock!Shock!」,表示必须重新评估生成式AI在数学研究中的作用。这是生成式AI首次被正式记录为参与核心数学发现过程。

阅读原文
8

工信部印发《人工智能+信息通信》实施意见,2028年建30个高价值场景

AI政策中国

工业和信息化部印发《「人工智能+信息通信」创新发展实施意见(2026—2028年)》,提出到2028年初步构建AI与信息通信融合发展格局,信息通信网络实现高等级自智,形成30个以上高价值典型场景,城域算力1毫秒时延圈覆盖率不低于75%。到2030年通感算智一体化服务能力显著提升。意见部署四大方面17项任务:推动信息通信行业智能化升级、夯实人工智能发展底座、深化融合应用创新推广、增强行业治理能力。重点推进5G-A/6G与AI融合,加强智能体研发,建设400Gbps/800Gbps骨干网,构建「枢纽—区域—边缘」三级算力体系。

阅读原文
9

Zyphra发布Zamba2-VL视觉语言模型,首token时间降低10倍

开源模型视觉语言模型

Zyphra发布开源混合Mamba2-Transformer视觉语言模型Zamba2-VL,包含1.2B、2.7B和7B三种参数规模。模型采用LLaVA-style结构,结合Qwen2.5-VL视觉编码器与轻量MLP适配器,核心创新在于使用Mamba2状态空间层替代传统Transformer密集注意力机制,实现近线性预填充时间和固定大小循环状态。这使「首令牌生成时间」TTFT降低约一个数量级,尤其在长序列输入场景下优势显著。在视觉计数(PixMoCount)和文档理解(DocVQA)任务上表现突出,但在知识密集型推理任务上落后于更大模型。基于Apache 2.0许可公开权重与代码。

阅读原文
10

PixelRAG视觉检索系统准确率超文本RAG 18%,token成本降10倍

RAGAI研究

加州大学伯克利分校、普林斯顿大学、EPFL和Databricks研究团队发布PixelRAG系统,通过跳过传统文本解析步骤,直接将网页渲染为截图并索引图像,供视觉语言模型读取。在涵盖维基百科3000万张截图瓦片的测试中,PixelRAG在六项基准测试中均优于基于文本的RAG系统,准确率最高提升18.1%。研究指出传统HTML解析导致三类主要失败:解析丢失36.6%、排序丢失55.2%和读者丢失8.2%。系统使用Qwen3-VL-Embedding-2B和FAISS实现高效检索,在代理任务中将token消耗从3750万降至360万,成本降低10倍。研究建议短期内采用文本与视觉混合检索策略。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。