AI Daily Brief

2026年6月13日星期六

10 点要闻3 分钟阅读

今日要闻

MiniMax发布M3开源模型，4280亿参数支持100万token上下文

开源模型MiniMax

中国AI公司MiniMax于6月11日发布开源混合专家模型M3，总参数4280亿，每次推理激活230亿参数，原生支持文本、图像和视频输入。该模型采用自研稀疏注意力技术MSA，实现100万token上下文窗口，预填充速度提升9.7倍，解码速度提升15.6倍。在SWE-Bench Pro测试中得分59%，Terminal Bench 2.1得分66%，MCP Atlas得分74.2%。模型权重无门槛发布在Hugging Face，支持本地部署。API超过512K token后费率翻倍。NVIDIA Blackwell基础设施已提供部署支持。

阅读原文

智源发布全球首个通用世界基座模型，原生多模态Emu3.5开源

世界模型智源

北京智源研究院在2026年智源大会上发布两大世界模型「悟界·Physis-v0.1」和「悟界·RoboBrain Orca-v0」，前者采用「下一物理状态预测」范式，统一处理视频、RGB-D、3D点云、力触反馈等多模态信息，支持50多个物理场景推演。同时开源原生多模态世界模型Emu3.5，参数34B，基于Decoder-only Transformer架构，在超10万亿Token数据上预训练，集成扩散解码器支持2K分辨率重建。Emu3.5在多项基准测试中性能媲美或超越Gemini-2.5-Flash-Image，离散扩散适配技术使图像推理速度提升近20倍。

阅读原文

贝佐斯AI公司Prometheus完成120亿美元融资，估值410亿美元

融资物理AI

杰夫·贝佐斯与前Verily联合创始人Vik Bajaj共同创立的物理AI公司Prometheus于6月11日宣布完成120亿美元融资，估值达410亿美元。本轮由贝佐斯、摩根大通、高盛和贝莱德等参与，是该公司继去年62亿美元融资后的第二轮。公司致力于打造「人工通用工程师」，开发能自动化设计制造喷气发动机、药物化合物、摩天大楼等复杂物理系统的AI软件。公司目前150名员工，分布在旧金山、伦敦和苏黎世，大部分资金将用于满足算力需求。该估值使其成为史上最高估值的AI初创企业之一。

阅读原文

SpaceX完成1.77万亿美元估值IPO，首日股价上涨11%

IPOSpaceX

SpaceX于6月12日以135美元/股完成史上最大规模IPO，融资750亿美元，发行5.556亿股，估值达1.77万亿美元，超越特斯拉成为美国第七大市值公司。开盘首日股价上涨约11%-25.5%，市值一度突破2.21万亿美元。马斯克持有约40%股权但掌握85%投票权，净资产接近1万亿美元，成为全球首位万亿富翁。SpaceX股票代码SPCX登陆纳斯达克，整合了Starlink、xAI和X平台。尽管CFRA分析师给出「卖出」评级，散户订单超1000亿美元远超预留额度，预示后续Anthropic和OpenAI的IPO进程。

阅读原文

谷歌开源端侧多模态Gemma 3n，2GB显存即可运行

开源模型端侧AI

谷歌发布开源端侧多模态模型Gemma 3n，包含5B（E2B）和8B（E4B）两种型号，采用创新MatFormer架构实现嵌套式弹性推理，有效参数分别相当于2B和4B模型，最低仅需2GB显存即可运行。在大模型竞技场取得1303分，成为首个突破1300分的10B以下模型。原生支持文本、图像和音视频输入，配备基于USM的音频编码器，支持语音识别与翻译，采用新型视觉编码器MobileNet-V5-300M。通过逐层嵌入PLE技术和KV缓存共享优化显著降低内存占用。模型已通过谷歌AI Studio、Ollama、Hugging Face等平台开放。

阅读原文

Moonshot发布万亿参数开源编码模型Kimi-K2.7-Code

开源模型AI编程

Moonshot AI于6月发布开源编码模型Kimi-K2.7-Code，采用混合专家架构，总参数量达1万亿，激活参数320亿。相比前代K2.6模型，推理token使用量减少30%，有效降低计算成本与延迟。在多个基准测试中显著提升：Kimi Code Bench v2提高21.8%，Program Bench提升11.0%，MLS Bench Lite多语言任务跃升31.5%，在Python、Rust、Go等编程任务中准确率大幅增强。模型已上线Kimi平台API及Hugging Face，采用允许商业使用的Modified MIT许可证。此为该公司不到一年内推出的第五个主要版本，聚焦智能体能力与长上下文处理。

阅读原文

Claude独立攻克高德纳图论猜想，31步发现「纤维分解」通解

AI数学Claude

Claude Opus 4.6在31次探索后成功解决高德纳提出的未解图论猜想：在m×m×m三维环形网格中寻找三条互不重叠的哈密顿环以覆盖所有有向边。该问题搜索空间高达3^(m³)，此前仅对小规模情况有解。Claude通过提出「纤维分解」方法，利用s = (i + j + k) mod m将图分层，最终发现基于s、i、j值的「bump」规则构造通解。高德纳在斯坦福官网发布论文称此为「Shock！Shock！」，表示必须重新评估生成式AI在数学研究中的作用。这是生成式AI首次被正式记录为参与核心数学发现过程。

阅读原文

工信部印发《人工智能+信息通信》实施意见，2028年建30个高价值场景

AI政策中国

工业和信息化部印发《「人工智能+信息通信」创新发展实施意见（2026—2028年）》，提出到2028年初步构建AI与信息通信融合发展格局，信息通信网络实现高等级自智，形成30个以上高价值典型场景，城域算力1毫秒时延圈覆盖率不低于75%。到2030年通感算智一体化服务能力显著提升。意见部署四大方面17项任务：推动信息通信行业智能化升级、夯实人工智能发展底座、深化融合应用创新推广、增强行业治理能力。重点推进5G-A/6G与AI融合，加强智能体研发，建设400Gbps/800Gbps骨干网，构建「枢纽—区域—边缘」三级算力体系。

阅读原文

Zyphra发布Zamba2-VL视觉语言模型，首token时间降低10倍

开源模型视觉语言模型

Zyphra发布开源混合Mamba2-Transformer视觉语言模型Zamba2-VL，包含1.2B、2.7B和7B三种参数规模。模型采用LLaVA-style结构，结合Qwen2.5-VL视觉编码器与轻量MLP适配器，核心创新在于使用Mamba2状态空间层替代传统Transformer密集注意力机制，实现近线性预填充时间和固定大小循环状态。这使「首令牌生成时间」TTFT降低约一个数量级，尤其在长序列输入场景下优势显著。在视觉计数（PixMoCount）和文档理解（DocVQA）任务上表现突出，但在知识密集型推理任务上落后于更大模型。基于Apache 2.0许可公开权重与代码。

阅读原文

PixelRAG视觉检索系统准确率超文本RAG 18%，token成本降10倍

RAGAI研究

加州大学伯克利分校、普林斯顿大学、EPFL和Databricks研究团队发布PixelRAG系统，通过跳过传统文本解析步骤，直接将网页渲染为截图并索引图像，供视觉语言模型读取。在涵盖维基百科3000万张截图瓦片的测试中，PixelRAG在六项基准测试中均优于基于文本的RAG系统，准确率最高提升18.1%。研究指出传统HTML解析导致三类主要失败：解析丢失36.6%、排序丢失55.2%和读者丢失8.2%。系统使用Qwen3-VL-Embedding-2B和FAISS实现高效检索，在代理任务中将token消耗从3750万降至360万，成本降低10倍。研究建议短期内采用文本与视觉混合检索策略。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。