AI Daily Brief

2026年6月10日星期三

10 点要闻3 分钟阅读

今日要闻

Anthropic发布Claude Fable 5/Mythos 5，SWE-bench Pro得分80.3%超越GPT-5.5

大模型Anthropic

Anthropic于6月9日正式发布两款新模型：面向公众的Claude Fable 5和限受信任用户使用的Mythos 5。两款模型共享同一内核，在SWE-bench Pro测试中取得80.3%（GPT-5.5为58.6%），Terminal-Bench 2.1达88%。Stripe使用Fable 5在一天内完成5000万行Ruby代码迁移，相当于团队两个多月的工作量。Mythos 5在内部测试中将蛋白质设计效率提升约十倍。API定价为每百万输入Token 10美元、输出50美元，较预览版降价过半。Fable 5对网络安全、生化等高风险请求会自动降级至Opus 4.8处理，误触发率低于5%。Mythos 5仅限Project Glasswing等少数机构使用。

阅读原文

Cohere开源300亿参数编程模型North Mini Code，单H100即可运行

开源模型编程AI

Cohere于6月9日发布首款开源代理式编程模型North Mini Code 1.0，采用MoE架构，总参数300亿、激活仅30亿，可在单张H100 GPU（FP8精度）上运行。模型支持256K上下文窗口和最高64K输出长度，专为代理式软件工程设计，支持子代理协调、架构映射、代码审查和终端任务。在Artificial Analysis Coding Index得分33.4，相比Mistral Devstral Small 2吞吐量提升2.8倍、延迟降低30%。模型以Apache 2.0许可证在Hugging Face发布，允许企业自由修改和商业化部署，距其前一模型Command A+发布不到三周，显示Cohere加速迭代节奏。

阅读原文

博通联手阿波罗黑石成立AI XPV平台，350亿美元支持Anthropic算力扩张

AI基础设施融资

博通、阿波罗和黑石集团于6月9日宣布成立AI XPV战略平台，旨在通过定制化XPU和网络解决方案，到2028年推动全球超过20吉瓦的AI算力部署。该平台首期由阿波罗牵头、联合黑石出资350亿美元，支持Anthropic此前公布的超1吉瓦算力基础设施扩展计划，预计从2026年年中起在基于Fluidstack的站点部署。此外，彭博社披露Google正为Anthropic的350亿美元数据中心租赁提供财务背书，使其与Anthropic的财务关联远超此前的股权投资，引发外界对AI产业循环交易和系统性风险的担忧。

阅读原文

谷歌发布Gemini 3.5 Live Translate，支持70多种语言近实时语音翻译

多模态AIGoogle

谷歌于6月9日推出Gemini 3.5 Live Translate音频模型，支持70多种语言的近实时语音到语音翻译，可自动检测语言并保留说话者语调、节奏和音高，延迟仅几秒。该模型已通过Gemini Live API和Google AI Studio向开发者公测，企业用户可在Google Meet中参与私测，普通用户可通过Android和iOS版Google Translate应用使用。Android新增「收听模式」，允许用户无需耳机直接通过听筒收听翻译。所有生成音频嵌入SynthID数字水印以防止误用。合作伙伴Grab已在测试中将其用于司机与乘客实时通话翻译，每月覆盖超1000万通电话。

阅读原文

NIST数学证明：固定规则无法保障AI安全，需转向持续监控更新模式

AI安全政策研究

美国国家标准与技术研究院（NIST）高级科学家Apostol Vassilev于6月9日在《IEEE Security and Privacy》发表数学证明，借鉴库尔特·哥德尔1931年的不完备性定理，证明无法通过固定的有限组安全规则使AI系统对自适应对抗性提示具有普遍鲁棒性。这意味着AI系统永远无法完全免受「越狱」攻击，攻击者总可能找到规避机制的方法。Vassilev提出AI安全应从「一次部署、长期有效」转向「持续监控与更新」模式，采用红队测试、动态更新防护机制以及建立快速恢复能力三大策略，目标是提高攻击成本至超出攻击者资源范围，形成经济上的防御平衡。

阅读原文

Glean接入NVIDIA Nemotron 3 Ultra，企业AI转向多模型按需选型

企业AI模型路由

Glean于6月9日宣布在其企业AI平台中新增对NVIDIA Nemotron 3 Ultra模型的支持，目前平台已提供超过30种模型选项。Nemotron 3 Ultra具备前沿大语言模型91%的完整性，同时保持开源模型的成本优势。Glean的Waldo搜索模型已基于NVIDIA Nemotron 3 Nano优化，延迟降低50%，token使用减少25%。同日Sedai发布全球首个自主优化AI代理的平台AI Agent Optimization，通过智能路由自动在OpenAI、Anthropic、VertexAI、Bedrock等主流大模型之间选择，已被GSK、KnowBe4等企业采用。这反映企业AI正从「单一模型通用」转向「按需选型」以应对生成式AI日益增长的运营成本。

阅读原文

NVIDIA锁定韩国HBM4/HBM5供应，中国业务营收预计归零

半导体地缘政治

英伟达CEO黄仁勋近期亚洲之行促成SK海力士供应HBM4和HBM5内存模块，用于即将推出的Vera Rubin平台，巩固下一代AI硬件供应链。同时SK电信、Naver、现代和LG等加大AI投资，强化了英伟达在亚洲的生态主导地位。然而受美国出口管制影响，英伟达预计2027财年第二季度对中国市场营收将归零，该市场曾占其数据中心销售近四分之一。中国市场份额从2024年的95%降至2025年的55%，华为已占据20%份额形成替代。分析师仍看好其「主权AI」战略，2026财年此类项目贡献约300亿美元收入，占比约14%。

阅读原文

Brave揭示间接提示注入是LLM代理普遍漏洞，本地部署同样无法幸免

AI安全漏洞

Brave安全研究人员于6月9日发布报告，揭示间接提示注入（Indirect Prompt Injection）是大语言模型代理的普遍性安全漏洞，无论部署在云端还是本地设备均无法幸免。研究通过实际案例证明，Mozilla Tabstack（云部署）和Cotypist（macOS本地部署）均可被恶意网页或本地文档中的隐藏指令操控，导致用户数据泄露和内容篡改。根本原因在于当前LLM架构无法有效区分开发者指令与外部数据。Futurum Group调查显示，53%的企业将隐私与安全视为生成式AI采用的主要障碍。报告打破了「本地AI更安全」的迷思，强调仅靠部署模式无法解决此结构性风险。

阅读原文

Beacon获2.25亿美元C轮融资，「反PE」模式AI整合细分软件市场

AI创业融资

总部位于多伦多和旧金山的「AI原生」控股公司Beacon宣布完成2.25亿美元C轮融资，由General Catalyst和HarbourVest领投，Lightspeed等参投，使其总融资额在不到两年内超过5亿美元。Beacon采用独特的「反私募股权」模式，收购年经常性收入低于2000万美元的小型盈利软件企业，尤其是服务于青年体育联盟、露营地等被主流风投忽视的垂直领域。其内部「加速团队」将企业重建于共享的AI原生平台上，自动化会计、薪资等后台流程，过去一年实现投资组合EBITDA增长超50%。创始人认为AI大幅降低代码编写成本，为升级占美国GDP超55%的非主流行业带来历史性机遇。

阅读原文

NVIDIA发布Cosmos 3全开放AI全能模型，成立Cosmos联盟推动物理AI

开源模型物理AI

NVIDIA于6月9日发布Cosmos 3，号称全球首个完全开放的AI全能模型，专为物理AI应用设计。该模型采用混合Transformer架构，集成视觉推理、世界生成与动作预测，可处理文本、图像、视频、环境音和动作，具备高精度物理模拟能力，有望缩短物理AI训练时间。Cosmos 3支持机器人、自动驾驶车辆和视觉代理在现实世界中以较少训练数据实现泛化，适用于抓取、灵巧操作等任务。NVIDIA同时宣布成立Cosmos联盟，成员包括Agile Robots、Doosan Robotics、LG、三星、Skild AI、Li Auto等企业。据Deloitte预测，到2026年全球工业机器人累计装机量可达550万台。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。