1
Anthropic发布Claude Fable 5/Mythos 5,SWE-bench Pro得分80.3%超越GPT-5.5 大模型 Anthropic
Anthropic于6月9日正式发布两款新模型:面向公众的Claude Fable 5和限受信任用户使用的Mythos 5。两款模型共享同一内核,在SWE-bench Pro测试中取得80.3%(GPT-5.5为58.6%),Terminal-Bench 2.1达88%。Stripe使用Fable 5在一天内完成5000万行Ruby代码迁移,相当于团队两个多月的工作量。Mythos 5在内部测试中将蛋白质设计效率提升约十倍。API定价为每百万输入Token 10美元、输出50美元,较预览版降价过半。Fable 5对网络安全、生化等高风险请求会自动降级至Opus 4.8处理,误触发率低于5%。Mythos 5仅限Project Glasswing等少数机构使用。
阅读原文 2
Cohere开源300亿参数编程模型North Mini Code,单H100即可运行 开源模型 编程AI
Cohere于6月9日发布首款开源代理式编程模型North Mini Code 1.0,采用MoE架构,总参数300亿、激活仅30亿,可在单张H100 GPU(FP8精度)上运行。模型支持256K上下文窗口和最高64K输出长度,专为代理式软件工程设计,支持子代理协调、架构映射、代码审查和终端任务。在Artificial Analysis Coding Index得分33.4,相比Mistral Devstral Small 2吞吐量提升2.8倍、延迟降低30%。模型以Apache 2.0许可证在Hugging Face发布,允许企业自由修改和商业化部署,距其前一模型Command A+发布不到三周,显示Cohere加速迭代节奏。
阅读原文 3
博通联手阿波罗黑石成立AI XPV平台,350亿美元支持Anthropic算力扩张 AI基础设施 融资
博通、阿波罗和黑石集团于6月9日宣布成立AI XPV战略平台,旨在通过定制化XPU和网络解决方案,到2028年推动全球超过20吉瓦的AI算力部署。该平台首期由阿波罗牵头、联合黑石出资350亿美元,支持Anthropic此前公布的超1吉瓦算力基础设施扩展计划,预计从2026年年中起在基于Fluidstack的站点部署。此外,彭博社披露Google正为Anthropic的350亿美元数据中心租赁提供财务背书,使其与Anthropic的财务关联远超此前的股权投资,引发外界对AI产业循环交易和系统性风险的担忧。
阅读原文 4
谷歌发布Gemini 3.5 Live Translate,支持70多种语言近实时语音翻译 多模态AI Google
谷歌于6月9日推出Gemini 3.5 Live Translate音频模型,支持70多种语言的近实时语音到语音翻译,可自动检测语言并保留说话者语调、节奏和音高,延迟仅几秒。该模型已通过Gemini Live API和Google AI Studio向开发者公测,企业用户可在Google Meet中参与私测,普通用户可通过Android和iOS版Google Translate应用使用。Android新增「收听模式」,允许用户无需耳机直接通过听筒收听翻译。所有生成音频嵌入SynthID数字水印以防止误用。合作伙伴Grab已在测试中将其用于司机与乘客实时通话翻译,每月覆盖超1000万通电话。
阅读原文 5
NIST数学证明:固定规则无法保障AI安全,需转向持续监控更新模式 AI安全 政策研究
美国国家标准与技术研究院(NIST)高级科学家Apostol Vassilev于6月9日在《IEEE Security and Privacy》发表数学证明,借鉴库尔特·哥德尔1931年的不完备性定理,证明无法通过固定的有限组安全规则使AI系统对自适应对抗性提示具有普遍鲁棒性。这意味着AI系统永远无法完全免受「越狱」攻击,攻击者总可能找到规避机制的方法。Vassilev提出AI安全应从「一次部署、长期有效」转向「持续监控与更新」模式,采用红队测试、动态更新防护机制以及建立快速恢复能力三大策略,目标是提高攻击成本至超出攻击者资源范围,形成经济上的防御平衡。
阅读原文 6
Glean接入NVIDIA Nemotron 3 Ultra,企业AI转向多模型按需选型 企业AI 模型路由
Glean于6月9日宣布在其企业AI平台中新增对NVIDIA Nemotron 3 Ultra模型的支持,目前平台已提供超过30种模型选项。Nemotron 3 Ultra具备前沿大语言模型91%的完整性,同时保持开源模型的成本优势。Glean的Waldo搜索模型已基于NVIDIA Nemotron 3 Nano优化,延迟降低50%,token使用减少25%。同日Sedai发布全球首个自主优化AI代理的平台AI Agent Optimization,通过智能路由自动在OpenAI、Anthropic、VertexAI、Bedrock等主流大模型之间选择,已被GSK、KnowBe4等企业采用。这反映企业AI正从「单一模型通用」转向「按需选型」以应对生成式AI日益增长的运营成本。
阅读原文 7
NVIDIA锁定韩国HBM4/HBM5供应,中国业务营收预计归零 半导体 地缘政治
英伟达CEO黄仁勋近期亚洲之行促成SK海力士供应HBM4和HBM5内存模块,用于即将推出的Vera Rubin平台,巩固下一代AI硬件供应链。同时SK电信、Naver、现代和LG等加大AI投资,强化了英伟达在亚洲的生态主导地位。然而受美国出口管制影响,英伟达预计2027财年第二季度对中国市场营收将归零,该市场曾占其数据中心销售近四分之一。中国市场份额从2024年的95%降至2025年的55%,华为已占据20%份额形成替代。分析师仍看好其「主权AI」战略,2026财年此类项目贡献约300亿美元收入,占比约14%。
阅读原文 8
Brave揭示间接提示注入是LLM代理普遍漏洞,本地部署同样无法幸免 AI安全 漏洞
Brave安全研究人员于6月9日发布报告,揭示间接提示注入(Indirect Prompt Injection)是大语言模型代理的普遍性安全漏洞,无论部署在云端还是本地设备均无法幸免。研究通过实际案例证明,Mozilla Tabstack(云部署)和Cotypist(macOS本地部署)均可被恶意网页或本地文档中的隐藏指令操控,导致用户数据泄露和内容篡改。根本原因在于当前LLM架构无法有效区分开发者指令与外部数据。Futurum Group调查显示,53%的企业将隐私与安全视为生成式AI采用的主要障碍。报告打破了「本地AI更安全」的迷思,强调仅靠部署模式无法解决此结构性风险。
阅读原文 9
Beacon获2.25亿美元C轮融资,「反PE」模式AI整合细分软件市场 AI创业 融资
总部位于多伦多和旧金山的「AI原生」控股公司Beacon宣布完成2.25亿美元C轮融资,由General Catalyst和HarbourVest领投,Lightspeed等参投,使其总融资额在不到两年内超过5亿美元。Beacon采用独特的「反私募股权」模式,收购年经常性收入低于2000万美元的小型盈利软件企业,尤其是服务于青年体育联盟、露营地等被主流风投忽视的垂直领域。其内部「加速团队」将企业重建于共享的AI原生平台上,自动化会计、薪资等后台流程,过去一年实现投资组合EBITDA增长超50%。创始人认为AI大幅降低代码编写成本,为升级占美国GDP超55%的非主流行业带来历史性机遇。
阅读原文 10
NVIDIA发布Cosmos 3全开放AI全能模型,成立Cosmos联盟推动物理AI 开源模型 物理AI
NVIDIA于6月9日发布Cosmos 3,号称全球首个完全开放的AI全能模型,专为物理AI应用设计。该模型采用混合Transformer架构,集成视觉推理、世界生成与动作预测,可处理文本、图像、视频、环境音和动作,具备高精度物理模拟能力,有望缩短物理AI训练时间。Cosmos 3支持机器人、自动驾驶车辆和视觉代理在现实世界中以较少训练数据实现泛化,适用于抓取、灵巧操作等任务。NVIDIA同时宣布成立Cosmos联盟,成员包括Agile Robots、Doosan Robotics、LG、三星、Skild AI、Li Auto等企业。据Deloitte预测,到2026年全球工业机器人累计装机量可达550万台。
阅读原文