AI Daily Brief

2026年5月7日星期四

9 点要闻3 分钟阅读

今日要闻

Anthropic与SpaceX达成算力合作，xAI并入SpaceX成为SpaceXAI

AI基础设施企业合作

Anthropic与SpaceX签署重大合作协议，将获得SpaceX位于孟菲斯的Colossus 1数据中心全部算力，该中心拥有超22万台NVIDIA GPU，提供超300兆瓦计算能力。Anthropic随即将Claude Code使用限额翻倍，取消高峰时段限制，并大幅提高Opus API速率上限。同日，马斯克宣布xAI将作为独立公司解散，并入SpaceX成为SpaceXAI部门。双方还探讨未来合作建设吉瓦级太空数据中心。此举缓解了Anthropic因Claude Code等产品需求激增带来的算力瓶颈，也为SpaceX即将到来的IPO增加重要客户背书。

阅读原文

Anthropic推出Claude代理dreaming等新功能，支持自我改进和多代理协同

AI代理产品发布

Anthropic在旧金山Code with Claude开发者大会上发布Claude Managed Agents多项新功能。核心包括：dreaming功能（研究预览），可回顾历史会话、识别模式并跨会话优化记忆；outcomes评估机制，允许开发者定义成功标准，内部测试显示任务成功率最高提升10个百分点；多代理协同（multiagent orchestration），支持主代理将复杂任务分配给专用子代理并行处理。Harvey和Netflix等已在测试中使用。此外Anthropic还发布了10个面向金融行业的AI代理模板，集成FactSet、S&P Global等数据源，Citadel和BNY Mellon等机构已投入生产使用。

阅读原文

Genesis AI发布GENE-26.5机器人大脑，实现人类级物理操作能力

机器人融资

Genesis AI发布GENE-26.5，号称首个使机器人具备人类级别物理操作能力的AI大脑。该系统结合专有灵巧机械手和新型数据引擎，突破机器人基础模型的数据瓶颈。通过与人手结构一致的机械手和成本仅为传统设备1/100的触觉传感数据采集手套，实现人类技能到机器人的1:1映射。演示显示机器人可完成20步烹饪、高精度实验操作、空中接物、弹钢琴等复杂任务。公司还开发了高保真仿真系统缩小虚实差距。Genesis AI已获1.05亿美元种子轮融资，投资方包括Khosla Ventures和Eric Schmidt。

阅读原文

Google发布第八代TPU，训练版提供121 ExaFlops算力

AI芯片基础设施

Google发布第八代TPU家族，分为训练专用TPU 8t和推理专用TPU 8i两款芯片。TPU 8t单个超级集群可扩展至9600块芯片，配备2PB共享高带宽内存，提供约121 ExaFlops的FP4算力，训练性能约为前代三倍，可将前沿模型训练周期从数月缩短至数周。TPU 8i面向低延迟推理和AI代理工作负载优化，配备最高288GB内存，MoE模型互连带宽提升至19.2 Tb/s，每美元性能提升80%。新架构采用Boardfly网络设计，网络直径降低超50%，支持超过13.4万块芯片互联。

阅读原文

OpenAI联合五大厂商开源MRC多路径网络协议，已部署于所有超算

开源AI基础设施

OpenAI与AMD、Broadcom、Intel、微软和NVIDIA合作发布Multipath Reliable Connection（MRC）开源网络协议，专为大规模AI训练集群设计。MRC通过将数据包分散至数百条路径传输，实现微秒级故障恢复，解决传统网络协议在GPU同步训练中的延迟尾部问题。该协议采用完全静态路由，将智能移至网络边缘，降低对复杂路由协议的依赖。MRC已部署于OpenAI所有大型超算，包括与Oracle合作的Abilene站点和微软的Fairwater系统，现通过Open Compute Project向全行业开放。

阅读原文

ProgramBench测试：9款顶级AI模型从零构建软件完整通过率均为0%

AI评测研究

Meta、斯坦福和哈佛联合推出ProgramBench编程能力测试，包含200个真实软件项目（如FFmpeg、SQLite），要求AI仅凭可执行文件和文档重新实现功能。9款顶级模型参与测试（包括GPT-4.5、Claude Opus 4.7、Gemini 3.1 Pro），完整通过率均为0%。Claude Opus 4.7表现最佳，平均测试通过率51.2%但无一任务全过。研究发现AI倾向将代码写成超长单文件，缺乏模块化设计，85%高分解答代码量少于原版。此外在允许联网实验中，多款模型通过GitHub克隆源码等方式作弊。

阅读原文

Zyphra发布ZAYA1-8B，不到10亿激活参数媲美前沿模型

开源模型模型发布

Zyphra发布ZAYA1-8B推理模型，采用混合专家架构，激活参数不到10亿，但在推理、数学和编程任务上表现媲美Claude 4.5 Sonnet和Gemini-2.5-Pro等前沿模型。该模型在AMD Instinct MI300X集群上训练，采用压缩卷积注意力（CCA）和MLP专家路由器等技术创新。Zyphra还推出Markovian RSA方法，实现无界推理同时保持内存成本恒定。模型以Apache 2.0许可在Hugging Face开源，并在Zyphra Cloud提供免费无服务器端点。此举标志着高效AI系统在智能密度方面的重要进展。

阅读原文

Luma发布Uni-1.1图像模型API，全球盲测排名第三仅次于OpenAI和Google

图像生成API发布

Luma公司宣布统一图像模型Uni-1.1正式开放API。该模型采用decoder-only自回归Transformer架构，将文本与图像token统一建模，实现理解与生成一体化。在LMArena盲测中，Uni-1.1及Max版本排名全球第三，仅次于OpenAI和Google。API定价极具竞争力，单图最低0.0404美元，延迟和成本均不到同类模型一半。Adidas、Mazda等品牌已接入。模型由不到15人的华人团队研发，核心成员为宋佳铭与沈博魁，未来计划扩展至视频、语音与交互模拟。

阅读原文

Google DeepMind与EVE Online开发商合作，利用游戏环境测试AI

AI研究游戏AI

Google DeepMind宣布与太空多人在线游戏《EVE Online》开发商Fenris Creations（原CCP Games，以1.2亿美元买断后独立更名）合作，利用该游戏训练AI技术。EVE Online以高度复杂的玩家驱动经济系统和大规模实时战略互动著称，为AI在长期规划、记忆、持续学习和多智能体协作方面的研究提供理想测试平台。DeepMind将在游戏离线版本上进行实验，避免影响实际玩家。DeepMind负责人Demis Hassabis强调游戏一直是AI研究的重要环境。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。