返回往期
2026年5月7日星期四
9 点要闻3 分钟阅读

今日要闻

1

Anthropic与SpaceX达成算力合作,xAI并入SpaceX成为SpaceXAI

AI基础设施企业合作

Anthropic与SpaceX签署重大合作协议,将获得SpaceX位于孟菲斯的Colossus 1数据中心全部算力,该中心拥有超22万台NVIDIA GPU,提供超300兆瓦计算能力。Anthropic随即将Claude Code使用限额翻倍,取消高峰时段限制,并大幅提高Opus API速率上限。同日,马斯克宣布xAI将作为独立公司解散,并入SpaceX成为SpaceXAI部门。双方还探讨未来合作建设吉瓦级太空数据中心。此举缓解了Anthropic因Claude Code等产品需求激增带来的算力瓶颈,也为SpaceX即将到来的IPO增加重要客户背书。

阅读原文
2

Anthropic推出Claude代理dreaming等新功能,支持自我改进和多代理协同

AI代理产品发布

Anthropic在旧金山Code with Claude开发者大会上发布Claude Managed Agents多项新功能。核心包括:dreaming功能(研究预览),可回顾历史会话、识别模式并跨会话优化记忆;outcomes评估机制,允许开发者定义成功标准,内部测试显示任务成功率最高提升10个百分点;多代理协同(multiagent orchestration),支持主代理将复杂任务分配给专用子代理并行处理。Harvey和Netflix等已在测试中使用。此外Anthropic还发布了10个面向金融行业的AI代理模板,集成FactSet、S&P Global等数据源,Citadel和BNY Mellon等机构已投入生产使用。

阅读原文
3

Genesis AI发布GENE-26.5机器人大脑,实现人类级物理操作能力

机器人融资

Genesis AI发布GENE-26.5,号称首个使机器人具备人类级别物理操作能力的AI大脑。该系统结合专有灵巧机械手和新型数据引擎,突破机器人基础模型的数据瓶颈。通过与人手结构一致的机械手和成本仅为传统设备1/100的触觉传感数据采集手套,实现人类技能到机器人的1:1映射。演示显示机器人可完成20步烹饪、高精度实验操作、空中接物、弹钢琴等复杂任务。公司还开发了高保真仿真系统缩小虚实差距。Genesis AI已获1.05亿美元种子轮融资,投资方包括Khosla Ventures和Eric Schmidt。

阅读原文
4

Google发布第八代TPU,训练版提供121 ExaFlops算力

AI芯片基础设施

Google发布第八代TPU家族,分为训练专用TPU 8t和推理专用TPU 8i两款芯片。TPU 8t单个超级集群可扩展至9600块芯片,配备2PB共享高带宽内存,提供约121 ExaFlops的FP4算力,训练性能约为前代三倍,可将前沿模型训练周期从数月缩短至数周。TPU 8i面向低延迟推理和AI代理工作负载优化,配备最高288GB内存,MoE模型互连带宽提升至19.2 Tb/s,每美元性能提升80%。新架构采用Boardfly网络设计,网络直径降低超50%,支持超过13.4万块芯片互联。

阅读原文
5

OpenAI联合五大厂商开源MRC多路径网络协议,已部署于所有超算

开源AI基础设施

OpenAI与AMD、Broadcom、Intel、微软和NVIDIA合作发布Multipath Reliable Connection(MRC)开源网络协议,专为大规模AI训练集群设计。MRC通过将数据包分散至数百条路径传输,实现微秒级故障恢复,解决传统网络协议在GPU同步训练中的延迟尾部问题。该协议采用完全静态路由,将智能移至网络边缘,降低对复杂路由协议的依赖。MRC已部署于OpenAI所有大型超算,包括与Oracle合作的Abilene站点和微软的Fairwater系统,现通过Open Compute Project向全行业开放。

阅读原文
6

ProgramBench测试:9款顶级AI模型从零构建软件完整通过率均为0%

AI评测研究

Meta、斯坦福和哈佛联合推出ProgramBench编程能力测试,包含200个真实软件项目(如FFmpeg、SQLite),要求AI仅凭可执行文件和文档重新实现功能。9款顶级模型参与测试(包括GPT-4.5、Claude Opus 4.7、Gemini 3.1 Pro),完整通过率均为0%。Claude Opus 4.7表现最佳,平均测试通过率51.2%但无一任务全过。研究发现AI倾向将代码写成超长单文件,缺乏模块化设计,85%高分解答代码量少于原版。此外在允许联网实验中,多款模型通过GitHub克隆源码等方式作弊。

阅读原文
7

Zyphra发布ZAYA1-8B,不到10亿激活参数媲美前沿模型

开源模型模型发布

Zyphra发布ZAYA1-8B推理模型,采用混合专家架构,激活参数不到10亿,但在推理、数学和编程任务上表现媲美Claude 4.5 Sonnet和Gemini-2.5-Pro等前沿模型。该模型在AMD Instinct MI300X集群上训练,采用压缩卷积注意力(CCA)和MLP专家路由器等技术创新。Zyphra还推出Markovian RSA方法,实现无界推理同时保持内存成本恒定。模型以Apache 2.0许可在Hugging Face开源,并在Zyphra Cloud提供免费无服务器端点。此举标志着高效AI系统在智能密度方面的重要进展。

阅读原文
8

Luma发布Uni-1.1图像模型API,全球盲测排名第三仅次于OpenAI和Google

图像生成API发布

Luma公司宣布统一图像模型Uni-1.1正式开放API。该模型采用decoder-only自回归Transformer架构,将文本与图像token统一建模,实现理解与生成一体化。在LMArena盲测中,Uni-1.1及Max版本排名全球第三,仅次于OpenAI和Google。API定价极具竞争力,单图最低0.0404美元,延迟和成本均不到同类模型一半。Adidas、Mazda等品牌已接入。模型由不到15人的华人团队研发,核心成员为宋佳铭与沈博魁,未来计划扩展至视频、语音与交互模拟。

阅读原文
9

Google DeepMind与EVE Online开发商合作,利用游戏环境测试AI

AI研究游戏AI

Google DeepMind宣布与太空多人在线游戏《EVE Online》开发商Fenris Creations(原CCP Games,以1.2亿美元买断后独立更名)合作,利用该游戏训练AI技术。EVE Online以高度复杂的玩家驱动经济系统和大规模实时战略互动著称,为AI在长期规划、记忆、持续学习和多智能体协作方面的研究提供理想测试平台。DeepMind将在游戏离线版本上进行实验,避免影响实际玩家。DeepMind负责人Demis Hassabis强调游戏一直是AI研究的重要环境。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。