AI Daily Brief

2026年5月29日星期五

10 点要闻3 分钟阅读

今日要闻

Anthropic完成650亿美元H轮融资，估值达9650亿美元接近万亿

融资Anthropic

Anthropic于5月28日宣布完成650亿美元H轮融资，投后估值达9650亿美元，超越OpenAI（8520亿美元）成为全球估值最高的AI初创企业。本轮由Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capital共同领投，三星、SK Hynix、美光等战略伙伴参与，其中包含亚马逊此前承诺的50亿美元。公司年化收入已超470亿美元，预计营收将激增130%并有望首次实现运营盈利。自2021年成立以来累计融资近1440亿美元，此轮可能是其IPO前最后一轮私人融资。资金将用于安全研究、算力扩展及Claude产品线拓展。

阅读原文

Anthropic发布Claude Opus 4.8，快速模式成本降至三分之一，新增动态工作流

模型发布Anthropic编程

Anthropic于5月28日发布Claude Opus 4.8，在编程、Agent和复杂推理方面显著提升。新增用户可控"思考投入"机制，快速模式速度提升2.5倍、成本降至此前三分之一（输入$10/输出$50每百万token），标准定价不变。诚实度大幅提高，产出无依据结论概率降低约四倍。推出"动态工作流"功能，可协调数百个子Agent并行处理大规模任务，如数十万行代码库迁移，已有用户用其11天内将Bun从Zig移植至Rust（75万行代码），测试套件通过率99.8%。Online-Mind2Web基准得分84%，SWE-bench Verified达88.6%，均优于GPT-5.5。模型已通过Claude API及AWS、谷歌云等平台上线。

阅读原文

DeepSeek发布V3.2和V3.2-Speciale，开源模型性能媲美GPT-5

模型发布开源DeepSeek

DeepSeek在ChatGPT三周年之际推出两款新模型：V3.2主打性价比，支持128K上下文，首次实现"边思考边用工具"的Agent能力，性能媲美GPT-5；Speciale版专注极限推理，在IMO、IOI、ICPC等国际竞赛中获金牌水平成绩。模型采用DSA稀疏注意力机制提升效率，通过"专家蒸馏+混合强化学习"框架增强能力，并构建大规模智能体流水线实现AI自我进化。两款模型均已开源，权重发布于HuggingFace和ModelScope。此次发布标志着开源模型在推理与Agent能力上已接近甚至超越顶级闭源模型。

阅读原文

DeepMind CEO Hassabis预测AGI最早2029年到来，警告社会未做好准备

AGI行业观点

Google DeepMind CEO Demis Hassabis在Google I/O 2026上表示，AGI可能最早于2029年出现，比此前预测提前一年。他称人类正处于"奇点的山麓"，AI已具备初步"软自我改进"能力，如编码助手加速研发进程。Hassabis警告社会尚未为AI快速发展做好准备，政策行动速度远落后于技术发展，呼吁各国政府加快AI安全监管。他透露主要AI公司正在讨论未来安全框架，但准备窗口期正在迅速关闭。对于美国推动AI模型发布前政府测试义务化，他评价为"正确方向的一步"。

阅读原文

SpaceX自研C语言AI训练栈，声称训练速度提升10倍以上

AI基础设施SpaceX

SpaceX在马斯克领导下完成全新AI训练软件栈Version 1.0部署，完全用C语言编写，专为22万块NVIDIA GB300 GPU和800G网络集群优化。该系统通过精确映射硬件拓扑、深度流水线并行、贴近裸金属运行，消除Python解释器和通用框架开销，声称在大型训练任务中性能超过Google JAX框架一个数量级。模型FLOPS利用率（MFU）有望超过80%，远高于主流50%-67%水平。可将原本需2-3个月的预训练缩短至约1周，或在相同时间内训练10倍规模模型。马斯克表示下一步将用C编写推理栈以支持大规模强化学习。

阅读原文

思科研究发现前沿AI模型在多轮攻击下安全性显著下降，最高ASR达88%

AI安全研究

思科AI威胁情报团队测试了15个来自OpenAI、Anthropic、Google、Amazon和xAI的前沿模型，发现多轮提示注入攻击成功率远高于单轮。xAI的Grok 4.1 Fast多轮ASR达88.3%（单轮34.1%），GPT-5.4从2.7%升至24.7%，Gemini 3 Pro从18%升至73%。研究指出当前主流基准依赖单轮评估可能导致"安全粉饰"，无法反映真实攻击场景。启用推理模式可使攻击成功率下降超40个百分点。研究建议厂商应公布多轮ASR数据，对差距超15个百分点的模型需进行人工安全审查。

阅读原文

Mistral AI发布工业AI平台和Vibe品牌，宣布40亿欧元数据中心投资

模型发布Mistral AI工业AI

Mistral AI在首届发布会上全面扩展为全栈企业AI提供商：推出Mistral for Industrial Engineering平台，将LLM与物理仿真结合服务航空航天和汽车行业，已在Airbus、BMW、EDF投产；宣布Mistral Compute计划投资40亿欧元在欧洲建设1GW数据中心容量；将Le Chat重新品牌为Vibe统一Agent平台，涵盖企业工作流和编码Agent；整合Pixtral等专用模型能力至旗舰Mistral Medium 3.5，转向原生多模态推理模型策略。核心定位是通过开放权重模型和自有基础设施为不愿将数据交给美国超大规模云厂商的企业和政府服务。

阅读原文

伊利诺伊州通过美国最强AI安全法案，要求前沿AI公司提交安全计划和第三方审计

AI监管政策

伊利诺伊州立法机构通过SB315法案，成为继纽约和加州之后第三个规范前沿AI技术的美国州。法案要求年收入超5亿美元且具备大规模计算能力的AI公司建立并公布透明度框架，聘请第三方审计机构确保合规，关键安全事件须在72小时内报告（紧急情况24小时）。违规最高处罚300万美元/次，禁止私人诉讼，2028年生效。OpenAI和Anthropic支持该法案，视其为建立行业基准。法案已提交州长签署。

阅读原文

Liquid AI发布LFM2.5-8B-A1B设备端MoE模型，M5 Max上解码速度达253 tokens/s

模型发布边缘AI开源

Liquid AI发布LFM2.5-8B-A1B，专为设备端部署设计的稀疏MoE模型，总参数83亿但每token仅激活15亿参数。支持128K上下文窗口，覆盖9种语言。预训练数据从12T扩展至38T tokens，词表翻倍至128K。通过两阶段强化学习优化，非幻觉率从7.46提升至63.47。在M5 Max CPU上解码速度达253 tokens/s，手机端约30 tokens/s，单张H100可达18.5K tokens/s。支持llama.cpp、MLX、vLLM等框架，开源权重基于LFM1.0许可发布。

阅读原文

中国两部门联合发布AI计量体系建设指引，推动AI性能"可测量、可比较、可追溯"

政策中国AI

中国国家市场监管总局与国家发改委联合印发《人工智能计量体系和能力建设指引(2026版)》，围绕基础支撑、通用技术、核心技术等六大方面系统布局。指引旨在解决算法"黑箱"、决策可解释性差等问题，部署AI系统内部状态监测与表征等关键技术攻关，建立可靠、安全、可信的AI计量标准。支持建设国家级计量技术研发中心，构建覆盖算法、算力、数据全链条的计量能力，并建立高质量数据集共享机制。标志着中国AI发展从"扩规模"转向"强根基"，推动计量技术融入14个重点领域。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。