Anthropic于5月28日发布Claude Opus 4.8,在编程、Agent和复杂推理方面显著提升。新增用户可控"思考投入"机制,快速模式速度提升2.5倍、成本降至此前三分之一(输入$10/输出$50每百万token),标准定价不变。诚实度大幅提高,产出无依据结论概率降低约四倍。推出"动态工作流"功能,可协调数百个子Agent并行处理大规模任务,如数十万行代码库迁移,已有用户用其11天内将Bun从Zig移植至Rust(75万行代码),测试套件通过率99.8%。Online-Mind2Web基准得分84%,SWE-bench Verified达88.6%,均优于GPT-5.5。模型已通过Claude API及AWS、谷歌云等平台上线。
Google DeepMind CEO Demis Hassabis在Google I/O 2026上表示,AGI可能最早于2029年出现,比此前预测提前一年。他称人类正处于"奇点的山麓",AI已具备初步"软自我改进"能力,如编码助手加速研发进程。Hassabis警告社会尚未为AI快速发展做好准备,政策行动速度远落后于技术发展,呼吁各国政府加快AI安全监管。他透露主要AI公司正在讨论未来安全框架,但准备窗口期正在迅速关闭。对于美国推动AI模型发布前政府测试义务化,他评价为"正确方向的一步"。
Mistral AI在首届发布会上全面扩展为全栈企业AI提供商:推出Mistral for Industrial Engineering平台,将LLM与物理仿真结合服务航空航天和汽车行业,已在Airbus、BMW、EDF投产;宣布Mistral Compute计划投资40亿欧元在欧洲建设1GW数据中心容量;将Le Chat重新品牌为Vibe统一Agent平台,涵盖企业工作流和编码Agent;整合Pixtral等专用模型能力至旗舰Mistral Medium 3.5,转向原生多模态推理模型策略。核心定位是通过开放权重模型和自有基础设施为不愿将数据交给美国超大规模云厂商的企业和政府服务。