AI Daily Brief

2026年2月12日星期四

10 点要闻3 分钟阅读

今日要闻

智谱开源GLM-5：744B MoE、20万上下文转向Agent工程

大模型开源智能体

智谱AI在Z.ai发布并开源旗舰模型GLM-5，定位从“Vibe Coding”转向“Agentic Engineering”。模型为MoE架构，总参数744B、推理激活40B，预训练数据提升至28.5T tokens，并引入DeepSeek Sparse Attention以降低长上下文部署成本。官方称其在SWE-bench Verified、Terminal-Bench 2.0、Vending Bench 2等长程编码与智能体任务上领先开源模型。权重以MIT许可提供，支持vLLM、SGLang等本地部署与多芯片适配。

阅读原文

DeepSeek升级1M上下文，并被曝2月中旬筹备V4旗舰

大模型长上下文智能体

DeepSeek在网页端与App端更新模型，上下文窗口提升至最高1M tokens，可一次性处理超长文本；报道实测其能识别超过24万token的《简爱》文档。与此同时，另有消息称DeepSeek计划在2月中旬发布新一代旗舰DeepSeek-V4，重点修补此前版本在逻辑任务上的缺陷，并加入更强的自主任务执行（AI代理）能力；该策略被描述为以“低成本高性能”争夺全球市场。以上信息均未披露更完整的技术细节与第三方评测结果。

阅读原文

Palo Alto完成收购CyberArk：统一保护人/机器/AI代理身份

安全并购身份安全

Palo Alto Networks宣布完成对CyberArk的收购，计划将其身份安全平台纳入自身安全生态，以覆盖人类、机器与AI代理的身份与特权访问控制。公告称，机器身份数量已超过人类身份80倍以上，且约75%的组织仍使用过时、权限过宽的身份管理方式，近90%组织经历过以身份为中心的安全事件。Palo Alto将扩展特权访问与最小权限能力，减少静态权限与横向移动风险，并宣称可加快约80%的安全事件响应。CyberArk产品将继续独立运营并逐步整合。

阅读原文

Claude Desktop扩展曝CVSS 10零点击RCE：日历邀请可触发执行

安全漏洞智能体

安全公司LayerX披露，Anthropic的Claude Desktop Extensions（亦被称为MCP Bundles）存在零点击远程代码执行漏洞，CVSS评分10/10。攻击者可通过Google Calendar事件/邀请注入指令，在用户无交互情况下诱导Claude调用本地MCP服务器执行恶意操作，实验链路包括下载、编译并运行代码。研究认为问题根源在于扩展缺乏有效沙箱隔离，以及模型具备高权限工具调用能力。报道指出Anthropic回应称该场景超出其当前威胁模型，因相关集成定位为本地开发工具，安全责任更多由用户侧承担。

阅读原文

Nebius以2.75亿美元收购Tavily：补齐AI代理实时搜索层

并购AI基础设施检索

AI基础设施公司Nebius Group宣布收购以色列初创Tavily，交易初始金额2.75亿美元，若达成里程碑总价可至4亿美元。Tavily提供面向AI代理的搜索API，可从公共与私有来源抽取实时、结构化信息，用于降低LLM幻觉与过时回答风险；报道提到其客户包含Cohere、MongoDB、IBM、AWS等。Nebius计划将Tavily并入自身平台，增强“构建—调优—运行”一体化的代理开发与运行能力，并把实时搜索作为代理系统的关键基础组件之一。交易预计在未来数周内完成。

阅读原文

新加坡发布代理型AI治理框架：强调人类问责与全生命周期控制

政策治理智能体

新加坡资讯通信媒体发展局（IMDA）在世界经济论坛期间发布面向代理型AI（agentic AI）的《AI治理框架》，被称为全球首个针对具备自主决策能力系统的治理指引。框架提出四个核心维度：风险评估、人类问责、技术控制、终端用户责任，要求组织在部署代理系统时明确使用边界、设置人工审批节点，并对开发、上线、运行到下线的全生命周期实施技术管控与审计。文件强调自愿合规与国际标准协同，并意在填补现有政策对“可自主行动”系统的治理空白，为企业规模化落地代理提供可操作的合规参考。

阅读原文

NVIDIA Nemotron 3 Nano 30B登陆SageMaker JumpStart：开源且支持1M上下文

云服务开源大模型

AWS宣布NVIDIA Nemotron 3 Nano 30B MoE模型在Amazon SageMaker JumpStart全面可用。该模型为30B总参数、3B激活参数的MoE小模型，采用Transformer-Mamba混合架构，支持最高100万token上下文窗口，面向编码、科学推理、数学与指令遵循等任务。AWS与NVIDIA强调模型“完全开源”，提供权重、数据集与训练方法，便于企业在自有基础设施上定制与部署以满足隐私与安全需求。开发者可通过SageMaker Studio直接部署，也可使用AWS CLI与SageMaker SDK进行调用与集成。

阅读原文

OpenAI据报解散Mission Alignment团队，负责人转任“首席未来学家”

公司动态AI安全

据Platformer消息并由The Verge转述，OpenAI已解散其Mission Alignment（使命对齐）团队，团队成员被调往公司其他部门。报道提到，该团队原负责围绕“确保AGI造福全人类”的相关工作；原负责人Joshua Achiam将转任OpenAI新设职位“chief futurist（首席未来学家）”。目前公开信息未披露此次调整涉及的具体人员规模、项目交接安排及对外部安全承诺的影响范围。该动向被解读为OpenAI在组织架构上进一步向产品与落地方向倾斜，但公司未在报道中给出更系统的解释。

阅读原文

中芯国际称HBM短缺将持续数年，并警告AI数据中心或过度建设

AI基础设施芯片算力

中芯国际在业绩沟通中表示，AI带动的高端存储需求旺盛，HBM（高带宽内存）短缺预计将持续数年，且关键瓶颈可能从晶圆制造转向后端测试等环节；这也会挤压其他终端市场供给并推升成本。公司同时警告，部分企业试图在1—2年内建设“十年规模”的数据中心算力，若用途规划不足，未来可能出现利用率不及预期的风险。信息还披露其产能利用率达95.7%，并称2025年资本开支为81亿美元，2026年将维持相近水平。

阅读原文

路透：字节跳动与三星谈AI芯片及内存供应以缓解算力链条紧张

芯片供应链大厂动态

路透社援引消息称，字节跳动正与三星就开发AI芯片及获取紧缺的内存芯片供应进行谈判，以应对全球AI基础设施建设带来的供应链压力。报道将其置于“AI数据中心扩张—算力与存储短缺”的大背景下，强调内存等关键部件的供给已成为训练与推理扩张的现实约束。相关谈判的具体合作形式（自研、联合设计或代工）、产能承诺、交付节奏及涉及的产品线未在报道中进一步披露。该动向显示头部内容与平台公司正向上游半导体环节延伸，以降低对通用GPU与外部供给的依赖。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。