返回往期
2026年2月12日星期四
10 点要闻3 分钟阅读

今日要闻

1

智谱开源GLM-5:744B MoE、20万上下文转向Agent工程

大模型开源智能体

智谱AI在Z.ai发布并开源旗舰模型GLM-5,定位从“Vibe Coding”转向“Agentic Engineering”。模型为MoE架构,总参数744B、推理激活40B,预训练数据提升至28.5T tokens,并引入DeepSeek Sparse Attention以降低长上下文部署成本。官方称其在SWE-bench Verified、Terminal-Bench 2.0、Vending Bench 2等长程编码与智能体任务上领先开源模型。权重以MIT许可提供,支持vLLM、SGLang等本地部署与多芯片适配。

阅读原文
2

DeepSeek升级1M上下文,并被曝2月中旬筹备V4旗舰

大模型长上下文智能体

DeepSeek在网页端与App端更新模型,上下文窗口提升至最高1M tokens,可一次性处理超长文本;报道实测其能识别超过24万token的《简爱》文档。与此同时,另有消息称DeepSeek计划在2月中旬发布新一代旗舰DeepSeek-V4,重点修补此前版本在逻辑任务上的缺陷,并加入更强的自主任务执行(AI代理)能力;该策略被描述为以“低成本高性能”争夺全球市场。以上信息均未披露更完整的技术细节与第三方评测结果。

阅读原文
3

Palo Alto完成收购CyberArk:统一保护人/机器/AI代理身份

安全并购身份安全

Palo Alto Networks宣布完成对CyberArk的收购,计划将其身份安全平台纳入自身安全生态,以覆盖人类、机器与AI代理的身份与特权访问控制。公告称,机器身份数量已超过人类身份80倍以上,且约75%的组织仍使用过时、权限过宽的身份管理方式,近90%组织经历过以身份为中心的安全事件。Palo Alto将扩展特权访问与最小权限能力,减少静态权限与横向移动风险,并宣称可加快约80%的安全事件响应。CyberArk产品将继续独立运营并逐步整合。

阅读原文
4

Claude Desktop扩展曝CVSS 10零点击RCE:日历邀请可触发执行

安全漏洞智能体

安全公司LayerX披露,Anthropic的Claude Desktop Extensions(亦被称为MCP Bundles)存在零点击远程代码执行漏洞,CVSS评分10/10。攻击者可通过Google Calendar事件/邀请注入指令,在用户无交互情况下诱导Claude调用本地MCP服务器执行恶意操作,实验链路包括下载、编译并运行代码。研究认为问题根源在于扩展缺乏有效沙箱隔离,以及模型具备高权限工具调用能力。报道指出Anthropic回应称该场景超出其当前威胁模型,因相关集成定位为本地开发工具,安全责任更多由用户侧承担。

阅读原文
5

Nebius以2.75亿美元收购Tavily:补齐AI代理实时搜索层

并购AI基础设施检索

AI基础设施公司Nebius Group宣布收购以色列初创Tavily,交易初始金额2.75亿美元,若达成里程碑总价可至4亿美元。Tavily提供面向AI代理的搜索API,可从公共与私有来源抽取实时、结构化信息,用于降低LLM幻觉与过时回答风险;报道提到其客户包含Cohere、MongoDB、IBM、AWS等。Nebius计划将Tavily并入自身平台,增强“构建—调优—运行”一体化的代理开发与运行能力,并把实时搜索作为代理系统的关键基础组件之一。交易预计在未来数周内完成。

阅读原文
6

新加坡发布代理型AI治理框架:强调人类问责与全生命周期控制

政策治理智能体

新加坡资讯通信媒体发展局(IMDA)在世界经济论坛期间发布面向代理型AI(agentic AI)的《AI治理框架》,被称为全球首个针对具备自主决策能力系统的治理指引。框架提出四个核心维度:风险评估、人类问责、技术控制、终端用户责任,要求组织在部署代理系统时明确使用边界、设置人工审批节点,并对开发、上线、运行到下线的全生命周期实施技术管控与审计。文件强调自愿合规与国际标准协同,并意在填补现有政策对“可自主行动”系统的治理空白,为企业规模化落地代理提供可操作的合规参考。

阅读原文
7

NVIDIA Nemotron 3 Nano 30B登陆SageMaker JumpStart:开源且支持1M上下文

云服务开源大模型

AWS宣布NVIDIA Nemotron 3 Nano 30B MoE模型在Amazon SageMaker JumpStart全面可用。该模型为30B总参数、3B激活参数的MoE小模型,采用Transformer-Mamba混合架构,支持最高100万token上下文窗口,面向编码、科学推理、数学与指令遵循等任务。AWS与NVIDIA强调模型“完全开源”,提供权重、数据集与训练方法,便于企业在自有基础设施上定制与部署以满足隐私与安全需求。开发者可通过SageMaker Studio直接部署,也可使用AWS CLI与SageMaker SDK进行调用与集成。

阅读原文
8

OpenAI据报解散Mission Alignment团队,负责人转任“首席未来学家”

公司动态AI安全

据Platformer消息并由The Verge转述,OpenAI已解散其Mission Alignment(使命对齐)团队,团队成员被调往公司其他部门。报道提到,该团队原负责围绕“确保AGI造福全人类”的相关工作;原负责人Joshua Achiam将转任OpenAI新设职位“chief futurist(首席未来学家)”。目前公开信息未披露此次调整涉及的具体人员规模、项目交接安排及对外部安全承诺的影响范围。该动向被解读为OpenAI在组织架构上进一步向产品与落地方向倾斜,但公司未在报道中给出更系统的解释。

阅读原文
9

中芯国际称HBM短缺将持续数年,并警告AI数据中心或过度建设

AI基础设施芯片算力

中芯国际在业绩沟通中表示,AI带动的高端存储需求旺盛,HBM(高带宽内存)短缺预计将持续数年,且关键瓶颈可能从晶圆制造转向后端测试等环节;这也会挤压其他终端市场供给并推升成本。公司同时警告,部分企业试图在1—2年内建设“十年规模”的数据中心算力,若用途规划不足,未来可能出现利用率不及预期的风险。信息还披露其产能利用率达95.7%,并称2025年资本开支为81亿美元,2026年将维持相近水平。

阅读原文
10

路透:字节跳动与三星谈AI芯片及内存供应以缓解算力链条紧张

芯片供应链大厂动态

路透社援引消息称,字节跳动正与三星就开发AI芯片及获取紧缺的内存芯片供应进行谈判,以应对全球AI基础设施建设带来的供应链压力。报道将其置于“AI数据中心扩张—算力与存储短缺”的大背景下,强调内存等关键部件的供给已成为训练与推理扩张的现实约束。相关谈判的具体合作形式(自研、联合设计或代工)、产能承诺、交付节奏及涉及的产品线未在报道中进一步披露。该动向显示头部内容与平台公司正向上游半导体环节延伸,以降低对通用GPU与外部供给的依赖。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。