AI Daily Brief

2026年4月21日星期二

9 点要闻3 分钟阅读

今日要闻

Moonshot AI开源Kimi K2.6，支持300个子Agent协同与1万亿参数MoE架构

开源模型智能体

月之暗面发布并开源Kimi K2.6多模态模型，采用1万亿参数MoE架构（激活32B），支持256K上下文，原生支持图片和视频输入。核心亮点为智能体集群能力，可协调最多300个子Agent执行4000步复杂任务，支持13小时不间断编程。在SWE-Bench Verified上达80.2%，MCPMark从K2.5的29.5提升至55.9。API输入价格约0.95美元/百万token，采用Modified MIT许可证开源，支持vLLM、SGLang等多种部署方式，消费级RTX 4090亦可运行。多个应用已集成该模型，日均调用量达数十亿token。

阅读原文

阿里发布Qwen3.6-Max-Preview，六项编程基准均登顶

大模型编程

阿里通义千问发布旗舰模型预览版Qwen3.6-Max-Preview，在智能体编程、世界知识和指令遵循方面较前代Qwen3.6-Plus显著提升。在SWE-bench Pro、Terminal-Bench 2.0、SkillsBench等六项编程基准中均取得最高分，其中SkillsBench提升9.9、SciCode提升10.8。世界知识方面SuperGPQA提升2.3，QwenChineseBench提升5.3。据ArtificialAnalysis评测，综合表现优于GLM5.1和MiniMax-M2.7，成为当前最强国产大模型。已在Qwen Studio开放使用，即将通过阿里云百炼API提供，兼容OpenAI和Anthropic协议。

阅读原文

GitHub暂停Copilot新用户注册，AI代理工作流致算力成本失控

开发工具商业模式

GitHub于4月20日宣布暂停Copilot Pro、Pro+和学生计划的新用户注册，原因是AI代理驱动的长时间并行化任务导致单次请求计算成本超过用户月费。同时收紧使用限制：Pro计划移除Opus模型访问权限，仅Pro+可使用Opus 4.7；Pro+限额为Pro的5倍以上；Opus 4.5和4.6也将从Pro+中移除。GitHub将在VS Code和CLI中加入用量可视化提示，受影响用户可在5月20日前申请退款。此次调整反映出AI编程助手从辅助补全向自主代理演进过程中，行业普遍面临的算力成本与订阅收入失衡问题。

阅读原文

Recursive Superintelligence获5亿美元融资估值40亿，押注AI递归自我改进

融资AGI

Recursive Superintelligence完成5亿美元融资，由谷歌风投GV和英伟达联合领投，估值达40亿美元。公司由前Google DeepMind和OpenAI工程师创立，致力于构建可自主设计、测试和优化自身代码与架构的AI系统，目标将模型迭代周期从数月缩短至数小时。资金将用于招募顶尖人才及建设大规模计算集群，计划年内启动首次"Level 1"自主训练运行。值得注意的是，公司成立仅四个月、尚未推出任何产品即获得高额估值，引发外界对AI领域资本泡沫的担忧。

阅读原文

英伟达发布Nemotron 3 Super，1200亿参数AI代理专用开放MoE模型

开源模型AI代理

英伟达发布Nemotron 3 Super，一款专为AI代理工作负载设计的1200亿参数开放混合专家模型。该模型采用MoE架构，每次前向传播仅激活127亿参数，可在大幅降低计算成本的同时提供高达7.5倍的性能提升。其开放特性允许开发者在多种场景中部署，包括智能合约安全审计和去中心化预测市场等。此次发布标志着英伟达在AI模型层面进一步布局，从硬件供应商向软硬件一体化生态扩展。

阅读原文

Vercel因员工授权第三方AI工具遭入侵，黑客索价200万美元

安全事件供应链安全

AI云平台Vercel确认发生安全事件，起因是一名员工使用的第三方AI工具Context.ai遭到攻击，黑客通过接管该员工Google Workspace账户获取了对Vercel有限内部系统的访问权限，暴露了部分非敏感环境变量。威胁组织ShinyHunters声称对此负责，正以200万美元价格兜售窃取的数据，包括内部数据库、员工账户和令牌。Vercel已联系执法部门，并建议客户轮换凭证、审查集成配置。此事件凸显了企业环境中不当配置AI工具访问权限带来的供应链安全风险。

阅读原文

英伟达因显存短缺取消2026全年消费级显卡发布，RTX 50系延期至Q3

芯片供应链

受全球存储芯片供应紧张影响，英伟达宣布取消2026全年消费级显卡发布计划，为公司创立以来首次全年无新品。RTX 50 Super系列虽已完成设计，但因显存资源优先供给AI加速器，生产优先级自2025年12月被下调，游戏显卡传统显存供应整体产能或削减最高40%。发布时间推迟至2026年Q3，但能否如期上市仍存变数。旗舰RTX 5090D v2中国建议零售价16499元起，海外部分型号售价超3000美元。若新卡未能年内上市，玩家将面临长达两年的新品空档期。

阅读原文

OpenAI推出Codex Chronicle功能，通过屏幕截图构建开发上下文记忆

开发工具产品发布

OpenAI为Mac版Codex桌面应用推出Chronicle功能，通过后台代理捕获屏幕截图构建本地化记忆，使Codex能理解用户所指的具体内容，如屏幕上的错误信息、正在编辑的文档或过去处理过的项目。数据临时存储于设备本地，用户可随时查看和编辑。该功能目前仅面向Mac Pro订阅用户开放，作为研究预览版提供，需授予屏幕录制与辅助功能权限。OpenAI提醒该功能会快速消耗API调用额度，且其他应用程序可能访问临时存储的截图文件，存在隐私考量。

阅读原文

月之暗面与清华提出PrfaaS跨数据中心推理架构，吞吐量提升54%

基础设施研究

月之暗面与清华大学联合提出Prefill-as-a-Service（PrfaaS）架构，将LLM推理中计算密集的预填充阶段卸载至专用高算力集群，通过普通以太网将KVCache传输至本地解码集群，突破传统RDMA网络限制。得益于混合注意力模型的KVCache压缩（最高36倍），跨数据中心传输成为可行。在使用内部1T参数模型的实测中，PrfaaS较同构基线实现54%吞吐量提升，P90首token延迟降低64%，仅消耗13%可用带宽。该架构结合请求长度路由、分层调度和多连接TCP传输，为大规模LLM服务提供新的基础设施思路。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。