返回往期
2026年4月21日星期二
9 点要闻3 分钟阅读

今日要闻

1

Moonshot AI开源Kimi K2.6,支持300个子Agent协同与1万亿参数MoE架构

开源模型智能体

月之暗面发布并开源Kimi K2.6多模态模型,采用1万亿参数MoE架构(激活32B),支持256K上下文,原生支持图片和视频输入。核心亮点为智能体集群能力,可协调最多300个子Agent执行4000步复杂任务,支持13小时不间断编程。在SWE-Bench Verified上达80.2%,MCPMark从K2.5的29.5提升至55.9。API输入价格约0.95美元/百万token,采用Modified MIT许可证开源,支持vLLM、SGLang等多种部署方式,消费级RTX 4090亦可运行。多个应用已集成该模型,日均调用量达数十亿token。

阅读原文
2

阿里发布Qwen3.6-Max-Preview,六项编程基准均登顶

大模型编程

阿里通义千问发布旗舰模型预览版Qwen3.6-Max-Preview,在智能体编程、世界知识和指令遵循方面较前代Qwen3.6-Plus显著提升。在SWE-bench Pro、Terminal-Bench 2.0、SkillsBench等六项编程基准中均取得最高分,其中SkillsBench提升9.9、SciCode提升10.8。世界知识方面SuperGPQA提升2.3,QwenChineseBench提升5.3。据ArtificialAnalysis评测,综合表现优于GLM5.1和MiniMax-M2.7,成为当前最强国产大模型。已在Qwen Studio开放使用,即将通过阿里云百炼API提供,兼容OpenAI和Anthropic协议。

阅读原文
3

GitHub暂停Copilot新用户注册,AI代理工作流致算力成本失控

开发工具商业模式

GitHub于4月20日宣布暂停Copilot Pro、Pro+和学生计划的新用户注册,原因是AI代理驱动的长时间并行化任务导致单次请求计算成本超过用户月费。同时收紧使用限制:Pro计划移除Opus模型访问权限,仅Pro+可使用Opus 4.7;Pro+限额为Pro的5倍以上;Opus 4.5和4.6也将从Pro+中移除。GitHub将在VS Code和CLI中加入用量可视化提示,受影响用户可在5月20日前申请退款。此次调整反映出AI编程助手从辅助补全向自主代理演进过程中,行业普遍面临的算力成本与订阅收入失衡问题。

阅读原文
4

Recursive Superintelligence获5亿美元融资估值40亿,押注AI递归自我改进

融资AGI

Recursive Superintelligence完成5亿美元融资,由谷歌风投GV和英伟达联合领投,估值达40亿美元。公司由前Google DeepMind和OpenAI工程师创立,致力于构建可自主设计、测试和优化自身代码与架构的AI系统,目标将模型迭代周期从数月缩短至数小时。资金将用于招募顶尖人才及建设大规模计算集群,计划年内启动首次"Level 1"自主训练运行。值得注意的是,公司成立仅四个月、尚未推出任何产品即获得高额估值,引发外界对AI领域资本泡沫的担忧。

阅读原文
5

英伟达发布Nemotron 3 Super,1200亿参数AI代理专用开放MoE模型

开源模型AI代理

英伟达发布Nemotron 3 Super,一款专为AI代理工作负载设计的1200亿参数开放混合专家模型。该模型采用MoE架构,每次前向传播仅激活127亿参数,可在大幅降低计算成本的同时提供高达7.5倍的性能提升。其开放特性允许开发者在多种场景中部署,包括智能合约安全审计和去中心化预测市场等。此次发布标志着英伟达在AI模型层面进一步布局,从硬件供应商向软硬件一体化生态扩展。

阅读原文
6

Vercel因员工授权第三方AI工具遭入侵,黑客索价200万美元

安全事件供应链安全

AI云平台Vercel确认发生安全事件,起因是一名员工使用的第三方AI工具Context.ai遭到攻击,黑客通过接管该员工Google Workspace账户获取了对Vercel有限内部系统的访问权限,暴露了部分非敏感环境变量。威胁组织ShinyHunters声称对此负责,正以200万美元价格兜售窃取的数据,包括内部数据库、员工账户和令牌。Vercel已联系执法部门,并建议客户轮换凭证、审查集成配置。此事件凸显了企业环境中不当配置AI工具访问权限带来的供应链安全风险。

阅读原文
7

英伟达因显存短缺取消2026全年消费级显卡发布,RTX 50系延期至Q3

芯片供应链

受全球存储芯片供应紧张影响,英伟达宣布取消2026全年消费级显卡发布计划,为公司创立以来首次全年无新品。RTX 50 Super系列虽已完成设计,但因显存资源优先供给AI加速器,生产优先级自2025年12月被下调,游戏显卡传统显存供应整体产能或削减最高40%。发布时间推迟至2026年Q3,但能否如期上市仍存变数。旗舰RTX 5090D v2中国建议零售价16499元起,海外部分型号售价超3000美元。若新卡未能年内上市,玩家将面临长达两年的新品空档期。

阅读原文
8

OpenAI推出Codex Chronicle功能,通过屏幕截图构建开发上下文记忆

开发工具产品发布

OpenAI为Mac版Codex桌面应用推出Chronicle功能,通过后台代理捕获屏幕截图构建本地化记忆,使Codex能理解用户所指的具体内容,如屏幕上的错误信息、正在编辑的文档或过去处理过的项目。数据临时存储于设备本地,用户可随时查看和编辑。该功能目前仅面向Mac Pro订阅用户开放,作为研究预览版提供,需授予屏幕录制与辅助功能权限。OpenAI提醒该功能会快速消耗API调用额度,且其他应用程序可能访问临时存储的截图文件,存在隐私考量。

阅读原文
9

月之暗面与清华提出PrfaaS跨数据中心推理架构,吞吐量提升54%

基础设施研究

月之暗面与清华大学联合提出Prefill-as-a-Service(PrfaaS)架构,将LLM推理中计算密集的预填充阶段卸载至专用高算力集群,通过普通以太网将KVCache传输至本地解码集群,突破传统RDMA网络限制。得益于混合注意力模型的KVCache压缩(最高36倍),跨数据中心传输成为可行。在使用内部1T参数模型的实测中,PrfaaS较同构基线实现54%吞吐量提升,P90首token延迟降低64%,仅消耗13%可用带宽。该架构结合请求长度路由、分层调度和多连接TCP传输,为大规模LLM服务提供新的基础设施思路。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。