英伟达发布Vera Rubin平台,MoE性能称提升3.3–5倍
英伟达在3月16日GTC 2026公布Vera Rubin计算平台(Blackwell继任),定位为面向MoE与代理式推理的机架级系统。外部报道称其含3360亿晶体管、采用HBM4,并在MoE工作负载上较前代提升约3.3–5倍。黄仁勋称推理进入“拐点”,公司看到约1万亿美元订单前景;同时发布开源企业代理平台NemoClaw,主打隐私与安全可控部署,并预计未来6–12个月随主流云上线。
阅读原文英伟达在3月16日GTC 2026公布Vera Rubin计算平台(Blackwell继任),定位为面向MoE与代理式推理的机架级系统。外部报道称其含3360亿晶体管、采用HBM4,并在MoE工作负载上较前代提升约3.3–5倍。黄仁勋称推理进入“拐点”,公司看到约1万亿美元订单前景;同时发布开源企业代理平台NemoClaw,主打隐私与安全可控部署,并预计未来6–12个月随主流云上线。
阅读原文英伟达发布开源“Physical AI Data Factory Blueprint”参考架构,试图将机器人、视觉AI代理与自动驾驶的训练数据生产流程标准化:自动化数据生成、增强与评估,结合合成数据、强化学习与模型评测,并利用Cosmos基础模型与编码代理,把有限真实数据扩展为覆盖稀有边缘案例的多样化数据集。微软Azure与Nebius等云厂商已集成该蓝图;英伟达同时开源编排框架OSMO,用于对Claude Code、OpenAI Codex等代理做自动化资源管理。蓝图预计4月在GitHub上线。
阅读原文Meta与Nebius签署为期五年的AI算力协议,总额最高270亿美元:Nebius将自2027年初起交付120亿美元专用计算容量,硬件基于NVIDIA Vera Rubin平台;Meta另可追加购买最多150亿美元的额外容量,并对未售出集群拥有优先购买权。消息公布后,Nebius股价上涨约13%–16%。该合同凸显超大规模客户正以长期合约锁定新一代GPU集群供给,也把“新云/AI原生云”服务商的交付能力与资金需求推到台前。
阅读原文《大英百科全书》与Merriam-Webster于3月16日在纽约联邦法院起诉OpenAI,指称其未经许可复制并使用百科与词典内容训练GPT/ChatGPT,涉及约10万篇文章。诉状称ChatGPT可输出与原文近乎逐字一致的段落,并通过生成式回答分流其订阅与广告流量,构成与内容方的直接竞争。原告同时主张商标被不当引用,要求禁令救济及未披露金额赔偿。OpenAI回应其训练基于公开数据并主张“合理使用”。
阅读原文阿里巴巴宣布成立新AI业务集团“Alibaba Token Hub(ATH)”,整合公司内部分散的通义实验室、MaaS业务线以及Qwen、Wukong等团队,覆盖从基础模型研发到ToB/ToC应用的全链条,并由CEO吴泳铭直接领导。通义实验室仍由阿里云CTO周靖人负责,同时设立基础模型支持团队。报道指出,此举发生在部分核心成员离职、股价回撤等背景下,意在减少重复投入、提升交付效率;Qwen C端业务月活已超1亿。
阅读原文韩国科技部3月16日启动面向国内企业的高性能GPU租赁计划,通过与云服务商合作向AI项目提供2000台以上GPU,以缓解全球GPU短缺对训练与推理的约束。政府为2026年相关资源获取与支持项目编列2.08万亿韩元预算,并称2025年已确保获得1.3万台GPU。该计划对产业界、学界与研究机构开放申请,目标是在算力可及性提升的同时推动本土模型训练、推理部署与应用服务落地,降低中小团队算力门槛。
阅读原文埃森哲宣布已完成收购英国AI公司Faculty。交易后,Faculty联合创始人兼CEO Marc Warner出任埃森哲首席技术官并进入全球管理委员会,Faculty超过400名数据科学家与AI工程师并入埃森哲,增强其在“安全应用AI”与规模化交付方面的人才与工程能力。Faculty的决策智能产品Frontier将纳入埃森哲产品体系,用于帮助公共部门与企业客户构建可扩展的AI解决方案;双方已在生命科学场景与诺华等客户合作。此次收购金额与条款未披露。
阅读原文中科院计算所团队提出面向Agentic RAG的DeepRead框架,针对长文档“结构盲”问题,用OCR抽取章节层级并为段落建立坐标系(doc_id/sec_id/para_idx),让代理能按文档原生结构定位证据;再通过Retrieve与ReadSection两类工具协作,实现“先定位、再连续阅读”的检索—阅读流程。报道给出的实验结果显示,在ContextBench长文档推理上准确率由74.5%提升至91.5%(+17.0%),并在财报与论文分析等复杂任务中减少碎片化检索与重复调用。
阅读原文新加坡数据中心运营商DayOne Data Centers据报道接近向美国SEC提交保密IPO文件,募资规模或约50亿美元,承销商包括美银、花旗、摩根大通与摩根士丹利。公司前身为GDS International,2026年1月刚完成超过20亿美元C轮融资,用于国际扩张。DayOne在新加坡、马来西亚、印尼、泰国、香港、东京及芬兰运营数据中心。若推进上市,或为AI算力与数据中心赛道在本轮周期提供新的资本市场定价锚,并加剧区域机房与电力资源竞争。
阅读原文Nature Machine Intelligence发表一套将大语言模型接入机器人操作系统ROS的框架,目标是把自然语言输出稳定转化为可执行的物理动作。该框架支持将LLM生成结果编译为内联代码或行为树等执行形式,并结合模仿学习获取新技能,再利用人类或环境反馈进行自动化优化与“反思”迭代,以提升长周期任务的鲁棒性。论文展示其在桌面物体重排、动态任务优化与远程监督控制等场景的可扩展性;全部实验基于开源预训练LLM完成,代码已在GitHub公开发布。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。