返回往期
2026年3月18日星期三
10 点要闻3 分钟阅读

今日要闻

1

IBM完成110亿美元收购Confluent,押注实时数据流驱动企业Agent

并购数据基础设施企业AI

IBM宣布已完成以每股31美元现金收购数据流平台Confluent,企业价值约110亿美元。Confluent基于Apache Kafka,被6500+企业使用,并覆盖约40%《财富》500强客户。IBM计划将其与watsonx.data、IBM MQ、webMethods混合集成及IBM Z等产品打通,面向混合云提供事件驱动自动化与实时分析,让企业AI与智能代理能基于实时数据(而非离线批处理)触发工作流与决策。

阅读原文
2

OpenAI推GPT-5.4 mini/nano:40万上下文,nano低至$0.20/百万token

模型发布推理成本API

OpenAI发布两款更“硬件友好”的GPT-5.4系列:GPT-5.4 mini与GPT-5.4 nano。报道称mini在编程与计算机操作任务上可达GPT-5.4约95%表现,上下文窗口40万token并支持图文输入,API价格为输入$0.75/百万token、输出$4.5/百万token。nano面向抽取、分类等轻任务,仅API提供,定价输入$0.20/百万、输出$1.25/百万;按该价格批量为约7.6万张照片生成描述约需52美元。

阅读原文
3

乐天开源Rakuten AI 3.0:约7000亿参数MoE,Apache 2.0可商用

开源模型日本MoE

乐天集团宣布开始提供“Rakuten AI 3.0”,称为日本国内最大规模的高性能模型之一,采用约7000亿参数的MoE架构并针对日语优化。该模型作为日本经产省与NEDO推动的GENIAC项目成果之一,使用乐天自有高质量双语数据训练,并在多项日语基准(文化历史知识、研究生级推理、竞赛数学、指令遵循等)上表现突出。官方表示模型以Apache 2.0许可证公开,并可通过Hugging Face官方仓库免费下载与使用。

阅读原文
4

Mistral开源Small 4:119B MoE+256K上下文,速度+40%吞吐×3

开源模型多模态MoE

Mistral AI发布并开源Mistral Small 4,总参数约1190亿,采用MoE架构:128个专家中每次动态激活4个,约60亿参数参与计算。模型提供快速与深度思考两种模式,并支持256K上下文与图像输入;还提供可配置推理强度参数以在成本与效果间权衡。多篇报道称其相较前代完成速度提升40%、吞吐提升3倍,并以Apache 2.0许可开放,已在Hugging Face、Mistral API及NVIDIA相关平台上线;自托管据称至少需4块H100级GPU。

阅读原文
5

钉钉发布企业Agent平台“悟空”,底层GUI重构为CLI+开放API

企业应用AI Agent办公协同

阿里巴巴旗下钉钉在发布会上推出企业级AI原生工作平台“悟空”,定位为企业工作流的统一Agent入口,并表示将服务于钉钉覆盖的超2000万企业组织。官方介绍其完成底层代码重写,将原GUI重构为CLI与开放API,便于AI以“命令”原生调用钉钉能力,强调沟通即执行、任务透明可干预。平台还推出自研AI原生文件系统RealDoc,支持精准文件操作、修改追溯与版本秒级回退,并提出六层企业安全体系与首批OPT(一人团队)行业方案,即日起邀请制测试。

阅读原文
6

OpenRouter数据:国产模型周调用4.69万亿Token,连续两周超过美国

行业数据大模型中国

36氪援引OpenRouter平台数据称,2026年3月9日至3月15日当周,中国大模型调用量达4.69万亿Token,连续两周超过美国的3.294万亿Token;此前一周中国为4.19万亿、美国为3.63万亿。榜单前三均为中国模型:MiniMax M2.5(1.75万亿)、阶跃星辰Step 3.5 Flash (free)(1.34万亿)与DeepSeek V3.2(1.04万亿)。同时一款名为“Hunter Alpha”的国产模型新晋第七,调用0.666万亿Token,报道其具备1万亿参数与100万Token上下文,面向智能体应用。

阅读原文
7

微软合并消费与商用Copilot团队,拟统一体验并加强模型研发线

组织调整产品策略AI助手

微软被报道宣布重组Copilot组织架构,将Microsoft 365 Copilot与消费者版Copilot团队合并,称组织将更贴近系统架构与产品形态,以提供更连贯的体验。报道指出,Jacob Andreou将负责跨消费与商业的Copilot产品设计、增长与工程;Microsoft AI CEO Mustafa Suleyman将更聚焦AI模型研发及“超级智能”目标。公司同时提到未来计划统一商用与消费端Copilot体验,以减少产品与组织割裂带来的协作成本,并在竞争加剧背景下强化产品推进效率。

阅读原文
8

肯尼亚提出《2026年AI法案》:设AI专员,违规最高罚500万先令或监禁

监管政策AI治理深伪

肯尼亚正在推进《2026年人工智能法案》,提议设立“人工智能专员办公室”作为全国性监管机构,建立基于风险的分类治理框架,并赋予公民挑战自动化决策、请求人工复核与获得解释的权利。法案重点针对滥用生成式AI制造误导性或有害内容,尤其是未经同意的深度伪造,规定个人或组织最高可被处以500万肯尼亚先令罚款或两年监禁(或并罚)。同时要求技术提供者对AI生成内容进行明确标注,降低政治与公共传播场景的虚假信息风险。

阅读原文
9

Niv-AI获1200万美元种子轮,瞄准数据中心GPU功耗波动导致的30%降频

融资数据中心能耗

初创公司Niv-AI宣布走出隐身并完成1200万美元种子轮融资,目标是提升GPU电力使用效率。公司指出数据中心常因瞬时功耗波动而被迫将GPU性能下调,最高可能导致约30%的算力浪费。其方案是在机架侧部署传感器,以毫秒级精度监测GPU功耗并建模不同训练/推理任务的电力特征,进而用软件工具预测与协调整体功耗,帮助工程师在不新增硬件的情况下提高利用率并减轻电网压力。Niv-AI计划未来6–8个月在美国少数数据中心落地部署。

阅读原文
10

研究:README隐藏指令可诱导AI代理泄露数据,直接注入成功率达85%

安全AI Agent提示注入

研究人员警告,攻击者可在开源项目README或其链接文档中隐藏“语义注入”指令,诱导AI代理在执行安装/配置等步骤时外传本地敏感数据。团队基于ReadSecBench(含500个真实开源项目README,覆盖Java/Python/C/C++/JavaScript)进行测试,结果显示直接命令式恶意指令触发成功率约85%,若指令藏在两层外的链接文档中成功率仍可达91%;测试覆盖Claude、GPT与Gemini等多种模型驱动代理。研究指出人类审查者与现有自动化检测工具均难以识别,并建议将外部文档视为“部分可信输入”,对高敏操作引入分级验证。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。