AI Daily Brief

2026年3月10日星期二

10 点要闻3 分钟阅读

今日要闻

微软推Copilot Cowork与Agent 365：$15/人月

企业AIAI Agent产品发布

微软发布Microsoft 365 Copilot Wave 3，引入可执行长流程任务的Copilot Cowork（与Anthropic Claude合作），在企业租户内完成会议准备、邮件与日程等多步骤工作，并通过Work IQ注入组织上下文以提升可信度。微软同时宣布Agent 365管控平台将于5月1日商用，定价15美元/用户/月；并推出E7 Frontier Suite，99美元/用户/月整合E5、Copilot与Agent 365。官方披露Copilot付费席位同比增160%+、日活使用量增10倍。

阅读原文

Anthropic起诉美国国防部，挑战“供应链风险”禁令

政策与监管AI安全公司动态

Anthropic对美国国防部提起诉讼，要求推翻其被列为“供应链风险”的决定。公司称禁令与其坚持反对大规模国内监控、反对完全自主武器等“红线”有关，并指控政府构成非法报复，涉嫌违反宪法第一与第五修正案。此前国防部要求联邦机构在6个月内停止使用Claude相关技术，已触发多部门终止合作与供应链合规压力。此案把前沿模型治理分歧推向司法程序，后续可能影响政府采购与企业国防合作边界。

阅读原文

Nscale获20亿美元C轮，估值146亿美元

融资数据中心AI算力

英国AI数据中心初创公司Nscale完成20亿美元C轮融资，估值升至146亿美元；Aker ASA与8090 Industries领投，参投方包括英伟达、Citadel、Dell、Lenovo与Nokia等。公司成立于2024年，主打垂直整合AI基础设施（GPU计算、网络、数据服务与编排软件）并在欧美亚运营数据中心，同时宣布引入Sheryl Sandberg、Nick Clegg与Susan Decker加入董事会。报道还称其与微软达成140亿美元扩展合作，并与OpenAI在挪威联合建设名为Stargate的数据中心，后续计划推进IPO。

阅读原文

CoreWeave称2026算力基本售罄，CapEx 300–350亿美元

AI算力云基础设施行业数据

CoreWeave在会议上表示，受“难以满足”的AI需求推动，其2026年计算容量已基本售罄，客户从AI实验室扩展到云巨头与大型企业，合同期限拉长至5–6年，覆盖A100、H100、H200与Blackwell等多代GPU。公司给出资本开支预期300亿–350亿美元（中值325亿美元），并称随着部署完成，贡献利润率可达约25%，Q1为利润低点。其还透露拥有43个运营站点，电力规划提前12–18个月推进，并正探索对外销售软件栈以提升利润率。

阅读原文

Dify获3000万美元Pre-A，估值1.8亿美元

融资开源AI Agent

开源AI应用与智能体工作流平台Dify宣布完成3000万美元Pre-A轮融资，估值1.8亿美元，由HSG领投，GL Ventures、5Y Capital等参投。公司称自2023年推出以来，其开源版本运行在超过140万台设备上，商业版已被280家企业与2000多个团队用于构建生产级应用，客户包括Maersk、ETS、Anker与Novartis等。Dify提供可视化工作流编排、提示与工具管理、知识检索、调试与API部署等能力，资金将用于增强智能体核心能力、扩建企业级性能与合规团队并降低上手门槛。

阅读原文

CACI完成26亿美元收购ARKA，强化Agentic AI情报能力

并购国防AI产业链

CACI International宣布完成对ARKA Group的收购，交易为26亿美元全现金。CACI称该并购将其在地理空间情报与国家安全太空项目的能力前移：获得电光/红外（EO/IR）与高光谱成像等传感器技术，并整合ARKA基于Agentic AI的软件能力，以提升多源情报处理与任务支撑。ARKA 1100+名员工将加入CACI，扩大其在情报界、美国太空军与国防部相关项目的人才与交付能力。该交易也意味着传统IT服务商向“传感器+代理AI软件”的更垂直整合路径靠拢。

阅读原文

Databricks发布Kasal：原生可视化多Agent编排与监控

Agentic AILLMOps产品发布

Databricks发布Kasal，定位为“Databricks-native、UI-first”的多智能体工作流框架，提供拖拽式画布与对话式助手，面向非技术用户与工程团队统一建模、部署与监控多Agent系统。Kasal与Databricks生态深度集成：可利用MLflow进行追踪与可观测性，借助Vector Search承载记忆/检索，并通过Databricks Apps在受控环境中部署，继承现有治理与认证体系。其关键能力是从可视化原型一键导出为标准Python代码/Notebook，便于工程化扩展与接入外部MCP服务器，降低“原型到生产”的断层成本。

阅读原文

IBM开源Granite 4.0 1B Speech，Apache 2.0授权

开源模型语音边缘AI

IBM发布并开源Granite 4.0 1B Speech语音-语言模型，主打边缘设备部署的多语种ASR/双向语音翻译（AST），采用Apache 2.0许可并原生支持Transformers与vLLM。官方信息称该1B模型在转写准确率与推理性能上较其2.2B前代更优，并通过speculative decoding提升实时推理速度；同时加入keyword biasing能力，可针对企业常见的缩写、专有名词等进行偏置识别以降低漏识别。文章还提到其在OpenASR榜单排名靠前，强调“小模型+工程优化”在端侧语音场景的可行性。

阅读原文

Cloudflare推有状态API漏洞扫描器，用LLM自动建调用图

安全APILLM应用

Cloudflare发布“有状态”API漏洞扫描器，面向传统DAST难以覆盖的逻辑型漏洞（如BOLA）。其核心思路是把OpenAPI文档转为可执行的API调用图，并在“资源创建→权限验证→越权尝试”等多步链路中自动推进测试；当文档不完整或含糊时，引入LLM推断端点依赖、字段命名与数据关系，减少人工配置成本。为降低主动扫描带来的密钥风险，方案使用HashiCorp Vault Transit对凭据进行加密，并在受限的Rust执行环境中解密与发起最终请求，强调把“主动防御”自动化、工程化。

阅读原文

PoC披露llama.cpp推理可篡改GGUF权重以持久在线操纵输出

安全推理部署开源生态

研究者公开PoC演示：在llama.cpp的llama-server默认使用MAP_SHARED方式mmap模型文件时，攻击者只需具备本地文件写入权限，即可在运行中修改磁盘上的GGUF量化权重，内核页缓存同步后服务端会读取到被篡改的权重，从而对输出形成“持久性”操控。示例通过调大output.weight中与特定token对应行的缩放因子，使其logit被系统性放大，进而主导生成结果；无需ptrace、进程注入或重启。作者给出缓解建议：只读挂载模型、限制文件权限或使用--no-mmap等，并指出该攻击对量化格式与张量布局有一定前置条件。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。