1
微软推Copilot Cowork与Agent 365:$15/人月
企业AIAI Agent产品发布
微软发布Microsoft 365 Copilot Wave 3,引入可执行长流程任务的Copilot Cowork(与Anthropic Claude合作),在企业租户内完成会议准备、邮件与日程等多步骤工作,并通过Work IQ注入组织上下文以提升可信度。微软同时宣布Agent 365管控平台将于5月1日商用,定价15美元/用户/月;并推出E7 Frontier Suite,99美元/用户/月整合E5、Copilot与Agent 365。官方披露Copilot付费席位同比增160%+、日活使用量增10倍。
阅读原文2
Anthropic起诉美国国防部,挑战“供应链风险”禁令
政策与监管AI安全公司动态
Anthropic对美国国防部提起诉讼,要求推翻其被列为“供应链风险”的决定。公司称禁令与其坚持反对大规模国内监控、反对完全自主武器等“红线”有关,并指控政府构成非法报复,涉嫌违反宪法第一与第五修正案。此前国防部要求联邦机构在6个月内停止使用Claude相关技术,已触发多部门终止合作与供应链合规压力。此案把前沿模型治理分歧推向司法程序,后续可能影响政府采购与企业国防合作边界。
阅读原文3
Nscale获20亿美元C轮,估值146亿美元
融资数据中心AI算力
英国AI数据中心初创公司Nscale完成20亿美元C轮融资,估值升至146亿美元;Aker ASA与8090 Industries领投,参投方包括英伟达、Citadel、Dell、Lenovo与Nokia等。公司成立于2024年,主打垂直整合AI基础设施(GPU计算、网络、数据服务与编排软件)并在欧美亚运营数据中心,同时宣布引入Sheryl Sandberg、Nick Clegg与Susan Decker加入董事会。报道还称其与微软达成140亿美元扩展合作,并与OpenAI在挪威联合建设名为Stargate的数据中心,后续计划推进IPO。
阅读原文4
CoreWeave称2026算力基本售罄,CapEx 300–350亿美元
AI算力云基础设施行业数据
CoreWeave在会议上表示,受“难以满足”的AI需求推动,其2026年计算容量已基本售罄,客户从AI实验室扩展到云巨头与大型企业,合同期限拉长至5–6年,覆盖A100、H100、H200与Blackwell等多代GPU。公司给出资本开支预期300亿–350亿美元(中值325亿美元),并称随着部署完成,贡献利润率可达约25%,Q1为利润低点。其还透露拥有43个运营站点,电力规划提前12–18个月推进,并正探索对外销售软件栈以提升利润率。
阅读原文5
Dify获3000万美元Pre-A,估值1.8亿美元
融资开源AI Agent
开源AI应用与智能体工作流平台Dify宣布完成3000万美元Pre-A轮融资,估值1.8亿美元,由HSG领投,GL Ventures、5Y Capital等参投。公司称自2023年推出以来,其开源版本运行在超过140万台设备上,商业版已被280家企业与2000多个团队用于构建生产级应用,客户包括Maersk、ETS、Anker与Novartis等。Dify提供可视化工作流编排、提示与工具管理、知识检索、调试与API部署等能力,资金将用于增强智能体核心能力、扩建企业级性能与合规团队并降低上手门槛。
阅读原文6
CACI完成26亿美元收购ARKA,强化Agentic AI情报能力
并购国防AI产业链
CACI International宣布完成对ARKA Group的收购,交易为26亿美元全现金。CACI称该并购将其在地理空间情报与国家安全太空项目的能力前移:获得电光/红外(EO/IR)与高光谱成像等传感器技术,并整合ARKA基于Agentic AI的软件能力,以提升多源情报处理与任务支撑。ARKA 1100+名员工将加入CACI,扩大其在情报界、美国太空军与国防部相关项目的人才与交付能力。该交易也意味着传统IT服务商向“传感器+代理AI软件”的更垂直整合路径靠拢。
阅读原文7
Databricks发布Kasal:原生可视化多Agent编排与监控
Agentic AILLMOps产品发布
Databricks发布Kasal,定位为“Databricks-native、UI-first”的多智能体工作流框架,提供拖拽式画布与对话式助手,面向非技术用户与工程团队统一建模、部署与监控多Agent系统。Kasal与Databricks生态深度集成:可利用MLflow进行追踪与可观测性,借助Vector Search承载记忆/检索,并通过Databricks Apps在受控环境中部署,继承现有治理与认证体系。其关键能力是从可视化原型一键导出为标准Python代码/Notebook,便于工程化扩展与接入外部MCP服务器,降低“原型到生产”的断层成本。
阅读原文8
IBM开源Granite 4.0 1B Speech,Apache 2.0授权
开源模型语音边缘AI
IBM发布并开源Granite 4.0 1B Speech语音-语言模型,主打边缘设备部署的多语种ASR/双向语音翻译(AST),采用Apache 2.0许可并原生支持Transformers与vLLM。官方信息称该1B模型在转写准确率与推理性能上较其2.2B前代更优,并通过speculative decoding提升实时推理速度;同时加入keyword biasing能力,可针对企业常见的缩写、专有名词等进行偏置识别以降低漏识别。文章还提到其在OpenASR榜单排名靠前,强调“小模型+工程优化”在端侧语音场景的可行性。
阅读原文9
Cloudflare推有状态API漏洞扫描器,用LLM自动建调用图
安全APILLM应用
Cloudflare发布“有状态”API漏洞扫描器,面向传统DAST难以覆盖的逻辑型漏洞(如BOLA)。其核心思路是把OpenAPI文档转为可执行的API调用图,并在“资源创建→权限验证→越权尝试”等多步链路中自动推进测试;当文档不完整或含糊时,引入LLM推断端点依赖、字段命名与数据关系,减少人工配置成本。为降低主动扫描带来的密钥风险,方案使用HashiCorp Vault Transit对凭据进行加密,并在受限的Rust执行环境中解密与发起最终请求,强调把“主动防御”自动化、工程化。
阅读原文10
PoC披露llama.cpp推理可篡改GGUF权重以持久在线操纵输出
安全推理部署开源生态
研究者公开PoC演示:在llama.cpp的llama-server默认使用MAP_SHARED方式mmap模型文件时,攻击者只需具备本地文件写入权限,即可在运行中修改磁盘上的GGUF量化权重,内核页缓存同步后服务端会读取到被篡改的权重,从而对输出形成“持久性”操控。示例通过调大output.weight中与特定token对应行的缩放因子,使其logit被系统性放大,进而主导生成结果;无需ptrace、进程注入或重启。作者给出缓解建议:只读挂载模型、限制文件权限或使用--no-mmap等,并指出该攻击对量化格式与张量布局有一定前置条件。
阅读原文