AI Daily Brief

2026年4月25日星期六

9 点要闻3 分钟阅读

今日要闻

DeepSeek发布V4开源模型，1.6T参数全栈适配华为昇腾芯片

模型发布开源国产算力

DeepSeek于4月24日发布V4系列并开源，包含V4-Pro（1.6T总参数/49B激活）和V4-Flash（284B/13B），均支持100万token上下文。模型采用混合注意力架构（CSA+HCA），KV缓存降至V3.2的10%，预训练数据超27万亿token。V4-Pro在LiveCodeBench达93.5分、Codeforces评分3206，编码能力超越GPT-5.4和Claude Opus 4.6。API定价极具竞争力：Pro版输出仅3.48美元/百万token，为GPT-5.5的约1/9。模型全栈运行于华为昇腾平台，昇腾950超节点实现V4-Pro 20ms低时延推理，标志首个不依赖英伟达硬件的前沿开源模型。采用MIT许可证，权重已发布于Hugging Face。

阅读原文

谷歌计划向Anthropic投资至多400亿美元，估值3500亿美元

融资云计算竞争格局

谷歌计划向Anthropic投资高达400亿美元，其中100亿美元即时现金注入（估值3500亿美元），300亿美元与业绩目标挂钩，另提供五年5吉瓦算力，总承诺约430亿美元。Anthropic年化收入已达300亿美元，Claude在企业大模型API市场占32%份额，8家财富10强为其客户。此前亚马逊也承诺最高330亿美元投资。此举被视为谷歌弥补Gemini企业端竞争力不足的战略防御，确保Anthropic算力需求流向谷歌云基础设施。交易结构规避并购审查，但引发反垄断关注。Anthropic在Forge Global二级市场估值已触及1万亿美元。

阅读原文

Cohere收购德国Aleph Alpha，合并后估值200亿美元推进欧洲AI主权

并购AI主权企业AI

加拿大AI公司Cohere宣布收购德国AI企业Aleph Alpha，合并后估值约200亿美元，Cohere股东持股90%、Aleph Alpha股东持股10%。德国Schwarz集团（Lidl母公司）将投资5-6亿美元参与Cohere即将进行的E轮融资。合并实体设加拿大与海德堡双总部，聚焦受监管行业（国防、金融、公共部门），德国联邦及地方政府已签约使用其技术。Cohere年经常性收入达2.4亿美元。此交易获加拿大和德国政府支持，延续两国此前签署的《主权技术联盟》框架，旨在提供独立于美国科技巨头的AI解决方案。

阅读原文

英伟达向全体员工部署OpenAI Codex代理，周活开发者突破400万

企业部署AI代理开发工具

英伟达已向全体员工推出由GPT-5.5驱动的OpenAI Codex AI代理，此前约1万名跨工程、法律、营销等部门员工已获早期访问。CEO黄仁勋在内部邮件中称测试反馈"令人震惊"且"改变生活"，Codex运行于英伟达自研Blackwell基础设施。OpenAI同步推出Codex Labs企业计划，埃森哲、塔塔咨询等七家全球系统集成商已加入。Codex周活跃开发者突破400万。GitHub Copilot也已正式上线GPT-5.5模型，采用7.5倍请求成本的促销定价，面向Pro+、Business和Enterprise用户开放。

阅读原文

美团发布LongCat-2.0万亿参数大模型，5-6万张国产算力卡完成训练

模型发布国产算力

美团于4月24日发布LongCat-2.0-Preview大模型，具备万亿参数规模，支持1M上下文窗口，性能对标GPT-5.5。该模型专为Agent场景优化，适用于代码生成、任务规划和企业自动化，全程依托国产算力集群完成训练，动用5-6万张国产算力卡，创下国产算力最大规模训练纪录。CEO王兴强调公司持续三年AI大规模投入，已投资摩尔线程、智谱AI、月之暗面等企业。目前LongCat-2.0-Preview已开放测试，每日提供1000万免费Token额度。

阅读原文

ComfyUI完成3000万美元融资估值5亿，400万用户构建开源创意AI平台

融资开源创意工具

开源生成式AI工作流平台ComfyUI宣布完成3000万美元融资，估值达5亿美元，总融资额4800万美元。本轮由Craft Ventures领投，Pace Capital、Chemistry等跟投。ComfyUI提供基于节点的可视化工作流，支持对扩散模型生成图像、视频、音频的精细控制，已拥有超400万用户、6万多个社区构建节点和日均15万次下载。CEO Yoland Yan指出传统提示式工具仅能实现60%-80%效果，而节点式架构可确保输出质量和可重复性。该平台广泛应用于视觉特效、动画、广告和工业设计领域。

阅读原文

Ollama曝严重未修复漏洞，恶意模型文件可窃取服务器内存敏感数据

安全漏洞AI基础设施

安全研究人员发现Ollama平台存在严重未修复漏洞CVE-2026-5757，影响其模型量化引擎中GGUF格式文件的处理。攻击者可通过上传恶意AI模型文件，利用文件元数据缺乏校验和不安全内存操作，读取服务器堆内存中的API密钥、用户隐私和知识产权等敏感数据，无需身份验证。泄露的内存可被写入新模型层并通过注册API外传。截至4月下旬CERT尚未联系到厂商，无官方补丁。建议立即禁用模型上传功能、限制部署环境、仅使用可信来源模型。该漏洞尤其威胁共享开发环境和公网暴露系统。

阅读原文

Orkes完成6000万美元B轮融资，基于Netflix Conductor构建AI工作流编排平台

融资企业AI工作流

AI工作流编排平台Orkes宣布完成6000万美元B轮融资，由AVP领投，总融资额达约9000万美元。公司核心技术源自Netflix开源项目Conductor，已服务摩根大通、特斯拉等大型企业，致力于解决企业AI应用从试点到生产的转化难题。新功能包括Agent Runtime、MCP Gateway和Prompt-to-Workflow，旨在提升AI代理系统的可预测性、容错能力和内部API集成。融资将用于扩大全球业务及增强工具套件，支持企业规模化部署任务关键型AI应用。

阅读原文

微软等云厂商优先内部分配GPU，AI初创企业算力获取受阻

算力供应产业链

据The Information报道，微软等主要云服务商正将Nvidia GPU资源优先分配给内部AI团队和OpenAI等大客户，导致AI初创企业难以获取足够算力。中小外部客户面临更长等待时间和更高竞价实例价格，被迫转向多供应商策略、使用旧款加速器或自建本地算力。模型蒸馏、量化和参数高效微调等优化技术价值随之提升。这一趋势反映当前AI硬件供应链紧张及大企业对基础设施的主导地位，加剧了行业竞争不平等。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。