返回往期
2026年4月25日星期六
9 点要闻3 分钟阅读

今日要闻

1

DeepSeek发布V4开源模型,1.6T参数全栈适配华为昇腾芯片

模型发布开源国产算力

DeepSeek于4月24日发布V4系列并开源,包含V4-Pro(1.6T总参数/49B激活)和V4-Flash(284B/13B),均支持100万token上下文。模型采用混合注意力架构(CSA+HCA),KV缓存降至V3.2的10%,预训练数据超27万亿token。V4-Pro在LiveCodeBench达93.5分、Codeforces评分3206,编码能力超越GPT-5.4和Claude Opus 4.6。API定价极具竞争力:Pro版输出仅3.48美元/百万token,为GPT-5.5的约1/9。模型全栈运行于华为昇腾平台,昇腾950超节点实现V4-Pro 20ms低时延推理,标志首个不依赖英伟达硬件的前沿开源模型。采用MIT许可证,权重已发布于Hugging Face。

阅读原文
2

谷歌计划向Anthropic投资至多400亿美元,估值3500亿美元

融资云计算竞争格局

谷歌计划向Anthropic投资高达400亿美元,其中100亿美元即时现金注入(估值3500亿美元),300亿美元与业绩目标挂钩,另提供五年5吉瓦算力,总承诺约430亿美元。Anthropic年化收入已达300亿美元,Claude在企业大模型API市场占32%份额,8家财富10强为其客户。此前亚马逊也承诺最高330亿美元投资。此举被视为谷歌弥补Gemini企业端竞争力不足的战略防御,确保Anthropic算力需求流向谷歌云基础设施。交易结构规避并购审查,但引发反垄断关注。Anthropic在Forge Global二级市场估值已触及1万亿美元。

阅读原文
3

Cohere收购德国Aleph Alpha,合并后估值200亿美元推进欧洲AI主权

并购AI主权企业AI

加拿大AI公司Cohere宣布收购德国AI企业Aleph Alpha,合并后估值约200亿美元,Cohere股东持股90%、Aleph Alpha股东持股10%。德国Schwarz集团(Lidl母公司)将投资5-6亿美元参与Cohere即将进行的E轮融资。合并实体设加拿大与海德堡双总部,聚焦受监管行业(国防、金融、公共部门),德国联邦及地方政府已签约使用其技术。Cohere年经常性收入达2.4亿美元。此交易获加拿大和德国政府支持,延续两国此前签署的《主权技术联盟》框架,旨在提供独立于美国科技巨头的AI解决方案。

阅读原文
4

英伟达向全体员工部署OpenAI Codex代理,周活开发者突破400万

企业部署AI代理开发工具

英伟达已向全体员工推出由GPT-5.5驱动的OpenAI Codex AI代理,此前约1万名跨工程、法律、营销等部门员工已获早期访问。CEO黄仁勋在内部邮件中称测试反馈"令人震惊"且"改变生活",Codex运行于英伟达自研Blackwell基础设施。OpenAI同步推出Codex Labs企业计划,埃森哲、塔塔咨询等七家全球系统集成商已加入。Codex周活跃开发者突破400万。GitHub Copilot也已正式上线GPT-5.5模型,采用7.5倍请求成本的促销定价,面向Pro+、Business和Enterprise用户开放。

阅读原文
5

美团发布LongCat-2.0万亿参数大模型,5-6万张国产算力卡完成训练

模型发布国产算力

美团于4月24日发布LongCat-2.0-Preview大模型,具备万亿参数规模,支持1M上下文窗口,性能对标GPT-5.5。该模型专为Agent场景优化,适用于代码生成、任务规划和企业自动化,全程依托国产算力集群完成训练,动用5-6万张国产算力卡,创下国产算力最大规模训练纪录。CEO王兴强调公司持续三年AI大规模投入,已投资摩尔线程、智谱AI、月之暗面等企业。目前LongCat-2.0-Preview已开放测试,每日提供1000万免费Token额度。

阅读原文
6

ComfyUI完成3000万美元融资估值5亿,400万用户构建开源创意AI平台

融资开源创意工具

开源生成式AI工作流平台ComfyUI宣布完成3000万美元融资,估值达5亿美元,总融资额4800万美元。本轮由Craft Ventures领投,Pace Capital、Chemistry等跟投。ComfyUI提供基于节点的可视化工作流,支持对扩散模型生成图像、视频、音频的精细控制,已拥有超400万用户、6万多个社区构建节点和日均15万次下载。CEO Yoland Yan指出传统提示式工具仅能实现60%-80%效果,而节点式架构可确保输出质量和可重复性。该平台广泛应用于视觉特效、动画、广告和工业设计领域。

阅读原文
7

Ollama曝严重未修复漏洞,恶意模型文件可窃取服务器内存敏感数据

安全漏洞AI基础设施

安全研究人员发现Ollama平台存在严重未修复漏洞CVE-2026-5757,影响其模型量化引擎中GGUF格式文件的处理。攻击者可通过上传恶意AI模型文件,利用文件元数据缺乏校验和不安全内存操作,读取服务器堆内存中的API密钥、用户隐私和知识产权等敏感数据,无需身份验证。泄露的内存可被写入新模型层并通过注册API外传。截至4月下旬CERT尚未联系到厂商,无官方补丁。建议立即禁用模型上传功能、限制部署环境、仅使用可信来源模型。该漏洞尤其威胁共享开发环境和公网暴露系统。

阅读原文
8

Orkes完成6000万美元B轮融资,基于Netflix Conductor构建AI工作流编排平台

融资企业AI工作流

AI工作流编排平台Orkes宣布完成6000万美元B轮融资,由AVP领投,总融资额达约9000万美元。公司核心技术源自Netflix开源项目Conductor,已服务摩根大通、特斯拉等大型企业,致力于解决企业AI应用从试点到生产的转化难题。新功能包括Agent Runtime、MCP Gateway和Prompt-to-Workflow,旨在提升AI代理系统的可预测性、容错能力和内部API集成。融资将用于扩大全球业务及增强工具套件,支持企业规模化部署任务关键型AI应用。

阅读原文
9

微软等云厂商优先内部分配GPU,AI初创企业算力获取受阻

算力供应产业链

据The Information报道,微软等主要云服务商正将Nvidia GPU资源优先分配给内部AI团队和OpenAI等大客户,导致AI初创企业难以获取足够算力。中小外部客户面临更长等待时间和更高竞价实例价格,被迫转向多供应商策略、使用旧款加速器或自建本地算力。模型蒸馏、量化和参数高效微调等优化技术价值随之提升。这一趋势反映当前AI硬件供应链紧张及大企业对基础设施的主导地位,加剧了行业竞争不平等。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。