返回往期
2026年5月10日星期日
9 点要闻3 分钟阅读

今日要闻

1

百度发布文心5.1,预训练成本仅为业界6%,LMArena搜索榜国内第一

模型发布百度

百度于5月9日正式发布文心大模型5.1,采用多维弹性预训练技术,总参数压缩至文心5.0的约1/3,激活参数压缩至约1/2,预训练成本仅为同规模业界模型的6%。模型在Arena搜索榜以1223分位列全球第四、国内第一,成为唯一上榜的国产模型。在智能体评测τ³-bench、SpreadsheetBench等任务上超越DeepSeek-V4-Pro,AIME26数学竞赛得分99.6,接近Gemini 3.1 Pro水平。技术上采用分离式全异步强化学习架构和多教师在线策略蒸馏四阶段后训练流程,已在千帆平台和文心一言官网开放体验。

阅读原文
2

DeepSeek启动500亿元首轮融资,梁文锋自掏200亿,估值飙至3500亿

融资DeepSeek

DeepSeek启动首轮外部融资,目标最高500亿元人民币,估值达3500亿元(约500亿美元)。创始人梁文锋个人出资约200亿元,占比40%。腾讯、阿里及国家集成电路产业投资基金均参与谈判。此次融资标志着DeepSeek从"不融资、不商业化"的研究实验室模式正式转向重资产AI公司。资金将用于加速模型迭代和企业产品商业化,V4.1模型定档6月发布,将支持MCP协议和图像音频多模态能力。此前DeepSeek在21天内估值从100亿美元飙升至500亿美元。

阅读原文
3

NVIDIA发布Star Elastic,单检查点嵌套30B/23B/12B推理模型,训练成本降360倍

模型压缩NVIDIA

NVIDIA发布Star Elastic后训练方法,可在单个检查点中嵌入30B、23B和12B三种参数规模的嵌套推理模型,实现零样本切片提取。基于Nemotron Nano v3混合架构,通过可学习路由器和Gumbel-Softmax联合训练,相比从头预训练节省360倍token成本。弹性预算控制策略(小模型思考+大模型作答)在23B→30B配置下提升16%准确率并降低1.9倍延迟。NVFP4量化将30B模型压缩至18.7GB,使12B版本可在RTX 5080上运行,RTX Pro 6000上实现7426 tokens/s吞吐量。所有变体已在Hugging Face公开。

阅读原文
4

Anthropic Mythos AI发现数千个零日漏洞,美联储紧急召集银行CEO讨论网络安全

AI安全网络安全

Anthropic的AI模型Claude Mythos Preview在受控测试中发现数千个零日漏洞,包括Firefox单次扫描发现271个漏洞、27年历史的OpenBSD漏洞和17年历史的FreeBSD远程执行漏洞。该模型尚未公开发布,已通过Project Glasswing向约40家科技公司提供早期访问以协助修复。美联储主席鲍威尔与财政部长紧急召集主要银行CEO讨论风险应对。Anthropic警告对手可能在6至12个月内复制此能力。OpenAI也响应推出GPT-5.4-Cyber。安全界认为AI加速漏洞挖掘是趋势加速而非颠覆。

阅读原文
5

NVIDIA、AMD、Intel罕见联手投资1亿美元于SGLang团队RadixArk

融资AI基础设施

NVIDIA、AMD和Intel三大芯片巨头罕见联合投资1亿美元于RadixArk团队,该团队开发了开源推理引擎SGLang和强化学习框架Miles。SGLang已部署在超过40万块GPU上,服务Google和xAI等公司,具备新模型Day-0兼容能力。RadixArk在DeepSeek-V4发布当天即实现其推理和RL训练的全栈支持。三家硬件厂商投资逻辑不同但目标统一:构建不被单一云商或芯片巨头锁定的开放AI基础设施层。NVIDIA意在巩固生态,AMD和Intel希望通过公平的开源层打破CUDA垄断。

阅读原文
6

Airbnb称上季度近60%代码由AI生成,AI解决40%客户支持问题

企业应用AI编程

Airbnb CEO Brian Chesky在5月8日财报电话会上透露,上季度近60%代码由AI工具生成,显著提升功能开发速度。AI还处理了40%的客户支持问题,无需人工介入。Chesky指出AI使单个工程师能在监督下完成以往需20人团队的工作。越来越多设计和工程管理者重新开始编码或使用Claude Code等AI工具。财务方面Q1净利润1.6亿美元,收入增长18%至27亿美元,预订间夜数1.562亿。Chesky未明确表示是否会裁员,但承认当前AI在旅行领域应用仍面临挑战。

阅读原文
7

Isomorphic Labs计划融资超20亿美元,Thrive Capital领投推进AI药物发现

融资AI制药

谷歌旗下AI药物发现公司Isomorphic Labs正就新一轮融资进行深入讨论,计划筹集超过20亿美元,由Thrive Capital领投,Alphabet也将参与。该公司2021年从Google DeepMind分拆,CEO由Demis Hassabis兼任,利用AlphaFold等AI技术加速药物研发。已与强生、礼来和诺华等大型药企建立合作。新资金将用于升级药物设计引擎并推动全球业务扩展。尽管硅谷在医疗健康领域的多次尝试曾遇挫,AI在药物发现中的应用持续吸引大量资本关注。

阅读原文
8

SK hynix面临AI驱动HBM供应危机,大型科技公司主动出资建厂

供应链芯片

2026年5月,SK hynix面临AI驱动的高带宽内存(HBM)芯片严重供应紧张,多家全球大型科技公司主动提出资助其新建生产线和购买ASML极紫外光刻设备以确保供应。SK hynix产能几乎为零,客户未来三年HBM需求远超生产能力。该公司占HBM市场57%份额,一季度营业利润率达72%。尽管资金充足,SK hynix正谨慎评估合作方案,避免被绑定单一买家。行业预计内存短缺可能持续至2030年。索尼和任天堂已表示内存价格上涨正冲击其游戏业务。

阅读原文
9

小米发布MiMo-V2.5原生多模态大模型,310B参数支持百万token上下文

模型发布小米

小米推出MiMo-V2.5原生多模态大模型,支持文本、图像、视频和音频统一理解,具备强大智能体能力。采用稀疏专家混合架构,总参数310B,激活参数15B,上下文长度最高支持100万tokens。核心技术包括混合注意力机制、729M参数视觉编码器和261M参数音频编码器,以及多token预测模块。模型使用FP8混合精度在约48T token数据上完成训练,并通过SFT、强化学习和知识蒸馏优化代理任务表现。已在Hugging Face发布,支持SGLang和vLLM框架部署。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。