AI Daily Brief

2026年5月8日星期五

10 点要闻3 分钟阅读

今日要闻

OpenAI发布三款实时语音模型，GPT-Realtime-2具备GPT-5级推理能力

语音AIOpenAIAPI

OpenAI推出三款实时语音AI模型：GPT-Realtime-2具备GPT-5级推理能力，支持128K上下文窗口和并行工具调用，适用于复杂语音代理场景；GPT-Realtime-Translate支持70多种语言实时翻译为13种输出语言；GPT-Realtime-Whisper提供低延迟流式语音转文本。三款模型均已通过Realtime API开放，定价分别为每百万音频输入/输出token 32/64美元、每分钟0.034美元和0.017美元。性能比前代提升11%，价格与前代相同。

阅读原文

欧盟达成协议放宽AI法案，高风险AI合规推迟至2027年底

AI政策欧盟监管

欧盟立法者达成临时协议，将高风险AI系统合规截止日期从2026年8月推迟至2027年12月，嵌入产品的AI系统延至2028年8月。协议在德国推动下大幅豁免工业AI应用监管，减轻西门子、博世等企业合规负担，但医疗设备未获豁免。新规禁止生成儿童色情及未经同意的性化深度伪造AI系统，相关企业须在2026年12月前合规。AI生成内容水印要求宽限期为三个月。中小企业获得额外监管优惠。这是欧盟首次在数字领域显著放松科技监管。

阅读原文

Google DeepMind发布AlphaEvolve影响力报告，DNA测序错误降低30%

Google DeepMindAI应用科学计算

AlphaEvolve是基于Gemini的编码智能体，已在多领域产生显著影响：基因组学中将DNA测序错误检测率降低30%；电网优化可行解比例从14%提升至88%以上；自然灾害预测准确率提高5%。科研方面助力量子物理模拟实现10倍误差降低，协助陶哲轩解决Erdős问题。AI基础设施上优化下一代TPU设计、Spanner数据库写入放大减少20%。商业应用中帮助Klarna训练速度翻倍、FM Logistic路径效率提升10.4%。

阅读原文

罗氏以最高10.5亿美元收购AI病理公司PathAI

医疗AI并购罗氏

罗氏宣布与PathAI达成最终合并协议，前期支付7.5亿美元，另有最高3亿美元里程碑付款。PathAI专注AI驱动的数字病理学，其图像管理系统将被整合至罗氏诊断部门并全球推广。双方自2021年起合作，2024年扩展至AI伴随诊断算法开发。PathAI的AIM-NASH工具已获FDA资格认定。交易预计2026年下半年完成，将加速新生物标志物发现和个性化医疗发展。

阅读原文

Gemini 3.1 Flash-Lite正式发布，成本降低约60%

Google模型发布企业AI

Google Cloud宣布Gemini 3.1 Flash-Lite正式上线，为Gemini 3系列中速度最快、成本效益最高的模型，专为超低延迟和高吞吐量任务设计。客户案例显示，Gladly在客户服务平台实现约60%成本降低，p95延迟保持1.8秒，成功率达99.6%。JetBrains用于IDE AI助手响应加速，Ramp和OffDeal用于金融实时研究。该模型在音频输入、RAG排序、翻译、数据提取和代码补全等方面均优于Gemini 2.5 Flash Lite。

阅读原文

Lambda获10亿美元信贷融资，扩建千兆瓦级AI算力工厂

融资AI基础设施算力

AI基础设施公司Lambda宣布完成10亿美元银团高级担保信贷融资，由摩根大通牵头，较2025年8月的2.75亿美元信贷大幅增加且获超额认购。资金将用于部署下一代NVIDIA AI加速器并扩大数据中心容量，满足前沿AI模型训练和超级智能客户的算力需求。Lambda自2012年成立以来，已从GPU硬件供应商转型为AI云基础设施提供商，致力于使计算资源像电力一样普及。

阅读原文

智谱AI港交所上市，成全球大模型第一股，市值超500亿港元

IPO大模型智谱AI

智谱AI在港交所上市，发行价116.2港元，募资43亿港元，开盘市值超500亿港元，成为全球大模型第一股。公司源自清华大学技术转化，核心产品为GLM系列大模型，2024年营收3.124亿元，累计研发投入约44亿元。GLM-4.6和GLM-4.7等模型在编码、视觉理解等领域表现突出，并适配寒武纪等国产芯片。主要股东包括君联资本、美团、腾讯，基石投资者认购29.8亿港元。

阅读原文

NASA与IBM联合开发的Prithvi成为首个在轨部署的AI地理空间基础模型

NASA卫星AI开源

NASA与IBM联合开发的开源地理空间AI基础模型Prithvi成功部署至国际空间站和Kanyini卫星，成为首个在轨运行的AI地理空间基础模型。该模型基于13年Landsat与Sentinel-2卫星数据训练，支持洪水监测、灾害检测和作物产量预测。其基础模型架构允许通过上传小型解码器实现功能扩展，大幅减少带宽需求。开源特性极大节省了研发时间。NASA还计划推出日球物理、行星科学等领域的其他基础模型。

阅读原文

小米开源OmniVoice语音克隆模型，覆盖646种语言

语音合成开源小米

小米AI实验室开源OmniVoice多语言语音克隆TTS模型，采用极简双向Transformer架构，覆盖646种语言，为业内最广。技术创新包括全码本随机掩蔽策略和首次在非自回归模型中引入LLM预训练参数。在24种语言上超越商用系统，102种语言中可懂度接近真实语音，即使数据不足10小时的小语种也能高质量合成。一天可完成10万小时数据训练，PyTorch推理速度达40倍实时。代码和权重以Apache 2.0许可开源。

阅读原文

Cloudflare裁员超1100人，称为代理AI时代重组而非降本

裁员Cloudflare组织变革

Cloudflare宣布裁减超过1100名员工，CEO将此定义为面向代理AI时代的战略重组而非降本措施。公司称内部AI使用量三个月内增长超600%，工作方式已根本改变。离职员工将获得业界领先的遣散方案，包括2026年底前全额基本薪资、延续医疗保险和加速股权归属。公司强调这是一次性调整，避免多轮小规模裁员带来的不确定性。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。