返回往期
2026年5月8日星期五
10 点要闻3 分钟阅读

今日要闻

1

OpenAI发布三款实时语音模型,GPT-Realtime-2具备GPT-5级推理能力

语音AIOpenAIAPI

OpenAI推出三款实时语音AI模型:GPT-Realtime-2具备GPT-5级推理能力,支持128K上下文窗口和并行工具调用,适用于复杂语音代理场景;GPT-Realtime-Translate支持70多种语言实时翻译为13种输出语言;GPT-Realtime-Whisper提供低延迟流式语音转文本。三款模型均已通过Realtime API开放,定价分别为每百万音频输入/输出token 32/64美元、每分钟0.034美元和0.017美元。性能比前代提升11%,价格与前代相同。

阅读原文
2

欧盟达成协议放宽AI法案,高风险AI合规推迟至2027年底

AI政策欧盟监管

欧盟立法者达成临时协议,将高风险AI系统合规截止日期从2026年8月推迟至2027年12月,嵌入产品的AI系统延至2028年8月。协议在德国推动下大幅豁免工业AI应用监管,减轻西门子、博世等企业合规负担,但医疗设备未获豁免。新规禁止生成儿童色情及未经同意的性化深度伪造AI系统,相关企业须在2026年12月前合规。AI生成内容水印要求宽限期为三个月。中小企业获得额外监管优惠。这是欧盟首次在数字领域显著放松科技监管。

阅读原文
3

Google DeepMind发布AlphaEvolve影响力报告,DNA测序错误降低30%

Google DeepMindAI应用科学计算

AlphaEvolve是基于Gemini的编码智能体,已在多领域产生显著影响:基因组学中将DNA测序错误检测率降低30%;电网优化可行解比例从14%提升至88%以上;自然灾害预测准确率提高5%。科研方面助力量子物理模拟实现10倍误差降低,协助陶哲轩解决Erdős问题。AI基础设施上优化下一代TPU设计、Spanner数据库写入放大减少20%。商业应用中帮助Klarna训练速度翻倍、FM Logistic路径效率提升10.4%。

阅读原文
4

罗氏以最高10.5亿美元收购AI病理公司PathAI

医疗AI并购罗氏

罗氏宣布与PathAI达成最终合并协议,前期支付7.5亿美元,另有最高3亿美元里程碑付款。PathAI专注AI驱动的数字病理学,其图像管理系统将被整合至罗氏诊断部门并全球推广。双方自2021年起合作,2024年扩展至AI伴随诊断算法开发。PathAI的AIM-NASH工具已获FDA资格认定。交易预计2026年下半年完成,将加速新生物标志物发现和个性化医疗发展。

阅读原文
5

Gemini 3.1 Flash-Lite正式发布,成本降低约60%

Google模型发布企业AI

Google Cloud宣布Gemini 3.1 Flash-Lite正式上线,为Gemini 3系列中速度最快、成本效益最高的模型,专为超低延迟和高吞吐量任务设计。客户案例显示,Gladly在客户服务平台实现约60%成本降低,p95延迟保持1.8秒,成功率达99.6%。JetBrains用于IDE AI助手响应加速,Ramp和OffDeal用于金融实时研究。该模型在音频输入、RAG排序、翻译、数据提取和代码补全等方面均优于Gemini 2.5 Flash Lite。

阅读原文
6

Lambda获10亿美元信贷融资,扩建千兆瓦级AI算力工厂

融资AI基础设施算力

AI基础设施公司Lambda宣布完成10亿美元银团高级担保信贷融资,由摩根大通牵头,较2025年8月的2.75亿美元信贷大幅增加且获超额认购。资金将用于部署下一代NVIDIA AI加速器并扩大数据中心容量,满足前沿AI模型训练和超级智能客户的算力需求。Lambda自2012年成立以来,已从GPU硬件供应商转型为AI云基础设施提供商,致力于使计算资源像电力一样普及。

阅读原文
7

智谱AI港交所上市,成全球大模型第一股,市值超500亿港元

IPO大模型智谱AI

智谱AI在港交所上市,发行价116.2港元,募资43亿港元,开盘市值超500亿港元,成为全球大模型第一股。公司源自清华大学技术转化,核心产品为GLM系列大模型,2024年营收3.124亿元,累计研发投入约44亿元。GLM-4.6和GLM-4.7等模型在编码、视觉理解等领域表现突出,并适配寒武纪等国产芯片。主要股东包括君联资本、美团、腾讯,基石投资者认购29.8亿港元。

阅读原文
8

NASA与IBM联合开发的Prithvi成为首个在轨部署的AI地理空间基础模型

NASA卫星AI开源

NASA与IBM联合开发的开源地理空间AI基础模型Prithvi成功部署至国际空间站和Kanyini卫星,成为首个在轨运行的AI地理空间基础模型。该模型基于13年Landsat与Sentinel-2卫星数据训练,支持洪水监测、灾害检测和作物产量预测。其基础模型架构允许通过上传小型解码器实现功能扩展,大幅减少带宽需求。开源特性极大节省了研发时间。NASA还计划推出日球物理、行星科学等领域的其他基础模型。

阅读原文
9

小米开源OmniVoice语音克隆模型,覆盖646种语言

语音合成开源小米

小米AI实验室开源OmniVoice多语言语音克隆TTS模型,采用极简双向Transformer架构,覆盖646种语言,为业内最广。技术创新包括全码本随机掩蔽策略和首次在非自回归模型中引入LLM预训练参数。在24种语言上超越商用系统,102种语言中可懂度接近真实语音,即使数据不足10小时的小语种也能高质量合成。一天可完成10万小时数据训练,PyTorch推理速度达40倍实时。代码和权重以Apache 2.0许可开源。

阅读原文
10

Cloudflare裁员超1100人,称为代理AI时代重组而非降本

裁员Cloudflare组织变革

Cloudflare宣布裁减超过1100名员工,CEO将此定义为面向代理AI时代的战略重组而非降本措施。公司称内部AI使用量三个月内增长超600%,工作方式已根本改变。离职员工将获得业界领先的遣散方案,包括2026年底前全额基本薪资、延续医疗保险和加速股权归属。公司强调这是一次性调整,避免多轮小规模裁员带来的不确定性。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。