返回往期
2026年3月27日星期五
10 点要闻3 分钟阅读

今日要闻

1

Google发布Gemini 3.1 Flash Live,ComplexFuncBench Audio达90.8

模型发布语音开发者API

Google DeepMind推出实时语音/音频模型Gemini 3.1 Flash Live,面向低延迟对话与语音代理。官方称其在ComplexFuncBench Audio得分90.8%,在Scale AI Audio MultiChallenge中“思考”模式得分36.1,并可较上一代更长时间保持对话线索。模型已通过Gemini Live API在Google AI Studio提供预览,亦用于Search Live、Gemini Live及企业客服方案;生成音频统一加入SynthID隐形水印。

阅读原文
2

欧议会推进AI Act简化:高风险合规延至2027年12月

政策监管内容安全欧盟

欧洲议会就“AI综合法案/简化方案”通过谈判立场,拟推迟《欧盟AI法案》关键条款:高风险AI系统规则生效期延至2027年12月2日,部分受行业立法覆盖的系统合规期延至2028年8月2日;AI生成内容水印要求需在2026年11月2日前落实。议会同时支持禁止“脱衣/裸体化”等非自愿性化深伪系统。该方案仍需与欧盟理事会及委员会进入三方谈判,企业面临一定政策不确定性。

阅读原文
3

Shield AI获15亿美元G轮、估值127亿并拟收购Aechelon

融资并购国防AI

美国国防AI公司Shield AI宣布完成15亿美元G轮融资,投后估值127亿美元;同时获得5亿美元优先股融资与2.5亿美元延期提款额度。公司计划收购高保真仿真与合成现实软件厂商Aechelon Technology,以加速Hivemind“AI飞行员”软件与X-BAT项目研发。官方披露Hivemind已在包括F-16在内的26类飞行器上完成飞行,并被美国空军选为协同作战飞机(CCA)任务自主供应商之一。

阅读原文
4

ARC Prize发布ARC-AGI-3基准,头部模型得分仍低于1%

基准评测智能体研究

ARC Prize基金会发布新一代通用智能体评测ARC-AGI-3,引入交互式回合制环境,要求模型在“无指令”条件下自行探索、建模并规划行动,以降低数据污染与过拟合风险。公开报道显示,人类受试者可达100%,而最佳前沿模型得分仅0.37%,其他模型同样低于1%,暴露其在新颖环境中的泛化不足。该基准同步在Kaggle设立200万美元奖金赛事,鼓励提出更有效的通用解题策略与训练范式。

阅读原文
5

苹果被曝用蒸馏拆解Gemini,为iPhone 17打造端侧小模型

端侧AI大模型合作苹果

据The Information报道,苹果正通过“知识蒸馏”深度拆解谷歌Gemini大模型,把其知识与推理能力压缩到更小的本地模型,以适配iPhone 17等设备的端侧运行。报道称苹果已在自家数据中心获得对Gemini的完整访问权限,并可在内部环境中修改与利用其输出训练自研微型模型;未来Siri可能由未蒸馏的完整Gemini处理复杂查询,而本地模型负责高频、低时延任务,以提升响应速度并强化隐私。该进展由苹果基础模型团队(AFM)推进。

阅读原文
6

Mistral开源Voxtral TTS:TTFA 90ms、支持9种语言

开源语音模型发布

Mistral发布开源文本转语音模型Voxtral TTS,覆盖英语、法语、德语、西班牙语等9种语言,定位为可实时交互的语音生成组件。报道称其TTFA(首段音频时间)为90毫秒、实时因子(RTF)约6倍,生成10秒音频约需1.6秒。模型可在低至5秒语音样本基础上定制声音并保留口音、语调等细节,强调体积小、可在手机与可穿戴等边缘设备部署,以与ElevenLabs、OpenAI等语音产品竞争。

阅读原文
7

Cohere开源ASR模型Transcribe:2B参数、14语种、WER 5.42

开源语音识别模型发布

Cohere发布开源语音转文字模型Cohere Transcribe(2B参数,Conformer架构),主打在消费级GPU上运行并支持14种语言。其在Hugging Face Open ASR榜单的平均词错误率(WER)为5.42,并宣称在人工对比评估中取得61%的平均胜率。模型输入为原始音频波形,输出带标点文本;需显式指定语言,不支持自动语言识别与说话人分离。项目采用Apache 2.0许可,可通过Transformers或vLLM部署,适用于离线转录与生产转写管线。

阅读原文
8

Zendesk完成收购Forethought,将其AI Agents并入客服平台

并购企业服务客服AI

Zendesk宣布完成对AI代理平台Forethought的收购,将推出“Forethought AI Agents by Zendesk”,并入其Resolution Platform产品路线。官方称该类代理可在Zendesk平台内外运行,覆盖聊天、邮件与语音等渠道的常规任务自动化,并与现有工作流和技术栈集成;同时强调代理可从每次交互中持续改进,以提升问题解决效率与服务质量。Zendesk此前于2026年3月11日披露收购意向,本次公告确认交易已在满足常规交割条件与监管审批后完成。

阅读原文
9

华盛顿州签署未成年人AI聊天机器人法案,限制“黑暗模式”

政策监管未成年人保护安全

美国华盛顿州州长签署HB 2225,使该州成为美国首个专门面向未成年人AI聊天机器人保护立法的州。法案要求平台在与未成年用户互动时识别潜在自残迹象并提供危机支持资源,同时限制不当或剥削性内容;并禁止使用操纵性的“黑暗模式”设计,利用孤独、内疚或被抛弃感等情绪延长青少年使用时间。报道显示支持者认为该法有助于补齐平台自律不足,但科技行业警告可能对广泛AI工具造成过度约束;新法预计明年年初生效。

阅读原文
10

UBC等推出“AI Scientist”,可自动做实验写论文并通过ICLR评审

科研自动化智能体研究

英属哥伦比亚大学(UBC)与Sakana AI、Vector Institute及牛津大学合作开发“AI Scientist”系统,宣称可端到端完成科研流程:提出研究想法、设计实验、编写代码、分析数据、撰写论文并自我评审。校方介绍称,团队将完全由AI生成的论文投稿至ICLR工作坊并通过同行评审,且还构建了自动化评审系统,其预测接受率与人类评分接近。该成果发表于《自然》。团队同时承认系统仍存在想法不够成熟、引用不准确等局限,当前主要适用于计算机科学领域。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。