AI Daily Brief

2026年6月23日星期二

10 点要闻3 分钟阅读

今日要闻

OpenAI扩展Daybreak安全计划，发布GPT-5.5-Cyber并启动「修补地球」开源项目

AI安全OpenAI漏洞修复

OpenAI正式发布GPT-5.5-Cyber模型，在CyberGym基准上达到业界领先水平，并扩展其Daybreak安全计划。新工具已能在主流浏览器、网络基础设施和操作系统中发现并生成关键漏洞补丁。同时推出Codex Security插件，支持深度扫描、漏洞验证、攻击路径追踪和针对特定代码库的补丁生成。「修补地球」（Patch the Planet）计划联合Trail of Bits、HackerOne等安全公司，以人工审核为核心，专注于开源软件漏洞修复，并配套推出网络安全合作伙伴计划。

阅读原文

Google发布Interactions API正式版，成为Gemini模型与智能体的主力接口

GoogleAI智能体API

Google宣布Interactions API正式上线（GA），取代旧版generateContent成为与Gemini模型及智能体交互的主要接口。该API从底层为有状态、智能体化工作流设计，新增Managed Agents（提供远程沙箱环境执行自主任务）、后台异步执行、工具混用能力，并以类型化action步骤的Steps模式替代传统角色定义。Google表示，未来长时运行模型与智能体的前沿能力将越来越多地独家落地于此API。它现已成为Google AI Studio的默认接口，并提供迁移指南。

阅读原文

Google推出Gemini Spark全天候个人AI智能体，限AI Ultra订阅用户测试

GoogleAI智能体生产力

Google正式发布Gemini Spark，一款7×24小时运行的个人AI智能体，可在用户指导下从头到尾自动完成任务。目前以beta形式向美国Google AI Ultra订阅用户开放，仅限该套餐使用。官方列举了六大实用场景，包括项目审计、新闻邮件聚合、品牌健康监测、销售谈判教练、Google Drive整理和客户会议准备，深度集成Google Workspace生态。

阅读原文

Novo Nordisk遭重大数据泄露，攻击者窃取Ozempic配方等超70万份文件

数据泄露信息安全

生物制药公司Novo Nordisk确认遭受严重数据泄露，攻击者通过泄露的GitHub个人访问令牌窃取超过70万份文件，内容包含Ozempic药物配方及临床试验数据，公司拒绝了2500万美元勒索要求。同期信息安全领域多起事件：FortiBleed凭证攻击已获取超8.6万个Fortinet设备登录凭据，涉及194个国家；德州狩猎许可系统遭入侵泄露约309万用户敏感信息。GitHub则升级密钥扫描系统，引入上下文感知LLM技术，将误报率降低75.76%。

Cursor在Compile大会宣布与SpaceX合作训练全新AI模型

CursorSpaceXAI编程

AI代码编辑器Cursor在其Compile主题演讲上公布三项重大更新，其中最受关注的是将与SpaceX合作训练一款全新的AI模型。此举凸显SpaceX在收购Cursor母公司Anysphere后，进一步深化在AI编程与底层模型研发领域的布局。具体技术细节与模型能力尚未完全披露。

阅读原文

研究揭示提示注入机制：LLM靠写作风格而非标签识别角色，CoT伪造成新攻击

AI安全提示注入LLM

一项机制可解释性研究指出，提示注入（Prompt Injection）的根本原因在于LLM并非依据<think>、<user>等标签识别角色，而是依赖写作风格。研究通过角色探针证明，剥离或更改标签不影响模型内部的角色感知，只有风格起作用。由此衍生出强力新攻击「CoT伪造」：攻击者将模仿模型推理风格的文本注入用户提示，使LLM将其当作自身已验证的推理，在多个模型上实现高越狱成功率，且无需针对特定模型定制。

阅读原文

前沿AI在真实对话中说服力超人类专家，近1.9万次实验验证

AI研究AI说服力

Import AI报道，在涉及近1.9万次对话的四项实验中，Opus、GPT、Gemini、Grok等前沿AI在政策辩论与慈善捐款任务上的说服力可靠地超越人类专家。即便专家自选议题、提前研究、经过数小时结构化练习并获得1000英镑现金激励，仍不敌AI。AI的优势主要来自更快、更长的消息输出；当被限制到人类速度时，差距随之缩小。研究者称问题已不再是AI能否胜过人类，而是这一能力将如何、在何处、为谁所用。

阅读原文

NVIDIA发布Halos for Robotics，将自动驾驶功能安全体系扩展至机器人

NVIDIA机器人功能安全

NVIDIA推出面向物理AI的全栈功能安全系统Halos for Robotics，将经过验证的自动驾驶安全技术（IEC 61508、ISO 13849标准）直接扩展至工业机器人、人形机器人和AMR，复用超1.8万工程师年的投入。IGX Thor平台提供硬件级安全隔离，配备12K DMIPs专用安全岛与2.2万余项安全机制，可达IEC 61508 SIL 3等级。配套的「由外而内」安全蓝图利用外部摄像头与AI做动态安全决策，并通过认证检测实验室为合作伙伴提供功能安全认证路径。

阅读原文

Mozilla借Claude定制Harness，4月发现并修复Firefox近500个安全漏洞

AI安全Claude智能体工作流

Mozilla杰出工程师Brian Ginstead介绍了基于Claude Agent SDK构建的定制Harness流程：LLM文件评分→分析器循环→模糊测试构建验证→验证子智能体→补丁智能体。该多阶段管线使Firefox在2026年4月发现并修复近500个安全漏洞，每个进入追踪系统的漏洞都附带可复现HTML文件与补丁建议。关键经验是用「我们确定这里有漏洞，找出它」的提示约束搜索空间，并以验证子智能体防止分析器作弊。他估算模型与Harness的贡献约为五五开，Harness改进仍有巨大空间。

阅读原文

JPMorgan在香港限制使用Anthropic的Claude，因合规与地缘政治顾虑

AnthropicAI监管金融科技

摩根大通（JPMorgan）出于合规和地缘政治顾虑，在香港限制员工使用Anthropic的AI模型Claude，反映出AI监管不明朗对金融机构落地的实际影响。与此同时，AI监管环境日益复杂，Anthropic因政策不明朗而持续陷入困境。该消息与多项金融科技动态同期出现，包括Kalshi启动IPO非正式讨论、Robinhood裁员近300人、Zelle计划推出稳定币「Zelle USD」用于国际支付等。

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。