返回往期
2026年6月23日星期二
10 点要闻3 分钟阅读

今日要闻

1

OpenAI扩展Daybreak安全计划,发布GPT-5.5-Cyber并启动「修补地球」开源项目

AI安全OpenAI漏洞修复

OpenAI正式发布GPT-5.5-Cyber模型,在CyberGym基准上达到业界领先水平,并扩展其Daybreak安全计划。新工具已能在主流浏览器、网络基础设施和操作系统中发现并生成关键漏洞补丁。同时推出Codex Security插件,支持深度扫描、漏洞验证、攻击路径追踪和针对特定代码库的补丁生成。「修补地球」(Patch the Planet)计划联合Trail of Bits、HackerOne等安全公司,以人工审核为核心,专注于开源软件漏洞修复,并配套推出网络安全合作伙伴计划。

阅读原文
2

Google发布Interactions API正式版,成为Gemini模型与智能体的主力接口

GoogleAI智能体API

Google宣布Interactions API正式上线(GA),取代旧版generateContent成为与Gemini模型及智能体交互的主要接口。该API从底层为有状态、智能体化工作流设计,新增Managed Agents(提供远程沙箱环境执行自主任务)、后台异步执行、工具混用能力,并以类型化action步骤的Steps模式替代传统角色定义。Google表示,未来长时运行模型与智能体的前沿能力将越来越多地独家落地于此API。它现已成为Google AI Studio的默认接口,并提供迁移指南。

阅读原文
3

Google推出Gemini Spark全天候个人AI智能体,限AI Ultra订阅用户测试

GoogleAI智能体生产力

Google正式发布Gemini Spark,一款7×24小时运行的个人AI智能体,可在用户指导下从头到尾自动完成任务。目前以beta形式向美国Google AI Ultra订阅用户开放,仅限该套餐使用。官方列举了六大实用场景,包括项目审计、新闻邮件聚合、品牌健康监测、销售谈判教练、Google Drive整理和客户会议准备,深度集成Google Workspace生态。

阅读原文
4

Novo Nordisk遭重大数据泄露,攻击者窃取Ozempic配方等超70万份文件

数据泄露信息安全

生物制药公司Novo Nordisk确认遭受严重数据泄露,攻击者通过泄露的GitHub个人访问令牌窃取超过70万份文件,内容包含Ozempic药物配方及临床试验数据,公司拒绝了2500万美元勒索要求。同期信息安全领域多起事件:FortiBleed凭证攻击已获取超8.6万个Fortinet设备登录凭据,涉及194个国家;德州狩猎许可系统遭入侵泄露约309万用户敏感信息。GitHub则升级密钥扫描系统,引入上下文感知LLM技术,将误报率降低75.76%。

5

Cursor在Compile大会宣布与SpaceX合作训练全新AI模型

CursorSpaceXAI编程

AI代码编辑器Cursor在其Compile主题演讲上公布三项重大更新,其中最受关注的是将与SpaceX合作训练一款全新的AI模型。此举凸显SpaceX在收购Cursor母公司Anysphere后,进一步深化在AI编程与底层模型研发领域的布局。具体技术细节与模型能力尚未完全披露。

阅读原文
6

研究揭示提示注入机制:LLM靠写作风格而非标签识别角色,CoT伪造成新攻击

AI安全提示注入LLM

一项机制可解释性研究指出,提示注入(Prompt Injection)的根本原因在于LLM并非依据<think>、<user>等标签识别角色,而是依赖写作风格。研究通过角色探针证明,剥离或更改标签不影响模型内部的角色感知,只有风格起作用。由此衍生出强力新攻击「CoT伪造」:攻击者将模仿模型推理风格的文本注入用户提示,使LLM将其当作自身已验证的推理,在多个模型上实现高越狱成功率,且无需针对特定模型定制。

阅读原文
7

前沿AI在真实对话中说服力超人类专家,近1.9万次实验验证

AI研究AI说服力

Import AI报道,在涉及近1.9万次对话的四项实验中,Opus、GPT、Gemini、Grok等前沿AI在政策辩论与慈善捐款任务上的说服力可靠地超越人类专家。即便专家自选议题、提前研究、经过数小时结构化练习并获得1000英镑现金激励,仍不敌AI。AI的优势主要来自更快、更长的消息输出;当被限制到人类速度时,差距随之缩小。研究者称问题已不再是AI能否胜过人类,而是这一能力将如何、在何处、为谁所用。

阅读原文
8

NVIDIA发布Halos for Robotics,将自动驾驶功能安全体系扩展至机器人

NVIDIA机器人功能安全

NVIDIA推出面向物理AI的全栈功能安全系统Halos for Robotics,将经过验证的自动驾驶安全技术(IEC 61508、ISO 13849标准)直接扩展至工业机器人、人形机器人和AMR,复用超1.8万工程师年的投入。IGX Thor平台提供硬件级安全隔离,配备12K DMIPs专用安全岛与2.2万余项安全机制,可达IEC 61508 SIL 3等级。配套的「由外而内」安全蓝图利用外部摄像头与AI做动态安全决策,并通过认证检测实验室为合作伙伴提供功能安全认证路径。

阅读原文
9

Mozilla借Claude定制Harness,4月发现并修复Firefox近500个安全漏洞

AI安全Claude智能体工作流

Mozilla杰出工程师Brian Ginstead介绍了基于Claude Agent SDK构建的定制Harness流程:LLM文件评分→分析器循环→模糊测试构建验证→验证子智能体→补丁智能体。该多阶段管线使Firefox在2026年4月发现并修复近500个安全漏洞,每个进入追踪系统的漏洞都附带可复现HTML文件与补丁建议。关键经验是用「我们确定这里有漏洞,找出它」的提示约束搜索空间,并以验证子智能体防止分析器作弊。他估算模型与Harness的贡献约为五五开,Harness改进仍有巨大空间。

阅读原文
10

JPMorgan在香港限制使用Anthropic的Claude,因合规与地缘政治顾虑

AnthropicAI监管金融科技

摩根大通(JPMorgan)出于合规和地缘政治顾虑,在香港限制员工使用Anthropic的AI模型Claude,反映出AI监管不明朗对金融机构落地的实际影响。与此同时,AI监管环境日益复杂,Anthropic因政策不明朗而持续陷入困境。该消息与多项金融科技动态同期出现,包括Kalshi启动IPO非正式讨论、Robinhood裁员近300人、Zelle计划推出稳定币「Zelle USD」用于国际支付等。

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。