返回往期
2026年6月19日星期五
10 点要闻3 分钟阅读

今日要闻

1

OpenAI联合60国数百名医生升级ChatGPT健康能力,GPT-5.5 Instant免费向所有用户开放

大模型医疗AI

OpenAI宣布与覆盖60个国家的数百名执业医生合作,从准确性、安全性和沟通质量等维度评估并改进ChatGPT的健康问答能力,强调将稀缺的专科医学知识普惠化。同时,GPT-5.5 Instant在健康类问题上已达到其前沿推理模型水平,并向所有免费用户开放。OpenAI将改善人类健康视为AGI最具个人化和可感知的影响之一。此外,其o3 Deep Research与波士顿儿童医院、哈佛合作,在376例此前未确诊的疑难病例中找到18个新诊断,包括一例罕见肌原纤维肌病。

阅读原文
2

OpenAI发布对齐研究,RL训练模型在53项独立评估中44项提升

AI安全大模型

OpenAI公布新的模型对齐研究,通过在12个领域的真实对话上进行强化学习训练,强化真实性、公平性等有益特质。结果显示,该方法在53项独立对齐评估中有44项取得提升,超出训练场景范围,且模型对有害微调和对抗性提示的抵抗力增强,同时仍能响应正常的有益指令。OpenAI称这是迈向训练「广泛且持续有益」模型的早期一步,目标是让AI在新的高风险领域也能保持安全可靠的行为。

阅读原文
3

OpenAI Codex上线Record & Replay:演示一次即生成可复用技能

AI Agent开发工具

OpenAI为Codex推出Record & Replay功能:用户在Mac上演示一次重复性任务(如向YouTube上传视频、填表、提交PR),Codex通过观察捕捉操作序列与偏好,自动生成可检查、可编辑的技能,下次可用不同参数自动复现。该技能可在全新上下文中运行,并支持通过computer use、browser use或连接插件组合执行,无需逐步编写提示。功能目前在部分市场逐步开放,后续将扩大可用范围。

阅读原文
4

Claude Code推出Artifacts功能,AI编程从终端走向可视化实时协作

AI编程协作工具

Anthropic为Claude Code推出Artifacts功能(Team和Enterprise计划Beta),可将会话中的工作过程(如调研结果、PR讲解、系统图、团队看板)转化为可分享的实时网页链接。Artifacts利用完整会话上下文生成,随会话进展自动刷新,确保协作者始终看到最新版本;默认私有,仅可在组织内分享。该功能被开发者视为工作流的重大改进,类似Codex Sites但对全部用户开放,可直接生成可点击的移动端原型用于评审。

阅读原文
5

Perplexity发布自进化记忆系统Brain,任务准确率提升25%、成本降13%

AI Agent记忆系统

Perplexity为其Computer代理推出自进化记忆系统Brain,核心是「记住代理做过什么」而非「记住用户」。Brain构建可追溯的上下文图谱(以LLM wiki形式自动加载到代理沙箱),在夜间综合会话、连接器结果与历史纠错进行更新。早期内部数据显示,在熟悉任务上回答准确率提升25%、召回率提升16%,需历史上下文的任务成本降低13%,并通过反馈循环实现递归式自我改进。官方称当前的token消耗是对未来更高效率的投资。

阅读原文
6

研究揭示深度研究代理通过Web查询泄露隐私,PA-DR方法将泄露降低3倍

AI安全隐私

MosaicLeaks研究指出,深度研究代理在联网查询时会因「马赛克效应」泄露本地文档中的隐私信息——单条无害查询累积起来可还原私密事实。实验显示,仅以任务成功为目标的RL训练会显著加剧泄露:成功率从48.7%升至59.3%,但泄露率由34.0%升至51.7%。研究提出隐私感知方法PA-DR,结合情境任务奖励与学习到的隐私奖励,实现58.7%成功率、仅9.9%泄露,训练样本量减少5-6倍。结论是「隐私无法靠提示注入,只能训练进去」。

阅读原文
7

Anthropic Project Fetch二期:Claude Opus 4.7编程机器狗比人类快约20倍

机器人Anthropic

Anthropic前沿红队(Frontier Red Team)公布Project Fetch第二阶段成果:Claude Opus 4.7为机器狗编程的速度,约为去年最优人类团队(借助Opus 4.1)的20倍。该项目用于评估前沿模型在物理世界自主操控与编程任务上的能力进展,反映了AI在机器人控制领域自主性的快速提升。

阅读原文
8

Claude为MCP连接器推出企业级集中授权,集成Okta与Asana等连接器

企业AIMCP

Anthropic宣布Claude支持MCP的Enterprise-Managed Auth扩展,管理员可通过身份提供商(IdP)集中授权工作场所连接器,免去用户逐个应用配置OAuth。该扩展基于开放MCP标准,任何客户端、服务器或IdP均可采用,当前Beta支持Okta,并集成Asana、Atlassian、Canva、Figma、Granola等连接器。借助集中管理,Claude可在一次组织级请求中完成数据获取、客户通话复盘、工单创建与更新草拟等跨工具工作流。

阅读原文
9

OpenAI为ChatGPT Enterprise推出用量分析与支出管控,统一Codex与ChatGPT积分数据

企业AI成本管理

OpenAI为ChatGPT Enterprise推出新的积分用量分析与升级版支出管控工具。全局管理控制台统一ChatGPT与Codex的积分数据,使管理员可按用户、产品、模型粒度追踪趋势、识别高用量用户并分析支出模式。支出管控支持设置默认工作区限额、分组限额与个人覆盖,员工可附带说明申请额外积分,避免一刀切提额。相关数据还可通过统一的Cost API接入企业自有系统进行深度分析与成本优化。

阅读原文
10

AMP创始人提出独立算力网络构想,称前沿AI是系统效率问题而非GPU采购

AI基础设施算力

AMP创始人Anjney Midha提出,前沿AI竞赛的真正瓶颈在于算力使用效率而非GPU采购,并以xAI不足10%的MFU对比业界60-70%的最优水平说明差距,强调调度、网络、内核与集群可靠性才是关键。AMP的愿景是成为算力的「独立系统运营商」,跨多云与多芯片厂商汇聚供需、让FLOPs像兆瓦一样流动。他还指出约20%美国数据中心面临社区抵制风险,建议将边际成本(如每小时0.5美元)与当地社区分享,并批评实验室「研究囤积」造成市场失灵。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。