返回往期
2026年5月17日星期日
8 点要闻3 分钟阅读

今日要闻

1

OpenAI联合创始人Brockman接管产品战略,将ChatGPT、Codex和API整合为统一平台

OpenAI组织架构产品战略

OpenAI联合创始人兼总裁格雷格·布罗克曼正式接管公司产品战略,计划将ChatGPT、Codex和开发者API整合为统一的"代理型平台",打造集聊天、编程与浏览器于一体的桌面超级应用。此举发生在AGI部署负责人Fidji Simo因病休假期间,也是Google I/O大会前的关键战略调整。布罗克曼在内部备忘录中强调将集中资源聚焦"代理式未来",同时覆盖消费和企业市场。此前CEO阿尔特曼已宣布暂停Sora和OpenAI for Science等非核心项目。公司预计2026年亏损140亿美元,面临高管流失和马斯克诉讼等多重挑战,但仍在推进可能于年底进行的IPO。

阅读原文
2

xAI发布Grok 4.3 Beta,5000亿参数MoE架构支持200万token上下文

xAI大模型产品发布

xAI于5月17日发布新一代推理大模型Grok 4.3 Beta,目前处于早期访问阶段,仅对SuperGrok订阅用户开放。该模型参数规模约5000亿,采用MoE架构,上下文长度达200万tokens,支持文本输入输出,核心改进集中在增强的长上下文处理能力和潜在的原生视频理解能力。模型延续Grok 4.2的多智能体协作架构,由多个专业智能体并行工作以提升准确性。API定价为输入每百万tokens 3美元、输出15美元。模型为闭源,尚无官方评测数据公布。Hermes Agent v0.14.0已同步支持通过SuperGrok OAuth接入Grok 4.3,上下文窗口可达100万token。

阅读原文
3

NVIDIA开源SANA-WM世界模型,26亿参数单GPU生成60秒720p视频

NVIDIA开源视频生成

NVIDIA推出SANA-WM,一个26亿参数的开源世界模型,基于Diffusion Transformer架构,能在单GPU上生成长达60秒的720p视频。核心技术包括:帧级Gated DeltaNet与混合注意力机制解决长序列内存问题;双分支相机控制实现6自由度轨迹精确跟随;两阶段生成流程将视觉漂移ΔIQ从3.09降至0.31。在8块H100上吞吐量达22.0视频/小时,是同类模型LingBot-World的36倍。蒸馏版本可在单块RTX 5090上34秒完成一次去噪。模型在64块H100上训练约18.5天,代码已通过Apache 2.0协议在NVlabs/Sana仓库开源。

阅读原文
4

Google DeepMind发布Veo 3视频生成模型,原生支持音视频同步生成

Google DeepMind视频生成多模态

Google DeepMind发布最新文本生成视频模型Veo 3,可生成最长60秒视频并原生支持同步音频生成,包括对话、音效和环境声音。这一能力显著区别于Sora和Runway Gen-3 Alpha等需后期添加音频的先前模型,有望大幅减少内容创作者的编辑时间。Veo 3通过三种途径提供访问:Google One AI Premium(19.99美元/月)、Google Labs的VideoFX(需加入等待名单)以及面向开发者的Gemini API,目前处于有限访问阶段。模型架构、参数量和评估指标尚未公布,未来需关注API速率限制、内容审核政策及长对话唇音同步准确性等指标。

阅读原文
5

OpenAI推出ChatGPT个人理财功能,通过Plaid接入12000+金融机构账户

OpenAI金融科技隐私安全

OpenAI推出ChatGPT个人金融工具,允许用户通过Plaid平台以只读方式连接超过12000家金融机构的银行账户,包括Chase、Fidelity、Robinhood等,进行支出分析、投资追踪、订阅管理和财务规划。该功能目前面向美国ChatGPT Pro用户开放预览版,基于GPT-5.5模型并与金融专家合作优化。隐私方面,断开账户后数据30天内删除,支持手动清除财务记忆。但财务对话默认用于模型训练,用户需主动关闭。此举紧随OpenAI收购个人金融公司Hiro团队,目前已有超2亿用户每月向ChatGPT提出财务问题。同日OpenAI还遭集体诉讼,被指在ChatGPT中嵌入Meta Pixel和Google Analytics追踪工具。

阅读原文
6

OpenAI与马耳他政府达成协议,全民免费提供一年ChatGPT Plus

OpenAIAI普惠政府合作

OpenAI于5月16日宣布与马耳他政府达成协议,向所有马耳他居民提供为期一年的ChatGPT Plus免费访问权限,前提是完成一门关于AI使用的免费课程。该项目于5月启动并逐步扩大覆盖范围,也向居住在海外的马耳他公民开放。马耳他成为全球首个推出此类计划的国家。课程由马耳他大学设计,包含AI基础、AI与日常生活、AI学习三个必修模块。该项目属于OpenAI的"OpenAI for Countries"业务线,此前已与爱沙尼亚和希腊的教育系统合作。OpenAI未披露协议的财务细节。

阅读原文
7

Claude商业AI市场份额首次超越ChatGPT,达34.4%对32.3%

Anthropic市场格局竞争态势

2026年5月17日,Anthropic的Claude在付费商业AI导入市场份额中首次超越OpenAI,以34.4%对32.3%的占比登顶。这一逆转主要得益于开发者群体广泛支持的Claude Code以及对专业职种的精准定位策略。与此同时,开源模型生态持续繁荣,DeepSeek V4-Flash和轻量化的llama.cpp推动了LLM内部激活直接操作的"转向"技术受到关注。CAISI评估显示开源模型整体仍落后美国闭源前沿模型约3至7个月,但评测方法的局限性可能低估了实际能力差距。

阅读原文
8

阿里健康发布医学AI产品"氢离子",获BMJ独家文献授权

医疗AI阿里健康产品发布

阿里健康发布医学AI产品"氢离子",旨在为中国500万医生提供基于循证医学的AI助手。该产品通过四层循证AI架构实现证据理解、精准检索、模型微调与专家评审,确保每条回答有权威文献支持并可追溯至原文段落。关键突破在于与英国BMJ集团达成独家合作,获得旗下70本期刊过去十年全部内容授权,成为国内唯一可直接访问BMJ顶级文献的医学AI。此外已对接中华医学会、人民卫生出版社等国内权威机构。产品支持自然语言、语音、图片等多种提问方式,可将医生阅读一篇SCI论文的时间从1-2小时缩短至3-5分钟。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。