AI Daily Brief

2026年5月27日星期三

8 点要闻3 分钟阅读

今日要闻

面壁智能发布全球首个AI自主编写的生产级预训练框架ForgeTrain

AI基础设施开源

面壁智能宣布全球首个由AI完全自主编写的生产级大模型预训练框架ForgeTrain诞生，并用其成功训练出MiniCPM5-1B端侧模型。ForgeTrain性能超越英伟达Megatron，在相同硬件下训练速度提升10%，并在华为昇腾平台上实现10%加速。MiniCPM5-1B仅1B参数，在AA-Index上超越所有2B以下模型，支持131K长上下文和混合推理，可部署于手机到服务器多种设备。面壁智能提出Forge Engineering新范式，通过AI为不同模型、硬件和任务定制专用代码，将数周的人工代码开发压缩至数十分钟。相关模型与框架已全面开源，标志着"AI制造AI"从概念进入可复现工程阶段。

阅读原文

PNAS研究：GPT-4.5以73%误判率正式通过图灵测试

AI研究里程碑

加州大学圣地亚哥分校研究人员在《美国国家科学院院刊》发表研究，对四种大语言模型进行图灵测试。284名参与者完成1023轮五分钟文本对话，结果显示GPT-4.5在73%的情况下被误认为真人，成功通过测试。LLaMa-3.1-405B识别率为56%，较旧的GPT-4o和ELIZA分别仅为21%和23%。研究指出，尽管AI在短时间交互中已几乎无法与人类区分，但也引发对"伪造人类"现象的担忧，可能影响在线信任、社交互动及就业。研究人员同时质疑图灵测试是否仍适合作为衡量机器智能的有效标准。

阅读原文

Google DeepMind AlphaProof Nexus攻克9道Erdős难题，最久悬置56年

AI研究数学

Google DeepMind发布AlphaProof Nexus系统，利用Gemini 3.1 Pro结合Lean形式化验证，成功解决9个长期未解的Erdős数学问题，其中两个悬而未决56年。系统还证明了44个整数序列猜想，解决了一个15年的代数几何问题，并发现了新的优化理论参数。所有证明均通过机器验证确保逻辑严密，每道题算力成本仅数百美元。在353个尝试中成功率约2.5%，但方法论意义重大：AI从"黑箱预言家"转变为可追溯的研究伙伴。DeepMind负责人Hassabis强调该系统仍"远未达到"AGI水平。

阅读原文

Anthropic完成超300亿美元融资，估值达9000亿美元超越OpenAI

融资AI安全

据报道，Anthropic于5月26日至27日完成超300亿美元融资，估值达9000亿美元，超越OpenAI成为全球最有价值的AI初创企业。同时，Anthropic正准备通过Claude Code平台扩大其最先进模型Claude Mythos的商业访问范围，推出Mythos 1新版本。此前启动的Project Glasswing已与AWS、微软、谷歌等40多家合作伙伴合作，Mythos在其中识别出超1万项高危漏洞。Claude Security平台也正升级为完整漏洞管理工具，目前已发现1596个漏洞涉及281个开源项目。

阅读原文

三星电子6月起全面引入ChatGPT、Gemini和Claude

企业AI产业应用

三星电子宣布将于6月在其设备体验（DX）部门全面推出外部生成式AI服务，包括OpenAI的ChatGPT、Google Gemini和Anthropic的Claude。公司采用双轨策略，结合自研Samsung Gauss与外部AI工具，旨在提升从产品规划到营销等环节的生产力。此前4月至5月期间已组织2500名员工进行概念验证测试，并建立了要求员工接受内部安全培训后方可使用外部AI的管控机制。三星还计划到2030年将所有全球生产基地转型为AI驱动的智能工厂，并逐步部署人形制造机器人。

阅读原文

Together AI开源OSCAR，实现2-bit KV Cache量化近无损推理

开源推理优化

Together AI推出并开源OSCAR（Offline Spectral Covariance-Aware Rotation），面向长上下文LLM服务的2-bit KV缓存量化系统。OSCAR通过注意力感知的离线校准生成数据感知旋转矩阵，将量化误差引导至注意力不敏感方向，在约2.28有效比特下实现接近BF16精度。在Qwen3和GLM-4.7-FP8等模型上测试，32K上下文下平均准确率损失极小，解码吞吐量最高提升3倍，批处理场景下作业级吞吐量可达7.83倍，整体KV内存减少约8倍。已集成至SGLang推理框架，兼容分页注意力和前缀缓存。

阅读原文

OpenRouter完成1.13亿美元B轮融资，周处理量达25万亿token

融资AI基础设施

AI推理路由平台OpenRouter宣布完成1.13亿美元B轮融资，由Alphabet旗下CapitalG领投，Nvidia NVentures、ServiceNow Ventures、MongoDB Ventures等跟投。该公司提供统一接口帮助企业接入数百种AI模型，支持智能路由、成本控制和策略管理。平台周处理量已达25万亿token，较半年前增长五倍，服务超800万全球用户。其公开的模型使用数据和排名已成为行业参考指标。新资金将用于扩展路由、治理和优化能力。

阅读原文

微软发布MAI-Image-2.5文生图模型，Arena排行榜首秀第三

模型发布图像生成

微软AI首席执行官Mustafa Suleyman发布新一代文本生成图像模型MAI-Image-2.5，在Arena文本到图像排行榜上首次亮相即位列第三，得分1254分，比前代提升72分。微软AI成为继Google DeepMind和OpenAI之后进入该领域前五名的新晋实验室。新模型在视觉推理方面表现突出，包括物体关系、场景结构、光照、比例和空间关系等细节处理更精准，文字清晰度和品牌视觉呈现均有显著提升。用户已可在Arena.ai平台试用，预计下周登陆MAI Playground和Microsoft Foundry。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。