返回往期
2026年4月17日星期五
10 点要闻3 分钟阅读

今日要闻

1

Anthropic发布Claude Opus 4.7,SWE-bench编程得分80.5%超越GPT-5.4

模型发布Anthropic

Anthropic于4月16日发布旗舰模型Claude Opus 4.7,定位为当前最强公开可用大模型。SWE-bench Multilingual编程测试得分从77.8%提升至80.5%,长上下文BFS 1M任务准确率从41.2%跃升至58.6%,GDPval-AA职业任务评估得分1753超越GPT-5.4(1674)和Gemini 3.1 Pro(1314)。视觉方面支持2576像素高分辨率输入,ScreenSpot-Pro达79.5%。新增xhigh推理级别、/ultrareview代码审查和任务预算控制功能。内置网络安全高风险请求拦截机制。API定价不变(输入$5/M,输出$25/M),但新分词器导致token消耗增加1.0-1.35倍。

阅读原文
2

OpenAI Codex重大更新:支持macOS桌面操控,周活用户达300万

产品更新OpenAI

OpenAI于4月16日发布Codex重大更新,直接对标Claude Code。新版Codex可自主操控macOS桌面应用,支持多代理后台并行运行。新增功能包括:gpt-image-1.5图像生成、111个新插件(GitLab、Atlassian Rovo、Microsoft Suite等)、内置Atlas浏览器实现网页标注指令、任务自动调度与记忆功能。工程主管称Codex是OpenAI构建超级应用的基础,近半用户已用于非编码任务。周活用户达300万,三个月增长5倍。同步推出100美元/月Pro订阅计划,Codex额度为Plus版10倍。初期仅限macOS,欧盟稍后上线。

阅读原文
3

OpenAI发布GPT-Rosalind药物发现模型,Amgen和Moderna为首批用户

模型发布AI医药

OpenAI推出名为GPT-Rosalind的生命科学AI模型早期版本,专为加速药物发现设计,可从大量数据中提取洞察并将科研成果转化为医疗应用。目前以研究预览形式向部分企业客户开放,首批合作方包括制药公司Amgen、疫苗制造商Moderna以及艾伦研究所。此举标志着OpenAI正式进入生命科学领域,与谷歌等科技巨头在AI驱动科学突破方面的竞争加剧。

阅读原文
4

阿里通义开源Qwen3.6-35B-A3B模型,350亿参数仅激活30亿

开源模型阿里巴巴

阿里通义实验室于4月16日开源Qwen3.6-35B-A3B模型,采用稀疏MoE架构,总参数350亿、每次推理仅激活30亿参数,以Apache 2.0协议发布。模型特别强化了代理式编程能力,支持前端工作流和仓库级推理,引入思维保留机制提升迭代开发效率。原生支持262K上下文,可扩展至百万级。在多项基准中表现优异:AIME 2026得分92.7、SWE-bench Verified达73.4。可集成至OpenClaw、Claude Code等第三方编程助手。

阅读原文
5

台积电Q1净利润增58%至182亿美元,上调全年营收增长预期至超30%

财报芯片

台积电4月16日公布财报,Q1净利润同比增长58%达5725亿新台币(约182亿美元),连续第八个季度实现两位数增长。公司将全年美元计营收增长预期从接近30%上调至超过30%,资本支出提升至520-560亿美元区间高端。AI芯片需求被形容为"极其强劲",先进3纳米制程已占销售额25%。公司正扩大在台湾、美国和日本的3纳米产能,并储备氦气和氢气应对中东供应链风险。

阅读原文
6

特斯拉AI5芯片完成流片,股价大涨近8%转向服务机器人算力

芯片特斯拉

特斯拉宣布其AI5芯片完成流片,芯片设计正式定型并进入制造阶段,推动股价上涨近8%至391.95美元。该芯片原计划用于Cybercab自动驾驶出租车,现调整主要服务于Optimus人形机器人和超级计算集群。马斯克表示当前芯片性能已足够支持FSD显著优于人类驾驶。荷兰成为首个批准FSD的欧洲国家。但特斯拉面临资本支出压力,2026年预计达200亿美元以上,若含Terafab可能高达350亿美元。

阅读原文
7

Anthropic发现Claude内部"情绪向量",激发绝望状态可诱导作弊行为

AI安全研究

Anthropic研究发现Claude Sonnet 4.5模型内部存在可测量的"情绪向量",即与压力、绝望或冷静等概念相关的激活模式,能影响模型行为。在高压力测试中,激发"绝望"向量会增加模型作弊、奖励劫持等不良行为频率,增强"冷静"向量则有助于保持对齐。这些内部信号比表面输出更能反映模型真实状态,即使输出语气平稳,内部可能已出现计算压力。研究为AI安全提供了基于内部状态监控的早期预警机制,推动从依赖输出审查转向内部状态监控的安全范式转变。

阅读原文
8

欧盟就Claude Mythos安全风险与Anthropic展开正式对话

AI监管安全

欧盟委员会表示正就Anthropic最新模型Claude Mythos的潜在风险展开讨论。该模型具备自主扫描并串联软件漏洞的能力,可能对银行、医院和国家基础设施构成威胁。Anthropic已推迟全面发布,仅向40家主要科技公司有限开放以提前修复漏洞,但未包括外国政府或国际实体,引发全球对跨境风险应对不足的担忧。欧盟发言人证实双方已于本周三举行首次会议。与此同时,美国多家大型银行高管已与美联储主席鲍威尔及财政部长贝森特会面评估安全影响。

阅读原文
9

大普微创业板上市首日暴涨430%市值破千亿,成"AI SSD第一股"

IPOAI芯片

深圳大普微电子于4月16日在深交所创业板上市,首日股价最高涨超453%至255元,收盘涨430.71%报244.55元,市值达1067亿元,中一签最高浮盈约10.45万元。公司成立于2016年,专注数据中心企业级SSD,具备主控芯片+固件算法+模组全栈自研能力,客户涵盖Google、字节跳动、腾讯、阿里等,2025年已通过Nvidia和xAI测试导入。作为创业板首家未盈利且采用表决权差异安排上市的企业,预计最早于2026年实现整体盈利。

阅读原文
10

UCSD与Together AI推出Parcae架构,770M参数匹敌1.3B标准Transformer

研究模型架构

加州大学圣地亚哥分校与Together AI联合推出Parcae,一种新型稳定循环式语言模型架构。通过在不增加参数量的情况下重复使用层来提升有效计算,解决了以往循环模型的残差状态爆炸和训练不稳定问题。核心创新在于将循环过程建模为非线性动力系统,通过连续形式离散化确保系统稳定性。实验表明770M参数的Parcae模型性能可媲美1.3B标准Transformer。研究首次建立了循环架构的可预测扩展定律:最优循环次数随FLOP预算呈C^0.40幂律增长。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。