OpenAI发布GPT-5.5,专注代理推理与工具使用,Terminal-Bench达82.7%
OpenAI于5月8日正式发布GPT-5.5,该模型专注于高级代理推理和工具使用,可自主执行调试代码、操作软件和多步骤研究等复杂任务。在Terminal-Bench 2.0测试中达82.7%准确率,展现强大的命令行规划能力,在SWE-Bench Pro上略逊于Claude Opus 4.7但token效率更高。NVIDIA已内部部署,将调试周期从数天缩短至数小时。模型与NVIDIA GB200和GB300 NVL72 Blackwell系统协同设计。OpenAI同时部署了最严格的安全分类器,防范网络安全和生物安全风险。此外GPT-5.5-Cyber网络安全专用版本已向经审核的关键基础设施保护组织扩大访问。
阅读原文