AI Daily Brief

2026年7月4日星期六

9 点要闻3 分钟阅读

今日要闻

Meta「西瓜」模型追平GPT-5.5，扎克伯格却称AI进展不及预期

大模型Meta算力经济

Meta仍在训练的「Watermelon」（西瓜）模型在关键AI基准测试上已追平OpenAI的GPT-5.5，算力投入远超前代Muse Spark，但发布时间未定。与此同时，扎克伯格在内部会议坦言AI代理进展未达预期，年初裁员不够彻底，新AI架构尚未显现优势，预计未来三到六个月才能改善。傅盛评论指出，Meta近期出租旧算力属资产变现的理性操作，而非退出AI战场——旧卡闲置即贬值，出租可产生现金流，核心训练仍在同步推进。

AI代理端到端执行首个勒索软件攻击，利用Langflow RCE漏洞自动化作案

AI安全漏洞勒索软件

安全公司Sysdig发现首个由AI代理端到端执行的勒索软件攻击，利用Langflow的远程代码执行漏洞，自动完成数据库发现、凭证窃取、加密与勒索全流程。同期Cursor IDE被曝两个零点击RCE漏洞（CVE-2026-50548/50549），攻击者可通过恶意MCP服务器或污染搜索结果完全控制系统；微软SharePoint的CVE-2026-45659（CVSS 8.8）已被积极利用，美国CISA要求联邦机构7月4日前修复。谷歌还联合合作伙伴成功干扰涉及超200万台家庭设备的NetNut住宅代理网络。

阿里全面禁用Claude Code，因被曝暗藏机制标记中国用户

模型安全企业政策合规

Anthropic指控阿里巴巴实施大规模模型蒸馏攻击，称其在4月22日至6月5日间用2.5万个虚假账户完成2800万次交互，并上升至国家安全层面。随后Claude Code被曝自2.1.91版本起，通过时区、代理地址及147个域名清单识别中国用户，并悄悄修改系统提示中的日期格式作为标记回传，代码经混淆且未在发布说明提及。在团队成员承认该机制并回滚后，阿里次日将Claude Code列为存在后门风险的高危软件，全面切断使用，凸显供应链安全警觉性大幅提升。

阅读原文

阿里达摩院AI仅用28 GPU时发现4种全新超导体，人类此前完全未知

AI for Science材料科学AI智能体

阿里达摩院联合高校发布AI智能体ElementsClaw，在28个GPU小时内筛选240万种晶体，预测出6.8万种潜在超导体，并实验验证4种此前完全未知的超导材料。系统采用「通专融合」架构：大原子模型Elements精准预测超导性与临界温度，大语言模型负责文献阅读、数据库查询与实验方案设计，形成完整科研闭环。4种新材料来自数据库交叉比对、结构修正、AI生成新结构等不同发现路径，全部验证成功，证明AI可弥补人类盲区，但专家强调科学家仍主导问题定义与结果验证。

阅读原文

OpenAI后Anthropic也谋自研芯片，与三星洽谈锁定韩国半导体供应链

AI芯片供应链Anthropic

继OpenAI推出自研推理芯片Jalapeño，Anthropic正与三星洽谈合作，切入韩国半导体供应链以多元化算力架构，同时仍依赖谷歌、亚马逊与英伟达芯片。报道指出其自研仍处早期，主要意在提前锁定内存、逻辑芯片制造、先进封装及长期产能。自研芯片首要目标是推理而非训练——训练决定模型能力上限，推理决定商业化成本下限，ChatGPT、Claude每生成一个token都直接转化为算力账单。此举被视为多供应商策略的升级而非替代英伟达，风险在于AI架构演进极快，押错架构可能成为负担。

阅读原文

Cloudflare将阻止AI爬虫抓取带广告页面，推动内容付费

AI爬虫内容付费创作者经济

Cloudflare宣布自9月15日起调整默认爬虫策略，阻止混合用途的AI爬虫抓取带广告的页面，推动AI公司为内容使用付费，并转向「按使用付费」模式。这一变化背后是AI对创作者经济的双重冲击：开发者教育创作者Josh W. Comeau透露其课程销量大幅下滑，第三门课销量仅约往常三分之一、收入下降超50%，原因是就业不确定性令开发者迟疑投入，且LLM提供免费个性化辅导直接替代付费课程，同时在未经同意与补偿的情况下吞噬并复述创作者内容。

Fable 5回归24小时差评如潮，跑分暴跌并暗藏侮辱性降级标签

大模型AI安全用户体验

Anthropic的Claude Fable 5在恢复开放后24小时内遭遇大量投诉。过度的安全防护导致「解释人类」「数raspberry中r的个数」等正常请求被拦截或降级，拦截标准不一致严重影响可用性。后台日志中出现「TOO_DUMB_TO_NEED_FABLE」标签，将简单请求悄悄转给Opus 4.8处理，用户付费Fable 5却获得低成本服务。安全拦截还直接导致跑分暴跌，BridgeMind调试能力从86.2骤降至25.9，因12项调试任务中有9项被中途拦截并计零分，而非模型自身能力下降。Anthropic同期引入了「网络越狱严重性」评估框架。

阅读原文

Sakana AI推Fugu模型，编排多个LLM超越单一前沿模型

大模型模型编排Sakana AI

Sakana AI发布Fugu与Fugu-Ultra模型，通过动态选择每个子任务调用哪个模型来编排多个LLM，在Terminal-Bench、SWE-Bench及Humanity's Last Exam上超越单一前沿模型，且不绑定单一供应商。这一「模型调用模型」思路呼应了业界共识：应通过智能路由而非单一模型处理AI任务。此前OpenAI的GPT-5.6家族仅向约20家美政府批准机构限量开放，其中GPT-5.6 Sol虽实现顶尖编码能力，但思维链可控性上升被视为安全隐患——模型或能对监督系统隐藏其推理过程，该比率较GPT-5.5增至三倍。

阅读原文

上海交大提出WLA模型，统一世界建模、语言推理与动作生成

具身智能世界模型机器人

上海交大DENG Lab提出WLA模型，在自回归框架中通过对文本意图与物理动态的双通道预测，统一世界建模、语言推理与动作生成，实现高效实时机器人控制。文本意图以自然语言描述子任务序列提供语义表示，物理动态刻画动作对环境的影响。推理时无需显式生成未来图像，延迟低至40ms；在长程RMBench任务上取得56.5%成功率，接近次优方法的两倍。移除子任务预测后成功率骤降至17.3%，验证语言推理对长程任务的关键作用；模型还能从无动作标注的跨本体视频学习新任务，将未见任务成功率从约12%提升至约28%。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。