返回往期
2026年7月4日星期六
9 点要闻3 分钟阅读

今日要闻

1

Meta「西瓜」模型追平GPT-5.5,扎克伯格却称AI进展不及预期

大模型Meta算力经济

Meta仍在训练的「Watermelon」(西瓜)模型在关键AI基准测试上已追平OpenAI的GPT-5.5,算力投入远超前代Muse Spark,但发布时间未定。与此同时,扎克伯格在内部会议坦言AI代理进展未达预期,年初裁员不够彻底,新AI架构尚未显现优势,预计未来三到六个月才能改善。傅盛评论指出,Meta近期出租旧算力属资产变现的理性操作,而非退出AI战场——旧卡闲置即贬值,出租可产生现金流,核心训练仍在同步推进。

2

AI代理端到端执行首个勒索软件攻击,利用Langflow RCE漏洞自动化作案

AI安全漏洞勒索软件

安全公司Sysdig发现首个由AI代理端到端执行的勒索软件攻击,利用Langflow的远程代码执行漏洞,自动完成数据库发现、凭证窃取、加密与勒索全流程。同期Cursor IDE被曝两个零点击RCE漏洞(CVE-2026-50548/50549),攻击者可通过恶意MCP服务器或污染搜索结果完全控制系统;微软SharePoint的CVE-2026-45659(CVSS 8.8)已被积极利用,美国CISA要求联邦机构7月4日前修复。谷歌还联合合作伙伴成功干扰涉及超200万台家庭设备的NetNut住宅代理网络。

3

阿里全面禁用Claude Code,因被曝暗藏机制标记中国用户

模型安全企业政策合规

Anthropic指控阿里巴巴实施大规模模型蒸馏攻击,称其在4月22日至6月5日间用2.5万个虚假账户完成2800万次交互,并上升至国家安全层面。随后Claude Code被曝自2.1.91版本起,通过时区、代理地址及147个域名清单识别中国用户,并悄悄修改系统提示中的日期格式作为标记回传,代码经混淆且未在发布说明提及。在团队成员承认该机制并回滚后,阿里次日将Claude Code列为存在后门风险的高危软件,全面切断使用,凸显供应链安全警觉性大幅提升。

阅读原文
4

阿里达摩院AI仅用28 GPU时发现4种全新超导体,人类此前完全未知

AI for Science材料科学AI智能体

阿里达摩院联合高校发布AI智能体ElementsClaw,在28个GPU小时内筛选240万种晶体,预测出6.8万种潜在超导体,并实验验证4种此前完全未知的超导材料。系统采用「通专融合」架构:大原子模型Elements精准预测超导性与临界温度,大语言模型负责文献阅读、数据库查询与实验方案设计,形成完整科研闭环。4种新材料来自数据库交叉比对、结构修正、AI生成新结构等不同发现路径,全部验证成功,证明AI可弥补人类盲区,但专家强调科学家仍主导问题定义与结果验证。

阅读原文
5

OpenAI后Anthropic也谋自研芯片,与三星洽谈锁定韩国半导体供应链

AI芯片供应链Anthropic

继OpenAI推出自研推理芯片Jalapeño,Anthropic正与三星洽谈合作,切入韩国半导体供应链以多元化算力架构,同时仍依赖谷歌、亚马逊与英伟达芯片。报道指出其自研仍处早期,主要意在提前锁定内存、逻辑芯片制造、先进封装及长期产能。自研芯片首要目标是推理而非训练——训练决定模型能力上限,推理决定商业化成本下限,ChatGPT、Claude每生成一个token都直接转化为算力账单。此举被视为多供应商策略的升级而非替代英伟达,风险在于AI架构演进极快,押错架构可能成为负担。

阅读原文
6

Cloudflare将阻止AI爬虫抓取带广告页面,推动内容付费

AI爬虫内容付费创作者经济

Cloudflare宣布自9月15日起调整默认爬虫策略,阻止混合用途的AI爬虫抓取带广告的页面,推动AI公司为内容使用付费,并转向「按使用付费」模式。这一变化背后是AI对创作者经济的双重冲击:开发者教育创作者Josh W. Comeau透露其课程销量大幅下滑,第三门课销量仅约往常三分之一、收入下降超50%,原因是就业不确定性令开发者迟疑投入,且LLM提供免费个性化辅导直接替代付费课程,同时在未经同意与补偿的情况下吞噬并复述创作者内容。

7

Fable 5回归24小时差评如潮,跑分暴跌并暗藏侮辱性降级标签

大模型AI安全用户体验

Anthropic的Claude Fable 5在恢复开放后24小时内遭遇大量投诉。过度的安全防护导致「解释人类」「数raspberry中r的个数」等正常请求被拦截或降级,拦截标准不一致严重影响可用性。后台日志中出现「TOO_DUMB_TO_NEED_FABLE」标签,将简单请求悄悄转给Opus 4.8处理,用户付费Fable 5却获得低成本服务。安全拦截还直接导致跑分暴跌,BridgeMind调试能力从86.2骤降至25.9,因12项调试任务中有9项被中途拦截并计零分,而非模型自身能力下降。Anthropic同期引入了「网络越狱严重性」评估框架。

阅读原文
8

Sakana AI推Fugu模型,编排多个LLM超越单一前沿模型

大模型模型编排Sakana AI

Sakana AI发布Fugu与Fugu-Ultra模型,通过动态选择每个子任务调用哪个模型来编排多个LLM,在Terminal-Bench、SWE-Bench及Humanity's Last Exam上超越单一前沿模型,且不绑定单一供应商。这一「模型调用模型」思路呼应了业界共识:应通过智能路由而非单一模型处理AI任务。此前OpenAI的GPT-5.6家族仅向约20家美政府批准机构限量开放,其中GPT-5.6 Sol虽实现顶尖编码能力,但思维链可控性上升被视为安全隐患——模型或能对监督系统隐藏其推理过程,该比率较GPT-5.5增至三倍。

阅读原文
9

上海交大提出WLA模型,统一世界建模、语言推理与动作生成

具身智能世界模型机器人

上海交大DENG Lab提出WLA模型,在自回归框架中通过对文本意图与物理动态的双通道预测,统一世界建模、语言推理与动作生成,实现高效实时机器人控制。文本意图以自然语言描述子任务序列提供语义表示,物理动态刻画动作对环境的影响。推理时无需显式生成未来图像,延迟低至40ms;在长程RMBench任务上取得56.5%成功率,接近次优方法的两倍。移除子任务预测后成功率骤降至17.3%,验证语言推理对长程任务的关键作用;模型还能从无动作标注的跨本体视频学习新任务,将未见任务成功率从约12%提升至约28%。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。