微软披露GRP-Obliteration:单提示可破坏15款LLM安全对齐
微软安全团队披露“GRP-Obliteration”攻击:利用原本用于对齐的GRPO训练目标,通过一个看似温和且未标记的提示词,就可能在下游适配/微调阶段把模型从安全行为推向有害输出。报告称该方法在15个测试LLM(含GPT-OSS、Llama、Qwen等)上导致整体安全性退化,并对未见过的有害类别出现跨类泛化;亦可影响部分文本到图像扩散模型的安全限制。建议在集成与微调流程中加入持续安全评估与回归测试。
阅读原文微软安全团队披露“GRP-Obliteration”攻击:利用原本用于对齐的GRPO训练目标,通过一个看似温和且未标记的提示词,就可能在下游适配/微调阶段把模型从安全行为推向有害输出。报告称该方法在15个测试LLM(含GPT-OSS、Llama、Qwen等)上导致整体安全性退化,并对未见过的有害类别出现跨类泛化;亦可影响部分文本到图像扩散模型的安全限制。建议在集成与微调流程中加入持续安全评估与回归测试。
阅读原文路透报道Databricks完成新一轮约50亿美元融资,估值约1340亿美元,资金用途指向强化资产负债表并为潜在IPO做准备。Databricks以数据与分析平台起家,近年把Lakehouse与生成式AI能力打包给企业客户,承接从数据治理、特征工程到LLM应用落地的需求。本轮融资在AI基础设施与数据平台仍高投入的背景下完成,显示资本市场对“数据+AI”底座型公司的估值体系仍在延续,但也更强调上市前的财务与现金流韧性。
阅读原文字节跳动发布新一代AI视频生成模型Seedance 2.0(即梦系)。公开信息显示,该模型面向更可控的内容生产:可根据单一文本提示生成连贯多场景视频,并同步输出匹配音频;同时强调多镜头叙事能力,降低长视频分镜的一致性与连贯性成本。资料还提到其支持多模态素材输入作为参考,包括图像、视频等,用于对人物、动作与风格进行更精细的创作控制。整体能力指向从“试生成”走向更工程化的视频制作流程。
阅读原文阿里通义千问新一代基座模型Qwen3.5被曝在Hugging Face的Transformers仓库出现相关合并PR,显示其可能即将进入更标准化的开源推理与微调工具链。对开发者而言,这类“进Transformers”的信号通常意味着接口适配、权重与配置结构将更贴近社区默认范式,从而降低调用、量化、部署与下游微调门槛,并便于与现有推理框架联动。当前材料未给出官方发布公告、模型规格参数、定价或许可细节,仍以仓库动作为主。
阅读原文Hugging Face发布Transformers.js v4预览版,并通过NPM提供@huggingface/transformers@next。该版本核心变化是引入用C++实现的全新WebGPU运行时,覆盖浏览器与Node.js/Bun/Deno等环境,面向本地化、离线推理;官方示例称在BERT场景速度提升约4倍。工程侧,构建系统从Webpack迁移至esbuild,构建速度提升并使核心包体积减少53%;同时推出独立的轻量tokenizers.js库,提升模块化与可维护性。整体指向Web端端侧推理更实用。
阅读原文安全研究人员披露AI聊天应用Chat & Ask AI因Firebase配置错误,导致未加保护数据库对外暴露,约2500万用户的约3亿条对话记录可被访问,涉及完整聊天历史、使用的模型记录与设置信息等敏感内容。材料称该应用为“套壳”产品,接入ChatGPT、Anthropic Claude与Google Gemini等多家模型服务。研究方在负责任披露后表示,开发商在数小时内修复配置问题;其Firehound扫描还发现200个iOS应用中有103个存在类似的云端数据暴露风险,提示“LLM应用+第三方后端”成为新的隐私薄弱点。
阅读原文Meta工程团队公开“Prometheus”超大规模AI集群网络方案:以Backend Aggregation(BAG)作为集中式以太网“超级骨干”,把不同数据中心与区域内的异构Fabric互联,支撑单区域跨多机房、数万GPU级训练集群。文中给出区域间Inter‑BAG容量可达16–48Pbps,并指出跨楼宇长距离链路带来的时延与拥塞控制挑战,需要深缓冲交换机以更好配合PFC等机制;路由采用eBGP与UCMP以提升路径多样性、负载均衡与大故障域下的韧性。该披露为“千兆瓦级”AI集群网络设计提供了可复用工程细节。
阅读原文云知声智能科技公告完成新一轮H股配售:发行1,008,000股新H股,占扩大后总股本约1.38%,配售价310港元/股,净筹约3.0719亿港元。公司披露资金用途:约65%用于深化“一基两翼”技术架构研发,包括整合“山海通用底座”与“Atlas智算平台”打造智算一体基座、研发具备长程推理能力的专业智能体内核,以及升级端侧多模态智能体;其余约35%用于提升主业产品竞争力,覆盖居民健康画像、技术文档审查、智能客服等智能体开发与ToC智慧医疗产品运营。配售不导致主要股东变动。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。