AI Daily Brief

2026年3月8日星期日

10 点要闻3 分钟阅读

今日要闻

OpenAI推出Codex Security：30天扫120万提交

安全AI代理开发者工具

OpenAI发布应用安全代理Codex Security（前身Aardvark），面向企业与开源仓库自动“发现-验证-修复”漏洞：先建项目威胁模型，再在沙箱中运行PoC验证，并生成上下文补丁以降低误报。私测数据显示警报噪音减少84%、严重性误报下降90%、误报率降低超50%。过去30天扫描超120万次提交，识别792个关键漏洞和10,561个高危问题；审计OpenSSH、GnuTLS、PHP、Chromium等并分配14个CVE。同时推出Codex for OSS，为符合条件维护者提供ChatGPT Pro与审计访问。

阅读原文

谷歌开源gws统一Workspace API，兼容MCP

开源AI代理企业软件

谷歌发布并开源命令行工具gws，用统一接口整合Gmail、Google Drive等Workspace分散API，输出结构化JSON，降低AI代理解析与编排成本；支持一次性OAuth认证，并可动态读取Discovery Service自动适配新增API。项目内置100+预构建“代理技能”，覆盖常见办公自动化任务，并明确兼容Model Context Protocol（MCP），便于被各类MCP客户端直接调用。该工具被标注为非官方示例，稳定性与安全性不作保证，但上线后在GitHub迅速获得超1.4万星标，反映企业办公数据入口正成为代理生态的关键底座。

阅读原文

Anthropic上线Marketplace：预算可买第三方Claude软件

企业服务生态Claude

Anthropic推出Anthropic Marketplace，允许企业客户将对Anthropic API/服务的年度承诺支出的一部分，用于采购基于Claude构建的第三方应用；Anthropic表示平台交易不收取佣金。首批合作方包括Snowflake、法律AI公司Harvey与开发平台Replit，试图用“预算可直达应用”的方式降低企业采购碎片化，并强化客户锁定。该策略类似云市场但更偏向生态引流；同时Anthropic自有产品（如Claude Code等）与第三方工具可能形成竞合关系，后续如何界定产品边界与治理规则，将影响其企业扩张效率与伙伴关系稳定性。

阅读原文

日本拟修个情法：AI训练可无同意用个人数据

政策监管数据合规

据朝日新闻报道，日本个人信息保护法（个情法）改正案拟引入特例：在“统计制作或AI模型开发”等目的下，允许在未取得本人同意的情况下使用个人数据。个人信息保护委员会认为，数据经抽象化、统计化后不再识别个人，权利侵害风险较低。另一方面，专家担忧同意原则被削弱后，精细化画像与群体推断更易发生，可能导致对特定群体或个人的不利影响，并增加企业自行判断带来的制度风险。该修法若通过，将直接影响日本AI训练数据合规边界及跨行业数据流通模式。

阅读原文

日本财务省调查：75%企业用AI、仅28%称减员

产业数据企业应用

中日新闻Web援引日本财务省调查称，2025年12月至2026年1月上旬对1103家企业调研显示：75%的企业已在业务中使用AI，较约5年前的11%显著上升。分规模看，大企业采用率89%，中小企业65%；分行业看，制造业80%，非制造业72%。使用场景以文书生成、信息检索为主，财务与客户分析等更复杂应用也在扩展。成效方面，91%的企业表示AI带来工作时间缩短；但仅28%企业认为所需人力减少，显示“效率提升”已普遍发生，而“直接替代岗位”仍相对有限。

阅读原文

Dropbox披露RAG标注流程：LLM校准人类效率×100

RAG数据标注企业实践

Dropbox分享其RAG系统的相关性数据生产方法：用少量人工高质量“金标”样本校准LLM评审器，再由LLM批量生成大规模标注，用于训练检索排序模型，在保持准确性的同时将标注效率放大约100倍。流程强调优先挖掘“硬错误”（LLM判断与真实用户行为冲突的样本）以提供更强学习信号，并允许LLM在标注时检索内部术语与文档以减少企业专有语境误判。该实践将LLM-as-a-Judge从评测工具延伸为数据生产管线，指向企业RAG迭代的成本结构变化。

阅读原文

CISPA审计：45.83% Shadow API疑模型被替换

安全生态治理API

一份基于CISPA审计的报道指出，“Shadow API”灰产存在普遍的模型替换与降级：在测试的24个API端点中，45.83%未能通过模型指纹验证，用户可能以闭源前沿模型价格调用到更便宜的小模型。该链条通过信息差、折扣替换与加价转售获利，直接削弱研究与应用的可复现性。审计还发现至少116篇顶会论文使用了这类不可靠接口，可能影响论文对比结论；在医疗、法律等高风险场景，替换后专业任务准确率被报告从80%+跌至约37%，带来不可接受的安全隐患与责任风险。

阅读原文

Lightricks开源LTX-2.3：原生竖屏1080×1920

开源视频生成

Lightricks开源发布视频生成模型LTX-2.3，重点做“引擎级”升级：通过VAE重构改善画面清晰度与高频细节；将文本连接器扩容4倍以增强复杂指令跟随；重训I2V模块以提升运动自然性并降低“Ken Burns”式平移缩放与跳切。版本首次提供原生竖屏视频生成能力，最高支持1080×1920，面向短视频生产链路。需要注意的是，VAE重构带来潜空间变化，旧版LTX-2 LoRA与2.3不兼容，开发者需重新训练适配器。材料同时披露LTX-2自1月开源以来下载量接近500万。

阅读原文

北大开源Helios：14B单卡视频生成最高19.5FPS

开源视频生成算力适配

据报道，北大李元团队开源视频生成模型Helios与UniWorld-OSP2.0底座，目标是在较大模型规模下实现实时生成。Helios在14B规模下通过DMD蒸馏将推理步数压缩到4步，并结合多尺度推理与特征缓存加速，在昇腾NPU上最高可达19.5 FPS。其提出FlashI2V机制，试图缓解I2V任务中“条件图像泄漏/过度拷贝”的一致性与运动自由度矛盾，并结合频域引导校准细节。UniWorld-OSP2.0强调对昇腾算力深度适配，并开源21B基础模型，为可控、可部署的视频生成基础设施提供训练与工程参考。

阅读原文

谢赛宁团队开源Solaris：首个多人视频世界模型

世界模型开源多智能体

据报道，谢赛宁团队开源Solaris，多人协作场景的视频世界模型，强调同一环境下多玩家第一视角生成的跨视角一致性与环境记忆。团队自研SolarisEngine，用通信层与服务器插件实现多人控制与摄像机同步，采集带动作标注的多人数据以支撑训练。在模型侧，基于改进DiT结构引入“多玩家自注意力”，在序列维度进行跨玩家信息交换，使不同视角token可相互参照，从而在去噪过程中维持全局一致。评测方面构建基于VLM的多维指标，覆盖移动、定位、一致性、记忆与建造等能力，并宣称架构可泛化到任意玩家数量。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。