1
OpenAI推出Codex Security:30天扫120万提交 安全 AI代理 开发者工具
OpenAI发布应用安全代理Codex Security(前身Aardvark),面向企业与开源仓库自动“发现-验证-修复”漏洞:先建项目威胁模型,再在沙箱中运行PoC验证,并生成上下文补丁以降低误报。私测数据显示警报噪音减少84%、严重性误报下降90%、误报率降低超50%。过去30天扫描超120万次提交,识别792个关键漏洞和10,561个高危问题;审计OpenSSH、GnuTLS、PHP、Chromium等并分配14个CVE。同时推出Codex for OSS,为符合条件维护者提供ChatGPT Pro与审计访问。
阅读原文 2
谷歌开源gws统一Workspace API,兼容MCP 开源 AI代理 企业软件
谷歌发布并开源命令行工具gws,用统一接口整合Gmail、Google Drive等Workspace分散API,输出结构化JSON,降低AI代理解析与编排成本;支持一次性OAuth认证,并可动态读取Discovery Service自动适配新增API。项目内置100+预构建“代理技能”,覆盖常见办公自动化任务,并明确兼容Model Context Protocol(MCP),便于被各类MCP客户端直接调用。该工具被标注为非官方示例,稳定性与安全性不作保证,但上线后在GitHub迅速获得超1.4万星标,反映企业办公数据入口正成为代理生态的关键底座。
阅读原文 3
Anthropic上线Marketplace:预算可买第三方Claude软件 企业服务 生态 Claude
Anthropic推出Anthropic Marketplace,允许企业客户将对Anthropic API/服务的年度承诺支出的一部分,用于采购基于Claude构建的第三方应用;Anthropic表示平台交易不收取佣金。首批合作方包括Snowflake、法律AI公司Harvey与开发平台Replit,试图用“预算可直达应用”的方式降低企业采购碎片化,并强化客户锁定。该策略类似云市场但更偏向生态引流;同时Anthropic自有产品(如Claude Code等)与第三方工具可能形成竞合关系,后续如何界定产品边界与治理规则,将影响其企业扩张效率与伙伴关系稳定性。
阅读原文 4
日本拟修个情法:AI训练可无同意用个人数据 政策监管 数据合规
据朝日新闻报道,日本个人信息保护法(个情法)改正案拟引入特例:在“统计制作或AI模型开发”等目的下,允许在未取得本人同意的情况下使用个人数据。个人信息保护委员会认为,数据经抽象化、统计化后不再识别个人,权利侵害风险较低。另一方面,专家担忧同意原则被削弱后,精细化画像与群体推断更易发生,可能导致对特定群体或个人的不利影响,并增加企业自行判断带来的制度风险。该修法若通过,将直接影响日本AI训练数据合规边界及跨行业数据流通模式。
阅读原文 5
日本财务省调查:75%企业用AI、仅28%称减员 产业数据 企业应用
中日新闻Web援引日本财务省调查称,2025年12月至2026年1月上旬对1103家企业调研显示:75%的企业已在业务中使用AI,较约5年前的11%显著上升。分规模看,大企业采用率89%,中小企业65%;分行业看,制造业80%,非制造业72%。使用场景以文书生成、信息检索为主,财务与客户分析等更复杂应用也在扩展。成效方面,91%的企业表示AI带来工作时间缩短;但仅28%企业认为所需人力减少,显示“效率提升”已普遍发生,而“直接替代岗位”仍相对有限。
阅读原文 6
Dropbox披露RAG标注流程:LLM校准人类效率×100 RAG 数据标注 企业实践
Dropbox分享其RAG系统的相关性数据生产方法:用少量人工高质量“金标”样本校准LLM评审器,再由LLM批量生成大规模标注,用于训练检索排序模型,在保持准确性的同时将标注效率放大约100倍。流程强调优先挖掘“硬错误”(LLM判断与真实用户行为冲突的样本)以提供更强学习信号,并允许LLM在标注时检索内部术语与文档以减少企业专有语境误判。该实践将LLM-as-a-Judge从评测工具延伸为数据生产管线,指向企业RAG迭代的成本结构变化。
阅读原文 7
CISPA审计:45.83% Shadow API疑模型被替换 安全 生态治理 API
一份基于CISPA审计的报道指出,“Shadow API”灰产存在普遍的模型替换与降级:在测试的24个API端点中,45.83%未能通过模型指纹验证,用户可能以闭源前沿模型价格调用到更便宜的小模型。该链条通过信息差、折扣替换与加价转售获利,直接削弱研究与应用的可复现性。审计还发现至少116篇顶会论文使用了这类不可靠接口,可能影响论文对比结论;在医疗、法律等高风险场景,替换后专业任务准确率被报告从80%+跌至约37%,带来不可接受的安全隐患与责任风险。
阅读原文 8
Lightricks开源LTX-2.3:原生竖屏1080×1920 开源 视频生成
Lightricks开源发布视频生成模型LTX-2.3,重点做“引擎级”升级:通过VAE重构改善画面清晰度与高频细节;将文本连接器扩容4倍以增强复杂指令跟随;重训I2V模块以提升运动自然性并降低“Ken Burns”式平移缩放与跳切。版本首次提供原生竖屏视频生成能力,最高支持1080×1920,面向短视频生产链路。需要注意的是,VAE重构带来潜空间变化,旧版LTX-2 LoRA与2.3不兼容,开发者需重新训练适配器。材料同时披露LTX-2自1月开源以来下载量接近500万。
阅读原文 9
北大开源Helios:14B单卡视频生成最高19.5FPS 开源 视频生成 算力适配
据报道,北大李元团队开源视频生成模型Helios与UniWorld-OSP2.0底座,目标是在较大模型规模下实现实时生成。Helios在14B规模下通过DMD蒸馏将推理步数压缩到4步,并结合多尺度推理与特征缓存加速,在昇腾NPU上最高可达19.5 FPS。其提出FlashI2V机制,试图缓解I2V任务中“条件图像泄漏/过度拷贝”的一致性与运动自由度矛盾,并结合频域引导校准细节。UniWorld-OSP2.0强调对昇腾算力深度适配,并开源21B基础模型,为可控、可部署的视频生成基础设施提供训练与工程参考。
阅读原文 10
谢赛宁团队开源Solaris:首个多人视频世界模型 世界模型 开源 多智能体
据报道,谢赛宁团队开源Solaris,多人协作场景的视频世界模型,强调同一环境下多玩家第一视角生成的跨视角一致性与环境记忆。团队自研SolarisEngine,用通信层与服务器插件实现多人控制与摄像机同步,采集带动作标注的多人数据以支撑训练。在模型侧,基于改进DiT结构引入“多玩家自注意力”,在序列维度进行跨玩家信息交换,使不同视角token可相互参照,从而在去噪过程中维持全局一致。评测方面构建基于VLM的多维指标,覆盖移动、定位、一致性、记忆与建造等能力,并宣称架构可泛化到任意玩家数量。
阅读原文