AI Daily Brief

2026年3月13日星期五

10 点要闻3 分钟阅读

今日要闻

Perplexity发布Personal Computer，Mac mini常驻代理+四类API

AI Agent产品发布

Perplexity在开发者活动上推出“Personal Computer”，以专用Mac mini作为常驻执行端，让AI代理可24/7访问用户文件与应用并代替完成任务（如操作WhatsApp、Spotify等），任务结束后回传结果；同时发布Search、Agent、Sandbox与Embeddings四类新API，推动从“搜索”向可执行的数字代理转型。当前配置仍偏开发者与技术用户，产品被描述为可访问用户数据的云端数字员工。

阅读原文

微信探索自研独立大模型，拟2026年接入小程序做生态级Agent

大模型生态AI Agent

据报道，腾讯微信正在探索研发独立自有AI模型，用于构建贯穿微信生态的AI代理能力；该模型已完成基础能力开发，计划在2026年内对外落地。短期路径是先接入小程序生态，向开发者开放以构建各类智能体；长期则希望结合用户在微信内的长期行为数据，提升信息获取与效率工具体验。报道同时提到，微信月活超14亿，这类深度嵌入也将带来隐私保护与用户信任的治理挑战。

阅读原文

OpenClaw 2026.3.11修补WebSocket劫持，工信部/CERT提示隔离部署

安全AI Agent开源

OpenClaw发布v2026.3.11更新，修复在“trusted-proxy”模式下WebSocket可能被跨站劫持的问题，避免未授权来源获取管理员权限，并加强插件运行时与敏感接口的权限控制。与此同时，中国CERT与工信部相继提示其默认安全配置薄弱，建议容器隔离运行、关闭公网暴露、严格认证与最小权限，谨慎使用技能/插件市场并防范社会工程学攻击。该组合动作反映Agent工具正进入“可用性与安全性并重”的治理阶段。

阅读原文

DeepMind用强化生成法攻Ramsey数，28个案例达SOTA

研究强化学习

Google DeepMind与UC Berkeley在论文《Reinforced Generation of Combinatorial Structures: Ramsey Numbers》（arXiv:2603.09172）提出强化“生成”式搜索框架，用LLM代理自动演化搜索函数，替代依赖人工经验的专用启发式。方法引入“前景图”（prospect graph）等软评分信号，在稀疏的极值图空间中更有效地探索，降低陷入局部最优的概率。实验显示其复现了几乎所有已知精确Ramsey数，并在28个不同案例达到当前最优，展示AI在纯数学问题上的自动化算法发现能力。

阅读原文

Nature Medicine：认知层架构提升心理治疗LLM，双盲评估优于临床医生

医疗AI研究

Nature Medicine论文提出“认知层”架构以增强LLM在心理治疗对话中的临床推理。研究进行随机双盲评估：227名参与者与不同治疗代理交互生成对话，由22名临床医生评审；结果显示加入认知层的LLM在关键临床能力上持续优于单独使用的最先进LLM与人类治疗师。作者进一步分析19,674份真实对话记录（8,920名用户），发现认知层激活程度越高，症状改善越显著、长期康复可能性越高（约10周）。出于安全与知识产权原因，核心代码未完全公开。

阅读原文

Nature Medicine提出数字医院CES，用动态约束评测临床LLM

医疗AI评测

Nature Medicine提出临床环境模拟器CES，用“数字医院”动态评估临床LLM，避免静态数据集难以覆盖连锁效应与系统约束的问题。CES由“医院引擎”实时追踪床位、人员与设备状态，以及“患者引擎”在LLM干预下模拟病程与治疗反应组成；模型需通过真实电子病历界面做决策，并在个体疗效与系统效率间权衡。框架重点评测三类能力：时间推理、资源感知决策、以及在并发急症与系统故障下的操作韧性，并同时衡量临床结果与运营指标。

阅读原文

Scale AI发布FORTRESS安全基准：1010对抗提示衡量国家安全风险

AI安全基准测试

Scale AI推出FORTRESS基准，用于评估前沿大模型在国家安全与公共安全场景（NSPS）的风险防护能力。基准包含超过1,010个专家设计的对抗提示（其中500个公开），覆盖CBRNE、政治暴力与恐怖主义、犯罪与金融非法活动三大领域；采用平均风险评分ARS衡量生成有害内容倾向，并以过度拒绝评分ORS衡量对无害请求的误拒。排行榜显示Claude 3.5 Sonnet的ARS为12.96，而DeepSeek R1的ARS为74.39；评审由多模型裁判体系自动打分，强调可扩展与可复现。

阅读原文

AI视频公司AIsphere获3亿美元C轮，PixVerse用户破1亿

融资视频生成

AI视频生成公司AIsphere完成3亿美元C轮融资，由CDH投资领投，被称为中国AI视频生成领域单笔融资新高。公司披露其2025年年度经常性收入（ARR）超过4,000万美元，面向海外市场的PixVerse应用及相关产品累计用户突破1亿。资金将用于持续研发与拓展全球消费市场。报道还提到AIsphere在2026年1月推出实时世界模型PixVerse R1，支持实时视频生成与“无限视觉延续”。在竞争层面，公司正面对OpenAI Sora及多家国内视频模型产品的挤压。

阅读原文

Atlassian裁员1600人占10%，将资金转投AI与企业销售

企业动态AI人才

Atlassian宣布全球裁员1,600人，约占员工总数10%，其中澳大利亚本土岗位约480个。CEO Mike Cannon-Brookes表示，裁员释放的资金将用于“自筹资金投资人工智能和企业销售”，并承认AI改变了公司所需技能结构与岗位数量，评估中优先保留具备AI相关技能的员工。报道援引匿名员工观点称，公司此前存在过度招聘因素。市场层面，文中提到其股价在过去一年从221美元跌至75.45美元，反映SaaS公司在AI冲击下的转型压力与资本市场再定价。

阅读原文

中国第15次五年规划目标：2030年AI产业规模约220万亿日元

政策产业

据日媒报道，中国全国人大闭幕后通过面向2030年的经济中期目标“第15次五年规划”。规划强调在外部供应链压力下提升制造业竞争力，并推动AI与半导体等科学技术成果产业化，提出到2030年将AI相关产业规模扩大至约220万亿日元以上。报道同时提到在对外表述上出现更谨慎的措辞选择，显示在推进关键技术自主化的同时仍需权衡对外关系与产业链风险。该目标为国内算力、芯片、软件与应用落地提供了更明确的政策预期与产业拉动信号。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。