返回往期
2026年3月13日星期五
10 点要闻3 分钟阅读

今日要闻

1

Perplexity发布Personal Computer,Mac mini常驻代理+四类API

AI Agent产品发布

Perplexity在开发者活动上推出“Personal Computer”,以专用Mac mini作为常驻执行端,让AI代理可24/7访问用户文件与应用并代替完成任务(如操作WhatsApp、Spotify等),任务结束后回传结果;同时发布Search、Agent、Sandbox与Embeddings四类新API,推动从“搜索”向可执行的数字代理转型。当前配置仍偏开发者与技术用户,产品被描述为可访问用户数据的云端数字员工。

阅读原文
2

微信探索自研独立大模型,拟2026年接入小程序做生态级Agent

大模型生态AI Agent

据报道,腾讯微信正在探索研发独立自有AI模型,用于构建贯穿微信生态的AI代理能力;该模型已完成基础能力开发,计划在2026年内对外落地。短期路径是先接入小程序生态,向开发者开放以构建各类智能体;长期则希望结合用户在微信内的长期行为数据,提升信息获取与效率工具体验。报道同时提到,微信月活超14亿,这类深度嵌入也将带来隐私保护与用户信任的治理挑战。

阅读原文
3

OpenClaw 2026.3.11修补WebSocket劫持,工信部/CERT提示隔离部署

安全AI Agent开源

OpenClaw发布v2026.3.11更新,修复在“trusted-proxy”模式下WebSocket可能被跨站劫持的问题,避免未授权来源获取管理员权限,并加强插件运行时与敏感接口的权限控制。与此同时,中国CERT与工信部相继提示其默认安全配置薄弱,建议容器隔离运行、关闭公网暴露、严格认证与最小权限,谨慎使用技能/插件市场并防范社会工程学攻击。该组合动作反映Agent工具正进入“可用性与安全性并重”的治理阶段。

阅读原文
4

DeepMind用强化生成法攻Ramsey数,28个案例达SOTA

研究强化学习

Google DeepMind与UC Berkeley在论文《Reinforced Generation of Combinatorial Structures: Ramsey Numbers》(arXiv:2603.09172)提出强化“生成”式搜索框架,用LLM代理自动演化搜索函数,替代依赖人工经验的专用启发式。方法引入“前景图”(prospect graph)等软评分信号,在稀疏的极值图空间中更有效地探索,降低陷入局部最优的概率。实验显示其复现了几乎所有已知精确Ramsey数,并在28个不同案例达到当前最优,展示AI在纯数学问题上的自动化算法发现能力。

阅读原文
5

Nature Medicine:认知层架构提升心理治疗LLM,双盲评估优于临床医生

医疗AI研究

Nature Medicine论文提出“认知层”架构以增强LLM在心理治疗对话中的临床推理。研究进行随机双盲评估:227名参与者与不同治疗代理交互生成对话,由22名临床医生评审;结果显示加入认知层的LLM在关键临床能力上持续优于单独使用的最先进LLM与人类治疗师。作者进一步分析19,674份真实对话记录(8,920名用户),发现认知层激活程度越高,症状改善越显著、长期康复可能性越高(约10周)。出于安全与知识产权原因,核心代码未完全公开。

阅读原文
6

Nature Medicine提出数字医院CES,用动态约束评测临床LLM

医疗AI评测

Nature Medicine提出临床环境模拟器CES,用“数字医院”动态评估临床LLM,避免静态数据集难以覆盖连锁效应与系统约束的问题。CES由“医院引擎”实时追踪床位、人员与设备状态,以及“患者引擎”在LLM干预下模拟病程与治疗反应组成;模型需通过真实电子病历界面做决策,并在个体疗效与系统效率间权衡。框架重点评测三类能力:时间推理、资源感知决策、以及在并发急症与系统故障下的操作韧性,并同时衡量临床结果与运营指标。

阅读原文
7

Scale AI发布FORTRESS安全基准:1010对抗提示衡量国家安全风险

AI安全基准测试

Scale AI推出FORTRESS基准,用于评估前沿大模型在国家安全与公共安全场景(NSPS)的风险防护能力。基准包含超过1,010个专家设计的对抗提示(其中500个公开),覆盖CBRNE、政治暴力与恐怖主义、犯罪与金融非法活动三大领域;采用平均风险评分ARS衡量生成有害内容倾向,并以过度拒绝评分ORS衡量对无害请求的误拒。排行榜显示Claude 3.5 Sonnet的ARS为12.96,而DeepSeek R1的ARS为74.39;评审由多模型裁判体系自动打分,强调可扩展与可复现。

阅读原文
8

AI视频公司AIsphere获3亿美元C轮,PixVerse用户破1亿

融资视频生成

AI视频生成公司AIsphere完成3亿美元C轮融资,由CDH投资领投,被称为中国AI视频生成领域单笔融资新高。公司披露其2025年年度经常性收入(ARR)超过4,000万美元,面向海外市场的PixVerse应用及相关产品累计用户突破1亿。资金将用于持续研发与拓展全球消费市场。报道还提到AIsphere在2026年1月推出实时世界模型PixVerse R1,支持实时视频生成与“无限视觉延续”。在竞争层面,公司正面对OpenAI Sora及多家国内视频模型产品的挤压。

阅读原文
9

Atlassian裁员1600人占10%,将资金转投AI与企业销售

企业动态AI人才

Atlassian宣布全球裁员1,600人,约占员工总数10%,其中澳大利亚本土岗位约480个。CEO Mike Cannon-Brookes表示,裁员释放的资金将用于“自筹资金投资人工智能和企业销售”,并承认AI改变了公司所需技能结构与岗位数量,评估中优先保留具备AI相关技能的员工。报道援引匿名员工观点称,公司此前存在过度招聘因素。市场层面,文中提到其股价在过去一年从221美元跌至75.45美元,反映SaaS公司在AI冲击下的转型压力与资本市场再定价。

阅读原文
10

中国第15次五年规划目标:2030年AI产业规模约220万亿日元

政策产业

据日媒报道,中国全国人大闭幕后通过面向2030年的经济中期目标“第15次五年规划”。规划强调在外部供应链压力下提升制造业竞争力,并推动AI与半导体等科学技术成果产业化,提出到2030年将AI相关产业规模扩大至约220万亿日元以上。报道同时提到在对外表述上出现更谨慎的措辞选择,显示在推进关键技术自主化的同时仍需权衡对外关系与产业链风险。该目标为国内算力、芯片、软件与应用落地提供了更明确的政策预期与产业拉动信号。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。