返回往期
2025年12月27日星期六
10 点要闻3 分钟阅读

今日要闻

1

GLM-4.7开源发布,编程能力达开源SOTA

大模型开源AI编程

智谱AI开源了GLM-4.7大模型,编程能力达到开源SOTA水平,在SWE-bench获得73.8%、LiveCodeBench V6达84.9%、Code Arena盲测超越GPT-5.2。模型新增三种思考模式,提升复杂任务稳定性,前端生成和工具调用能力同步增强,API和完整代码已开放。

阅读原文
2

MiniMax M2.1主打多语言编程SOTA,开源VIBE全栈评测基准

大模型开源AI编程

MiniMax M2.1模型在多编程语言生成、移动开发和办公自动化场景表现优异,测试结果超越Claude Sonnet 4.5,并同步开源了VIBE全栈应用评测基准,推动真实世界复杂任务的AI应用落地。

阅读原文
3

通义Fun-Audio-Chat 8B端到端语音对话模型开源

语音模型开源多模态

Fun-Audio-Chat 8B为端到端语音对话模型,跳过传统ASR+LLM+TTS拼接,延迟更低、效率更高,具备情绪感知和Speech Function Call能力,可通过自然语音完成复杂任务,模型权重和代码全部开源。

阅读原文
4

三篇论文揭示Agent元年困境:多Agent协作面临协调税与错误放大

AI Agent多智能体技术趋势

基于Berkeley调研和DeepMind实验,68%的Agent受限于10步以内,多Agent存在协调税和错误放大,增加预算无法线性提升性能,突破需工具管理、验证能力和通信协议的系统性进化。

阅读原文
5

前端AI Agent落地复盘:技术成功≠产品成功,Skill优于独立Agent

AI Agent产品落地开发实践

企业级前端AI Agent项目复盘,技术突破但产品遇冷,80/20瓶颈和用户习惯阻力导致无人使用,经验教训是应将通用Skill融入现有工具链而非单独造Agent,强调与开发者工作流深度融合。

阅读原文
6

MCP与Agent Skills分层混合架构详解:缓解上下文爆炸,提升可维护性

AI Agent开发架构技能生态

文章系统梳理了MCP(Model Context Protocol)和Agent Skills两大核心概念,指出MCP解决连接性,Skills封装领域知识和操作流程,Skills引入渐进式披露机制,有效缓解上下文爆炸,提出MCP+Skills分层混合架构是Agent开发的重要方向。

阅读原文
7

LangChain年度报告:57%企业已投产Agent,质量是最大挑战

AI Agent企业应用行业报告

LangChain最新调研显示,2026年AI Agent已进入实战期,57%企业正式投产,客服和研发分析为核心场景,最大落地障碍是输出质量而非成本,技术趋势为可观测性追踪和多模型混合架构。

阅读原文
8

Lenny x Figma 1750人AI职场调研:超半数每周省半天,创业者获益最高

AI应用职场调研生产力工具

Lenny与Figma联合发布的AI职场搭档调研,1750份样本显示超半数从业者每周因AI节省至少半天时间,创业者获益最高,设计师感知最弱,工程师正从Copilot转向Cursor和Claude Code,AI机会点正从内容生产向战略思考迁移。

阅读原文
9

Notion创始人Ivan Zhao:AI是“无限大脑”,需重塑工作方式

AI趋势认知变革组织创新

Notion创始人Ivan Zhao从历史维度解读AI变革,将AI类比为继蒸汽和钢铁后的“无限大脑”,分析其对个人、组织和经济体的深远影响,提出应停止将AI仅视为副驾驶,而需重新想象整个工作方式。

阅读原文
10

Google Gemini负责人:Flash已达Pro水平,后训练与持续学习是突破方向

大模型持续学习技术趋势

Google DeepMind三位Gemini负责人同台对话,透露Flash模型已能达到甚至超越上一代Pro水平,Pro主要作用变成蒸馏Flash,后训练是最大突破空间,延迟和速度价值被严重低估,未来重点是开放式任务和持续学习能力。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。