返回往期
2026年1月23日星期五
10 点要闻3 分钟阅读

今日要闻

1

百度上线文心5.0正式版:2.4万亿参数原生全模态

大模型多模态产品发布

百度在文心Moment大会发布并上线文心5.0正式版,参数规模2.4万亿,采用原生全模态统一建模,支持文本/图像/音频/视频输入输出。模型引入超大规模MoE,激活参数比低于3%以提升推理效率,并通过思维链与行动链的端到端多轮强化学习增强长程任务与工具调用。个人用户可在文心APP和官网体验,企业与开发者可通过百度千帆平台调用;官方同时披露文心助手月活已破2亿。

阅读原文
2

阿里开源Qwen3-TTS:10语种TTS与语音克隆

开源语音模型发布

阿里千问宣布开源Qwen3-TTS语音生成模型家族,包含0.6B与1.7B两种尺寸,并配套发布Qwen3-TTS-Tokenizer-12Hz多码本语音编码器。模型覆盖中文、英文、日语、韩语、德语等10种语言,支持拟人化语音生成、音色克隆与音色设计,并可用自然语言描述控制音色、情绪与韵律。其Dual-Track双轨建模面向流式生成优化,官方描述首包音频可等待到“一个字符”,并给出端到端延迟最低97ms。权重与示例已在Hugging Face上线。

阅读原文
3

阿里据报筹备平头哥IPO,先重组并引入员工持股

芯片资本市场

路透援引彭博消息称,阿里巴巴正筹备推动旗下AI芯片部门平头哥(T-Head)独立上市,并计划先完成内部重组,将其转为更独立运营的实体并引入员工持股安排。报道未披露具体上市时间表与融资规模。平头哥成立于2018年,面向云与边缘场景研发芯片,曾推出含光等推理芯片并服务阿里云及电商体系;此次资本动作被视为为研发与市场扩张引入更多资金、同时提升业务单元灵活性,背景是本土芯片企业融资与上市热度上升。

阅读原文
4

Google Cloud推A4X+NVIDIA Dynamo,MoE推理达6K token/GPU/s

云基础设施推理优化芯片

Google Cloud发布面向大规模MoE模型的推理参考架构:在A4X机型上结合NVIDIA GB200 NVL72与NVIDIA Dynamo,将72块GPU机架作为统一计算域,并通过WideEP/DeepEP专家并行与Prefill-Decode解耦调度提升利用率。官方称吞吐量优化配置下可实现每GPU每秒6000+ token,总体面向DeepSeek-R1等MoE工作负载;延迟优化配置下token间延迟约10ms。方案同时强调GKE的硬件感知调度与按需加载,以降低TB级权重“冷启动”与部署开销。

阅读原文
5

OpenAI披露PostgreSQL扩展经验以支撑8亿ChatGPT用户

工程实践数据库平台

OpenAI在其官方新闻栏目发布工程文章,分享如何扩展PostgreSQL以支撑约8亿ChatGPT用户带来的业务负载,披露数据库层面的扩展与可靠性经验。该更新与其近期多项产品与政策内容并列发布,包括面向国家的教育计划、安全相关的年龄预测方法等。对开发团队而言,这份材料提供了在超大规模AI应用中继续使用传统关系型数据库并进行工程化扩容的路径参考,但在摘要信息中未给出具体开源代码、成本或基准性能数字。

阅读原文
6

GitHub发布Copilot SDK预览版:可把Agent循环嵌入任意应用

开发者工具Agent

GitHub发布Copilot SDK技术预览版,允许开发者将Copilot CLI的智能体执行循环嵌入到任意应用,而无需自建上下文管理、工具路由与模型编排等底层平台能力。SDK支持多模型选择,并原生集成MCP以连接外部数据源与工具,同时提供GitHub身份验证与流式输出。GitHub将其定位为可复用的“Agent内核”,把Copilot能力从终端与IDE扩展到自定义GUI、自动化摘要/报告生成、语音指令等更多形态,面向二次封装与集成场景。

阅读原文
7

Anthropic Git MCP曝提示注入漏洞,或致RCE/文件删除

安全MCP漏洞

安全公司Cyata披露,Anthropic提供的Git MCP参考服务器存在3个与提示注入相关的漏洞组合:由于未正确验证仓库路径与Git命令参数,攻击者可能诱导服务执行非预期的Git操作,进而导致任意代码执行、文件删除,或将本地文件被动加载进LLM上下文形成数据外泄风险。该事件凸显MCP类“工具服务器”连接代码仓库、终端命令等高权限资源时的输入验证与最小权限问题;在落地MCP时,需要配套路径白名单、参数约束、沙箱隔离与审计机制,避免把模型提示变成隐形控制面。

8

Unit 42:可利用LLM在浏览器实时生成钓鱼JavaScript规避检测

安全攻防LLM

Palo Alto Networks Unit 42报告提出“运行时组装攻击”新形态:攻击者在受害者浏览器端调用可信LLM服务API(文中示例包含DeepSeek与Google Gemini),实时生成并执行钓鱼用恶意JavaScript,而非在服务器端静态投放脚本。由于代码每次动态生成、且经受信任域名传输,传统基于特征或静态规则的检测更难命中。其PoC模仿LogoKit钓鱼活动,通过提示词绕过护栏生成AJAX凭证窃取逻辑。报告建议采用浏览器内运行时行为分析,并加强对LLM工具调用与外联请求的控制。

阅读原文
9

FlashLabs开源Chroma 1.0:端到端语音对话TTFT<150ms

开源语音实时

FlashLabs发布并开源端到端实时语音AI模型Chroma 1.0,主打原生“语音到语音”对话,绕开传统ASR→LLM→TTS级联流程带来的信息损失与时延叠加。官方称模型约40亿参数,端到端首令牌时间TTFT低于150ms(内部测试约135ms),支持自然轮转对话以及情感与韵律控制,并提供几秒参考音频的个性化语音克隆能力,给出说话人相似度评分0.817。代码、论文与基准结果已在Hugging Face和GitHub发布,同时支持部署到其语音代理平台。

阅读原文
10

韩国实施《人工智慧基本法》,高影响力AI须人类监督并强制标识

政策监管

韩国开始实施《人工智慧基本法》,被报道为首批落地的完整AI监管制度之一。法规覆盖生成式AI及医疗、金融、交通等高风险场景,要求高影响力AI应用设置人类监督,并对AI生成内容进行明确标示;企业还需向用户说明系统运作方式,违规最高可罚3000万韩元。韩国新创团体担忧条款表述模糊将抬升合规成本、影响创新与出海决策;政府回应将提供技术支持、法遵教育与激励措施。后续实施细则与执法尺度将直接影响本土模型与应用的发布节奏。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。