DeepMind推Gemini Robotics/ER进军人形机器人
Google DeepMind 发布两款基于 Gemini 2.0 的机器人模型:Gemini Robotics 与 Gemini Robotics‑ER,面向人形机器人等具身设备。两者把视觉、语言与动作控制合一,可结合实时传感器数据理解复杂指令并完成操作;其中 ER 强化环境感知与快速响应,覆盖更广现实场景。官方定位是把通用推理能力更直接地迁移到“物理世界任务执行”。
阅读原文Google DeepMind 发布两款基于 Gemini 2.0 的机器人模型:Gemini Robotics 与 Gemini Robotics‑ER,面向人形机器人等具身设备。两者把视觉、语言与动作控制合一,可结合实时传感器数据理解复杂指令并完成操作;其中 ER 强化环境感知与快速响应,覆盖更广现实场景。官方定位是把通用推理能力更直接地迁移到“物理世界任务执行”。
阅读原文据报道,Google 正与 Meta 合作完善 TPU 的软件生态,以提升自研张量处理单元在训练与推理场景的可用性与兼容性,降低企业从 CUDA/NVIDIA 迁移门槛。合作重点在于编译、运行时与工具链的适配,吸引更多开发者用通用框架部署到 TPU。对云与超大规模厂商而言,这意味着在硬件供给与成本不确定性上,争取更多“非单一GPU平台”的可选项。
阅读原文法律机构解读称,“Digital Omnibus”提案拟对欧盟《AI Act》做一揽子调整:强化欧盟 AI Office 的统一监管角色,同时减少企业合规负担,例如不再强制员工AI素养培训、放宽部分高风险系统注册与中小企业质量管理豁免等。提案还把生成式AI内容透明度义务的适用时间推迟至2027年2月2日,并提出若相关标准未及时出台,高风险系统的合规宽限期最长可延至2028年。
阅读原文报道披露,网易有道把传统“词典笔”升级为“AI导师笔”,并引入 DeepSeek‑R1 的推理能力,将答疑从题库匹配转向步骤化讲解。材料称,接入R1后辅导准确率由约85%提升到93%以上;产品形态也随之调整,通过更大屏幕、4G与“盲扫”等设计承载更长交互链路,主打家长“不给手机也能答疑”的受控场景。该系列累计销售额突破1亿元。
阅读原文阿里智能引擎团队在 ModelScope 介绍面向 Qwen‑Image‑2512 的“两步LoRA”方案:结合概率空间蒸馏(Reverse‑KL/DMD2)、PCM warm‑start 与对抗学习,在仅2步采样下尽量保留2K图像细节,生成速度较常规流程提升约40倍。材料给出端到端体验指标:约5秒可生成4张2K图,并针对文字、面部等低占比细节易失真问题做定向约束,面向工业化部署场景。
阅读原文一份第三方迁移指南称,OpenAI 将于2026年8月26日关闭 Assistants API,建议开发者迁移到 Responses API + Conversations API 组合:Assistants 对应 Prompts,Threads 迁至 Conversations,Runs 由 Responses 处理。受影响较大的是依赖服务端会话状态、复杂工具编排或多步函数调用的应用,需要在截止日前完成重构或采用线缆兼容的过渡方案,否则现有集成将停止工作。
阅读原文纽约时报报道,Google 的 AI 助手 Gemini 增加了从用户近期邮件内容中自动生成待办事项列表的能力,意在把“邮件信息”转为“可执行任务”。该功能在体验上减少手动整理,但也带来隐私与合规疑问:助手需要访问并解析可能包含敏感信息的邮箱数据,用户与企业需明确数据访问范围、存储与留存策略、以及审计与撤回机制,避免便利性与数据暴露风险失衡。
阅读原文一则科技资讯汇总称,全球AI算力与数据中心建设正在推高电力基础设施需求,变压器成为新的供给瓶颈。材料提到,中国部分变压器厂商订单已排到2027年底,反映大规模GPU集群扩张、冷却与供配电改造对电网设备的拉动正在前置释放。对云厂商与园区运营方而言,算力扩张的约束不再只在芯片与机柜,也在电力设备交付周期与并网能力。
阅读原文材料称,腾讯AI助手“元宝”通过“10亿红包”活动拉新后登顶 App Store,并推出“元宝派”探索AI社交方向。思路是把AI从一对一工具推向多人兴趣场景,让AI参与群聊中的互动、总结与氛围带动,以测试其在关系链中的角色与留存能力;同时也折射出国内大厂以补贴争夺AI入口与用户心智的节奏,短期指标更偏装机与活跃而非直接变现。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。