AI Daily Brief

2026年6月25日星期四

10 点要闻3 分钟阅读

今日要闻

OpenAI联合博通推出首款自研推理芯片Jalapeño，9个月完成设计流片

AI芯片OpenAI推理加速

OpenAI与博通联合发布首款专为大语言模型推理设计的定制芯片Jalapeño，采用裸片设计，从架构设计到流片仅用9个月，创高性能ASIC最快开发纪录，部分设计由OpenAI自有模型加速完成。该芯片专注降低数据搬运、平衡资源以逼近理论峰值性能，每瓦性能显著优于当前业界水平，并兼容全行业各类LLM。三方分工明确：OpenAI负责架构与核心，博通提供硅实现与Tomahawk网络芯片，Celestica负责系统集成。芯片计划2026年底开始部署，目标吉瓦级数据中心，合作方包括微软，是其多代算力平台的第一步。

阅读原文

Google将计算机操作能力内置进Gemini 3.5 Flash，可跨浏览器与桌面执行任务

GeminiAI智能体企业自动化

Google宣布Gemini 3.5 Flash将「计算机操作」（computer use）作为内置工具，取代此前的独立模型。开发者可通过Gemini API与企业级Agent平台直接调用，构建能在浏览器、移动端和桌面环境中感知、推理并执行操作的智能体，适用于持续软件测试等长周期企业自动化任务。安全方面采用针对性对抗训练以缓解提示注入风险，并提供可选的企业级防护：对不可逆操作要求用户确认，检测到间接提示注入时自动停止任务，官方建议采用纵深防御。Google同时提供演示环境与参考实现供快速上手。

阅读原文

字节跳动发布Seedance 2.5视频模型，单提示词生成30秒4K视频

视频生成字节跳动

字节跳动发布新一代AI视频生成模型Seedance 2.5，可基于单个提示词生成时长30秒、分辨率4K的视频，并支持最多50个图像、视频或音频参考输入以增强生成控制。该模型计划下月在中国市场推出。此次发布延续了视频生成赛道对时长、清晰度与可控性的持续突破。

OpenAI更新GPT-5.5 Instant，提升意图理解与复杂约束处理能力

GPT-5.5OpenAI模型更新

OpenAI宣布推出新版本GPT-5.5 Instant，在意图理解、复杂约束条件处理以及推荐连贯性方面均有提升。该版本于当日向付费用户推出，次日面向免费用户开放。此次更新聚焦对话场景下的实际可用性，使模型在处理多重限制条件时表现更稳定。

阅读原文

NVIDIA NeMo AutoModel加速MoE微调，吞吐提升3.4-3.7倍仅改一行代码

模型微调NVIDIAMoE

NVIDIA发布基于Transformers v5的NeMo AutoModel，在MoE模型微调上实现3.4-3.7倍吞吐提升、GPU显存降低29-32%，且仅需修改一行import语句、无需改动其他代码。加速来自三方面：专家并行（Expert Parallelism）将专家权重分片至多GPU降低显存压力、DeepEP融合通信与计算、TransformerEngine内核加速核心算子。在128块GPU上可完成550B参数模型Nemotron 3 Ultra全量微调，而原生v5因显存不足无法运行。该库输出标准HuggingFace检查点，保持与vLLM、SGLang等下游工具兼容。

阅读原文

印度制造商Tata Electronics遭勒索攻击，逾20万份文件含特斯拉苹果规格泄露

数据泄露网络安全

印度电子制造商Tata Electronics遭遇网络安全漏洞，勒索软件组织The World Leaks公开了据称属于该公司的超过20万份文件，内容包括特斯拉和苹果的产品规格、技术细节、员工邮件及个人信息。与此同时，FFmpeg修复了名为Pixelsmash的严重漏洞，该漏洞可能导致远程代码执行或拒绝服务攻击；研究人员发现大语言模型存在「角色混淆」问题，使提示注入攻击成功率高达61%，通过「去风格化」可降至10%。五眼联盟警告称，具备重大网络攻击能力的前沿AI模型可能在数月内出现。

Databricks联合创始人主张前沿生态必须开放，推开源元框架Omnigent

AI智能体开源企业AI

Databricks联合创始人Matei Zaharia与Reynold Xin阐述其开放智能体生态愿景。开源元框架Omnigent为不同智能体系统提供统一API，覆盖会话、文件、工具与协作，可叠加在Claude Code、Codex、Cursor等之上，统一解决可移植性、会话历史、安全与成本控制问题。他们提出LTAP（湖式事务分析处理）将事务数据写入列式存储，同时支持实时运营查询与分析，为AI智能体提供实时数据。其核心观点是：当前沿模型性能趋于同质化，企业专有数据、受控访问、运营状态与工作流构成的「上下文」将成为持久护城河，开放格式（Delta Lake、Parquet）确保数据可移植性是竞争优势。

阅读原文

WAIC 2026未来技术展从1200个项目中遴选175个早期AI项目，意向订单达2.68亿元

WAIC创业投资行业趋势

WAIC 2026未来技术展从1200份申请中遴选出175个早期AI项目，覆盖四大赛道，其中行业应用与具身智能成为最拥挤的两条赛道，反映AI正加速从技术研发向落地部署转型。代表性创业团队展示了量子计算、流式视频生成、神经肌电数据采集等前沿方向。OPC独立先锋挑战赛强调原创、开源与个性，8支团队从600多个项目中脱颖而出，覆盖游戏、教育、金融等垂直领域。活动专门邀请200余位投资人，累计触达1200多家潜在客户，促成2.68亿元意向订单，构建起资本、场景与项目的高效对接通道。

阅读原文

国产3D生成公司影目科技再获数亿融资，发布Hyper3D Rodin Gen-2.5

3D生成AI融资具身智能

影目科技完成数亿元融资并发布Hyper3D Rodin Gen-2.5，采用原生3D路径与类似「思考深度」的自适应生成机制，将表示长度作为可伸缩变量，根据物体复杂度动态分配算力，实现5档可调的生成速度与质量，支持百万面片并输出12K原生贴图，达到工业级可用标准。模型通过局部编辑、递归组件分离、3D ControlNet及全DCC插件覆盖四项技术解决生成AI不可控难题。商业化方面，B端续费率接近100%，ARR达数千万美元，覆盖Lowe's、Unity、NVIDIA等大客户，80%营收来自海外。60人团队近半数有SIGGRAPH获奖经历，研究到产品转化率达70%。

阅读原文

Cursor上线Notion集成与GLM 5.2模型，扩展任务委派与编码能力

CursorAI编程GLM

AI编程工具Cursor新增Notion集成，用户可直接从Notion委派任务，由基于编辑器同款SDK构建的云端智能体执行。同时，GLM 5.2模型现已在Cursor中可用，并附带评测结果。这两项更新进一步扩展了Cursor在多平台任务委派与多模型支持方面的能力，使开发者能在更广泛的工作流中调用AI编码助手。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选，用 AI Daily Brief 开启每天的工作与生活。