1
OpenAI联合博通推出首款自研推理芯片Jalapeño,9个月完成设计流片 AI芯片 OpenAI 推理加速
OpenAI与博通联合发布首款专为大语言模型推理设计的定制芯片Jalapeño,采用裸片设计,从架构设计到流片仅用9个月,创高性能ASIC最快开发纪录,部分设计由OpenAI自有模型加速完成。该芯片专注降低数据搬运、平衡资源以逼近理论峰值性能,每瓦性能显著优于当前业界水平,并兼容全行业各类LLM。三方分工明确:OpenAI负责架构与核心,博通提供硅实现与Tomahawk网络芯片,Celestica负责系统集成。芯片计划2026年底开始部署,目标吉瓦级数据中心,合作方包括微软,是其多代算力平台的第一步。
阅读原文 2
Google将计算机操作能力内置进Gemini 3.5 Flash,可跨浏览器与桌面执行任务 Gemini AI智能体 企业自动化
Google宣布Gemini 3.5 Flash将「计算机操作」(computer use)作为内置工具,取代此前的独立模型。开发者可通过Gemini API与企业级Agent平台直接调用,构建能在浏览器、移动端和桌面环境中感知、推理并执行操作的智能体,适用于持续软件测试等长周期企业自动化任务。安全方面采用针对性对抗训练以缓解提示注入风险,并提供可选的企业级防护:对不可逆操作要求用户确认,检测到间接提示注入时自动停止任务,官方建议采用纵深防御。Google同时提供演示环境与参考实现供快速上手。
阅读原文 3
字节跳动发布Seedance 2.5视频模型,单提示词生成30秒4K视频 视频生成 字节跳动
字节跳动发布新一代AI视频生成模型Seedance 2.5,可基于单个提示词生成时长30秒、分辨率4K的视频,并支持最多50个图像、视频或音频参考输入以增强生成控制。该模型计划下月在中国市场推出。此次发布延续了视频生成赛道对时长、清晰度与可控性的持续突破。
4
OpenAI更新GPT-5.5 Instant,提升意图理解与复杂约束处理能力 GPT-5.5 OpenAI 模型更新
OpenAI宣布推出新版本GPT-5.5 Instant,在意图理解、复杂约束条件处理以及推荐连贯性方面均有提升。该版本于当日向付费用户推出,次日面向免费用户开放。此次更新聚焦对话场景下的实际可用性,使模型在处理多重限制条件时表现更稳定。
阅读原文 5
NVIDIA NeMo AutoModel加速MoE微调,吞吐提升3.4-3.7倍仅改一行代码 模型微调 NVIDIA MoE
NVIDIA发布基于Transformers v5的NeMo AutoModel,在MoE模型微调上实现3.4-3.7倍吞吐提升、GPU显存降低29-32%,且仅需修改一行import语句、无需改动其他代码。加速来自三方面:专家并行(Expert Parallelism)将专家权重分片至多GPU降低显存压力、DeepEP融合通信与计算、TransformerEngine内核加速核心算子。在128块GPU上可完成550B参数模型Nemotron 3 Ultra全量微调,而原生v5因显存不足无法运行。该库输出标准HuggingFace检查点,保持与vLLM、SGLang等下游工具兼容。
阅读原文 6
印度制造商Tata Electronics遭勒索攻击,逾20万份文件含特斯拉苹果规格泄露 数据泄露 网络安全
印度电子制造商Tata Electronics遭遇网络安全漏洞,勒索软件组织The World Leaks公开了据称属于该公司的超过20万份文件,内容包括特斯拉和苹果的产品规格、技术细节、员工邮件及个人信息。与此同时,FFmpeg修复了名为Pixelsmash的严重漏洞,该漏洞可能导致远程代码执行或拒绝服务攻击;研究人员发现大语言模型存在「角色混淆」问题,使提示注入攻击成功率高达61%,通过「去风格化」可降至10%。五眼联盟警告称,具备重大网络攻击能力的前沿AI模型可能在数月内出现。
7
Databricks联合创始人主张前沿生态必须开放,推开源元框架Omnigent AI智能体 开源 企业AI
Databricks联合创始人Matei Zaharia与Reynold Xin阐述其开放智能体生态愿景。开源元框架Omnigent为不同智能体系统提供统一API,覆盖会话、文件、工具与协作,可叠加在Claude Code、Codex、Cursor等之上,统一解决可移植性、会话历史、安全与成本控制问题。他们提出LTAP(湖式事务分析处理)将事务数据写入列式存储,同时支持实时运营查询与分析,为AI智能体提供实时数据。其核心观点是:当前沿模型性能趋于同质化,企业专有数据、受控访问、运营状态与工作流构成的「上下文」将成为持久护城河,开放格式(Delta Lake、Parquet)确保数据可移植性是竞争优势。
阅读原文 8
WAIC 2026未来技术展从1200个项目中遴选175个早期AI项目,意向订单达2.68亿元 WAIC 创业投资 行业趋势
WAIC 2026未来技术展从1200份申请中遴选出175个早期AI项目,覆盖四大赛道,其中行业应用与具身智能成为最拥挤的两条赛道,反映AI正加速从技术研发向落地部署转型。代表性创业团队展示了量子计算、流式视频生成、神经肌电数据采集等前沿方向。OPC独立先锋挑战赛强调原创、开源与个性,8支团队从600多个项目中脱颖而出,覆盖游戏、教育、金融等垂直领域。活动专门邀请200余位投资人,累计触达1200多家潜在客户,促成2.68亿元意向订单,构建起资本、场景与项目的高效对接通道。
阅读原文 9
国产3D生成公司影目科技再获数亿融资,发布Hyper3D Rodin Gen-2.5 3D生成 AI融资 具身智能
影目科技完成数亿元融资并发布Hyper3D Rodin Gen-2.5,采用原生3D路径与类似「思考深度」的自适应生成机制,将表示长度作为可伸缩变量,根据物体复杂度动态分配算力,实现5档可调的生成速度与质量,支持百万面片并输出12K原生贴图,达到工业级可用标准。模型通过局部编辑、递归组件分离、3D ControlNet及全DCC插件覆盖四项技术解决生成AI不可控难题。商业化方面,B端续费率接近100%,ARR达数千万美元,覆盖Lowe's、Unity、NVIDIA等大客户,80%营收来自海外。60人团队近半数有SIGGRAPH获奖经历,研究到产品转化率达70%。
阅读原文 10
Cursor上线Notion集成与GLM 5.2模型,扩展任务委派与编码能力 Cursor AI编程 GLM
AI编程工具Cursor新增Notion集成,用户可直接从Notion委派任务,由基于编辑器同款SDK构建的云端智能体执行。同时,GLM 5.2模型现已在Cursor中可用,并附带评测结果。这两项更新进一步扩展了Cursor在多平台任务委派与多模型支持方面的能力,使开发者能在更广泛的工作流中调用AI编码助手。
阅读原文