返回往期
2026年4月2日星期四
10 点要闻3 分钟阅读

今日要闻

1

Liquid AI发布LFM2.5-350M,3.5亿参数训练28万亿token挑战大模型范式

模型发布边缘AI

Liquid AI发布紧凑型语言模型LFM2.5-350M,仅含3.5亿参数但训练数据量高达28万亿token,token与参数比达80000:1。该模型采用基于线性输入可变系统(LIV)的混合架构,结合分组查询注意力模块,支持32k上下文窗口。在IFEval指令遵循任务中得分76.96,擅长工具调用和结构化数据提取,但不适用于复杂数学、编程或创意写作。模型专为边缘设备优化,在Snapdragon GPU上峰值内存仅81MB,单张H100 GPU推理吞吐达40.4K输出token/秒,可在树莓派5上以300MB内存运行,展现出极高的边缘部署潜力。

阅读原文
2

NVIDIA在MLPerf Inference v6.0创新纪录,Blackwell Ultra性能最高提升2.7倍

基准测试芯片

NVIDIA基于Blackwell Ultra GPU的系统在MLPerf Inference v6.0基准测试中创下多项纪录,累计自2018年以来训练与推理胜出次数达291次,是其他平台总和的9倍。本次新增DeepSeek-R1、Qwen3-VL-235B等测试项目,NVIDIA是唯一提交全部新模型结果的平台。通过TensorRT-LLM软件优化,GB300 NVL72系统在DeepSeek-R1上实现最高2.7倍性能提升,token成本降低超60%。关键技术包括Disaggregated Serving、Wide Expert Parallel和Multi-Token Prediction。四台GB300 NVL72通过Quantum-X800 InfiniBand互联,288颗GPU实现每秒数百万token处理能力。

阅读原文
3

Hugging Face发布TRL v1.0,统一大模型后训练工作流正式转向生产级

开源工具模型训练

Hugging Face正式发布TRL v1.0,标志着该库从研究导向转向稳定的生产级强化学习框架。TRL v1.0提供统一的后训练流程,涵盖监督微调(SFT)、奖励建模和对齐算法(DPO、GRPO等),并引入CLI命令行接口、统一配置系统和扩展的对齐算法套件三大核心特性。新版本支持YAML驱动训练配置,兼容Hugging Face Accelerate实现跨硬件分布式训练,集成PEFT(LoRA/QLoRA)和Unsloth加速内核显著提升训练效率与内存使用。同时推出trl.experimental命名空间容纳ORPO等前沿实验性方法,使大模型后训练更标准化、高效且可复现。

阅读原文
4

谷歌DeepMind推出Veo 3.1 Lite,低成本视频生成模型通过Gemini API开放

视频生成产品发布

谷歌DeepMind推出Veo 3.1 Lite视频生成模型,定位为最具成本效益的视频生成方案,在保持与Veo 3.1 Fast相同速度的同时成本降低一半以上。该模型支持文本到视频和图像到视频生成,提供4秒、6秒和8秒灵活时长选项,适配横屏(16:9)与竖屏(9:16)格式,输出分辨率达720p和1080p。通过Gemini API和Google AI Studio开放访问,降低开发者采用门槛,适用于营销、教育和社交内容等大规模应用场景。此举标志着视频生成技术进入以总拥有成本和集成效率为核心竞争力的新阶段。

阅读原文
5

甲骨文因AI基础设施投资压力启动大规模裁员,预估涉及2-3万人

企业动态裁员

甲骨文因大规模投资AI基础设施导致财务压力加剧,股价年内下跌25%,已启动裁员,影响美国、印度等多地的云服务、销售和医疗保健团队。公司为建设AI数据中心已举债500亿美元,剩余履约义务激增至4550亿美元。虽未正式公布裁员规模,但分析师预测可能涉及2万至3万个工作岗位,预计可释放80亿至100亿美元自由现金流。管理层强调AI投资将在长期带来回报,当前AI算力订单达5530亿美元。此次裁员是继亚马逊、微软和Meta之后,科技行业新一轮大规模削减人力的一部分。

阅读原文
6

SpaceX秘密提交IPO申请,目标估值1.75万亿美元、募资750亿

IPO航天

SpaceX已向美国SEC秘密提交首次公开募股申请,计划于2026年6月上市,目标估值超过1.75万亿美元,募集资金可能达到750亿美元,远超2019年沙特阿美290亿美元的IPO纪录。此次IPO由美国银行、花旗集团、高盛、摩根大通和摩根士丹利牵头承销。SpaceX主导商业航天发射市场并运营Starlink卫星互联网项目,2026年营收接近200亿美元。此前SpaceX已收购马斯克的AI公司xAI,进一步拓展AI领域布局。此举正值OpenAI和Anthropic等AI巨头也准备上市。

阅读原文
7

智谱AI发布AutoClaw智能体集成Pony-Alpha-2,港股股价暴涨31.9%

智能体产品发布

智谱AI发布AutoClaw智能体,集成Pony-Alpha-2模型,具备无缝部署能力,旨在提升复杂任务中的自主执行与协同效率。Pony-Alpha-2模型在推理能力和任务理解方面有显著提升,支持多场景快速适配。受API年经常性收入预期暴增60倍至17亿元人民币的利好消息推动,智谱AI港股(02513.HK)当日股价飙升31.9%,成为港股AI板块最受关注的标的之一。此次发布标志着智谱AI在智能体技术路径上的进一步探索,推动大模型向产业应用深度落地。

阅读原文
8

AI半导体需求挤压全球智能手机市场,分析师警告出货量或降31%

芯片供应链

AI相关半导体需求激增导致内存芯片价格飙升,正严重挤压全球智能手机市场。杰富瑞(Jefferies)警告未来一年智能手机出货量可能最多下降31%。服务器制造商的需求已推动内存芯片价格上涨70%,2026年Q2预计还将再涨50%,导致高端智能手机价格可能上涨超150美元。Counterpoint Research和IDC也预测2026年智能手机出货量将下降12%-13%。高通和苹果均受影响,苹果已推迟标准机型生产并优先出货高端机型。美光科技最近一个财季营收同比增长三倍至近240亿美元,但仅能满足客户约一半到三分之二的需求。

阅读原文
9

Holo3以MoE架构在OSWorld计算机使用基准达78.85%,仅激活10B参数

智能体模型发布

Hcompany推出Holo3计算机使用智能体模型,在OSWorld-Verified基准上达到78.85%的行业最高分,超越GPT-5等大型模型。该模型采用MoE架构,总参数122B但仅激活10B参数,推理成本仅为大型闭源模型的一小部分。Holo3通过专有的合成训练飞轮自动生成企业环境进行训练,具备跨应用多步推理能力,可协调PDF解析、预算检查和邮件发送等复杂桌面操作流程。模型展示了从单一界面操作向自适应代理演进的路线,是开源计算机使用智能体领域的重要突破。

阅读原文
10

Kestra完成2500万美元A轮融资,开源编排平台18个月企业收入增长25倍

融资开源

开源编排平台Kestra宣布完成2500万美元A轮融资,由RTP Global领投,总融资额达3600万美元。过去18个月企业收入增长25倍,2025年执行超20亿个工作流,同比增长20倍。平台拥有超2.6万个GitHub stars,被苹果、丰田、摩根大通等3万多家全球组织采用,用于AI管道、网络安全分析和基础设施自动化等场景。新资金将用于推出Kestra 2.0(含分布式执行引擎和实时可观测性)、上线按使用付费的Kestra Cloud SaaS服务,并扩展北美和欧洲市场。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。