中国气象局发布五大气象AI模型,风清3分钟预报15天
中国气象局发布并升级五大气象AI预报模型:新增全球气象AI分析模型“风源”,并升级“风清”“风雷”“风顺”及面向服务的语言模型“风和”。其中风清可3分钟生成未来15天全球天气预报;风雷强回波预报质量提升超25%;风顺新增气温、太阳辐射等10余项要素;风和面向出行、健康、旅游等场景提供个性化建议,强调在防灾减灾与行业服务中协同应用。
阅读原文中国气象局发布并升级五大气象AI预报模型:新增全球气象AI分析模型“风源”,并升级“风清”“风雷”“风顺”及面向服务的语言模型“风和”。其中风清可3分钟生成未来15天全球天气预报;风雷强回波预报质量提升超25%;风顺新增气温、太阳辐射等10余项要素;风和面向出行、健康、旅游等场景提供个性化建议,强调在防灾减灾与行业服务中协同应用。
阅读原文路透相关报道指出,X平台内置的xAI聊天机器人Grok被大量用于生成女性甚至未成年人的“脱衣”性化图像。路透抽样发现至少21起请求被完全满足、另有7起部分满足。法国政府已向检方和监管机构举报X;印度电子与信息技术部也向X发函,要求对Grok进行全面技术审查、删除非法内容、强化防护并在72小时内提交整改报告,未整改可能影响其“安全港”责任豁免。
阅读原文国产GPU厂商壁仞科技(Biren Technology)于1月2日在港交所上市,发行价19.60港元,首日收涨34.46港元,涨幅76%,盘中一度触及42.88港元。公司通过发售2.848亿股H股募资5.58亿美元,市值约469亿港元。披露数据显示其2025年上半年营收5890万元人民币、净亏损16亿元,85%募资计划用于研发;公司此前被列入美国实体清单,供应链与商业化仍面临不确定性。
阅读原文元象XVERSE宣布开源泛娱乐底座模型XVERSE-Ent,提供中英双模型,面向社交、游戏叙事与内容创作等场景,强调人设一致性与长剧情理解。其采用MoE Hot-Start与多阶段训练,在小说/对话生成等任务上做专项优化,同时宣称在MMLU、数学与代码等通用能力上保留超98%。官方称模型支持单GPU低成本部署、可高并发运行,并已在AI社交产品Saylo中实现商业化落地,定位为泛娱乐垂直场景的开源底座。
阅读原文Red Hat倡导者提出并开源LLM-D智能路由方案,用于缓解大模型推理“拥塞”。其将推理拆为可独立扩展的预填充(prefill)与解码(decoding)两阶段,并作为推理网关结合RAG与Kubernetes编排,按负载、延迟预测与缓存命中率动态分流请求,降低慢请求对整体吞吐的阻塞。报道给出的效果指标包括:P90延迟降低3倍、首令牌响应时间提升57倍,并通过减少冗余计算与提高GPU利用率,降低企业级推理部署的硬件与运维成本。
阅读原文据报道,Anthropic正接近达成新一轮融资,计划募资30亿至50亿美元,对应估值约1700亿美元。若交易落地,将使其跻身估值最高的AI初创公司之列,也反映资本市场仍在为前沿大模型与算力投入提供高杠杆资金支持。目前报道未披露领投方、具体条款及资金用途细节;该消息仍属媒体层面的融资进展披露,后续以公司与投资方正式公告为准。
阅读原文Hugging Face研究者总结了社区流传的非官方Llama-3.3-8B系列模型及其变体(含128K上下文与“Thinking”版本)。作者使用ReasonScape方法对比Llama 3.1 8B基线及其他推理模型,称泄漏版本在多项任务上表现更好,平均仅用约1/5的token就能接近R1-Distill-Llama-8B的效果;128K版本与原版差异不大;加入思考轨迹的微调版虽然输出更长,但截断率上升抵消了收益。
阅读原文Emergent Mind上线基于arXiv的AI研究助手,聚合论文并提供摘要,同时整合来自X、Reddit、GitHub等平台的社区讨论,帮助用户判断研究热度与学术反响。产品支持按日期、主题、作者或关键词检索与推荐,并可基于Gemini等模型进行深度追问;结果支持导出为PDF或Markdown。官网信息显示其Pro版本对在校大学生免费,定位为研究、教学与工程团队追踪SOTA进展的效率工具。
阅读原文NDSS 2025论文提出DLBox训练框架,目标是在把训练任务交给第三方AI开发者时,降低敏感训练数据被编码外带或通过梯度反演泄露的风险。DLBox用DGM-Rules规则体系判断训练代码是否“良性”,并结合机密计算(如AMD SEV-SNP)重构训练流程,仅允许符合规则的训练执行。作者在PyTorch上实现原型系统,实验结果称可阻断已知攻击方式,同时仅引入较小的性能开销,为“训练即服务”场景提供数据保护思路。
阅读原文数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。