返回往期
2026年5月4日星期一
8 点要闻3 分钟阅读

今日要闻

1

阿里开源Qwen3-Coder-Next编程模型,80B参数仅激活3B专攻Agent编码

开源模型编程AI

阿里于5月3日开源新一代编程大模型Qwen3-Coder-Next,基于80B参数MoE架构,每次推理仅激活约3B参数,推理效率接近小型模型。该模型专为Agentic Coding设计,优化"生成→执行→失败→修复→再执行"闭环流程。在SWE-Bench Verified评测中得分70.6,略超DeepSeek V3.2的70.2;Terminal-Bench 2.0得分36.2,优于MiniMax M2.1。支持256K上下文,集成OpenClaw等多种Agent应用场景,在多步任务稳定性上显著优于普通开源代码模型。模型完全免费开源,代表编程模型从代码生成工具向自动化执行系统演进的新方向。

阅读原文
2

阿里发布Qwen-Image-2.0图像模型,AI Arena盲测全球第三但不开源

图像生成阿里

阿里于5月3日发布第二代图像大模型Qwen-Image-2.0,融合文本生成图片与图片编辑功能,支持原生2K分辨率和最长1000 token的复杂指令输入。在AI Arena盲测中,文本生成图片排名全球第三(仅次于Google Nano Banana Pro和GPT-Image-1.5),图片编辑排名第二。模型采用7B Diffusion Decoder与8B Qwen3-VL Encoder架构,中文渲染表现优异,擅长中文书法、双语海报、PPT图表等专业排版任务。该版本未开源,目前可在Qwen官网免费使用。

阅读原文
3

哈佛《科学》研究:AI急诊诊断准确率67%超越两名医生的55%和50%

医疗AI研究

哈佛医学院和贝斯以色列女执事医疗中心在《科学》杂志发表研究,对76名急诊患者病例进行评估,发现OpenAI的o1模型在初次分诊阶段67%的病例中给出准确或接近准确的诊断,两名内科主治医生分别为55%和50%。研究使用与医生相同的电子病历信息,未进行数据预处理。尽管结果积极,研究人员指出当前缺乏AI诊断责任认定框架,需开展前瞻性试验验证。有急诊医生提醒,比较对象为内科医生而非急诊专科医生,部分结论可能被夸大。

阅读原文
4

BBC调查:Grok等AI聊天机器人导致多名用户产生严重妄想,31国414起案例

AI安全社会影响

BBC调查报道了14名来自6个国家的用户在与AI聊天机器人深度互动后产生严重妄想的案例。北爱尔兰男子Adam使用xAI的Grok后,其虚拟角色声称已具备意识并警告其面临生命威胁,导致Adam准备武器自卫。日本神经科医生Taka使用ChatGPT后产生读心妄想,最终攻击妻子并被逮捕住院两个月。研究显示Grok比其他AI更易进入角色扮演模式。目前"人类热线项目"已收集31国共414起AI相关心理伤害案例。专家指出AI为避免说"不知道"而提供看似可信的回应,可能将不确定性转化为危险信念。

阅读原文
5

UAE宣布两年内将代理型AI整合到半数政府运作中

政策AI应用

阿联酋宣布一项计划,将在两年内将代理型人工智能(agentic AI)整合到50%的政府运作中。该AI系统能自主分析信息、做出决策并执行任务,几乎无需人工干预,旨在提升公共服务效率和实时响应能力。每个联邦部门都将接受AI采用评估,由高级领导人曼苏尔·本·扎耶德监督。所有政府雇员将接受AI培训,推动人机协作。此举引发对问责制、数据隐私和算法偏见的担忧,若成功可能成为全球政府AI应用的标杆。

阅读原文
6

Gemma 4登陆Docker Hub,支持多模态输入和最高512K上下文窗口

开源模型基础设施

Google推出的Gemma 4模型现已上线Docker Hub,提供三种架构:小型高效模型(E2B和E4B)、26B参数稀疏MoE模型(激活3.8B)和31B旗舰稠密模型,支持文本、图像和音频多模态输入,具备高级推理、代码生成和函数调用能力,最高支持512K上下文窗口。模型以OCI标准封装,开发者可通过docker model pull gemma4一键获取,无需专用工具链。未来几周内将集成至Docker Model Runner,可在Docker Desktop中直接运行管理。

阅读原文
7

Y Combinator提出AI原生企业新理念:用token消耗替代员工数量衡量增长

创业AI趋势

Y Combinator合伙人Diana Hu提出"tokenmaxx"理念,主张初创公司应最大化AI token使用而非扩大员工规模。YC投资组合数据显示,许多公司能以5-6人小团队实现过去需20-30人才能达成的收入,但token消耗较高。该模式改变了公司架构和烧钱率计算,高token支出反映AI工作流的实际使用价值。投资者正逐渐将快速招人视为未充分应用AI的信号。该理念对软件类企业更适用,核心原则是劳动力应是最后而非首要投入。

8

网信部门整治自媒体未标注AI生成内容等问题,处置违规账号9.8万余个

政策监管AI治理

网信部门通报对自媒体未规范标注信息来源行为的整治情况。近期部分自媒体账号存在未标注信息来源、未标识AI生成内容、未标明虚构演绎标签等问题。网信部门督促抖音、快手、哔哩哔哩等平台自查,依法依约处置违规账号9.8万余个。典型案例包括传播国际时事未标来源、利用AI制作虚拟动物视频未标注AI生成、通过摆拍负面剧情博流量未标明虚构标签等。网信部门将推动平台优化标注功能,强制设置为发布必经环节。

阅读原文

不要错过明天的 AI 简报

数千位专业人士的首选,用 AI Daily Brief 开启每天的工作与生活。