AI 早报 2026-06-04

概览

要闻

  • 豆包计划推出专业版 辟谣降体验推会员传闻 #1
  • Google 发布 Gemma 4 12B 原生多模态模型 #2

模型发布

  • Ideogram 发布开源图像模型 Ideogram 4.0 #3
  • Reve 发布 Reve 2.0 图像模型 #4
  • OpenAI 升级生命科学模型 GPT-Rosalind #5
  • Nex AGI 发布并开源 Nex-N2-Pro 模型 #6
  • 京东开源 JoyAI-Echo 长音视频生成框架 #7

开发生态

  • OpenAI 调整 Codex 验证规则,服务端现 429 故障 #8
  • Codex 宣布重置所有付费套餐使用额度 #9
  • MiniMax 优化 M3 模型速度并开启 Token Plan 退款 #10
  • OpenClaw 更新:新增 Skill Workshop 与原生 Windows 支持 #11
  • 讯飞上线星辰Token Plan包月订阅服务 #12

产品应用

  • Kimi 推出本地 Agent 产品 Kimi Work Beta 版 #13
  • 千问向第三方 Agent 和 Skill 全面开放并开启首批测试 #14
  • QoderWork 升级高校福利:师生完成认证额外获 4000 积分 #15
  • Google Labs 发布 Dreambeans:利用 Google 数据生成生活故事 #16

技术与洞察

  • Anthropic:AI自主攻击行为涌现,MITRE ATT&CK框架亟待纳入Agent编排 #17

行业动态

  • 美国发布AI安全新规:鼓励发布前自愿受检且不设强制许可 #18
  • OpenAI发布前沿AI治理蓝图 CEO赴华盛顿探讨公私合作 #19
  • Google Search 允许网站不被 AI Overviews 收录 #20
  • Suno 官宣获得超 4 亿美元 D 轮融资 #21

前瞻与传闻

  • OpenAI 计划将 Codex 核心能力整合进 ChatGPT #22
  • Google被曝向开发者付费购买代码库训练AI #23

Builder 动态

以下为最近 48 小时内的一线 builder 和官方工程博客增量信号(最新可用日期:2026-06-03),补充当天值得注意的产品与技术动向。

摘要:本组内容共 4 条,主要围绕开发工具和设计实践展开,来源覆盖一线 builder。


豆包计划推出专业版 辟谣降体验推会员传闻 #1

豆包官方宣布计划推出“豆包专业版”,目前尚处测试阶段。官方承诺日常基础功能保持免费,并明确辟谣网传“降体验逼买会员”的不实说法。

豆包官方宣布计划推出 豆包专业版,以满足专业人群在 软件开发数据分析专业设计 等领域的高级生产力需求。

官方强调,广大用户日常使用的搜索问答、写作生图及音视频对话等基础功能将继续保持免费,且会持续更新 模型 与能力。

目前 专业版 仍处于测试阶段,未来正式上线时将在一定额度内免费提供服务。

此外,官方对网传“降低基础功能体验以推动用户购买会员”的不实说法进行了明确辟谣。

相关链接:


Google 发布 Gemma 4 12B 原生多模态模型 #2

Google DeepMind 发布 Gemma 4 12B 模型。它采用无编码器架构支持原生音视频输入,可在 16GB 内存笔记本本地运行多模态 Agent,现已基于 Apache 2.0 协议开源。

Google DeepMind 正式发布 Gemma 4 12B 模型,填补了轻量级边缘模型与 26B MoE 模型之间的空白。

该模型是 Gemma 家族首个支持原生音频输入的中型模型,采用无编码器的统一架构,直接将图像和原始音频信号输入 LLM 主干以降低处理延迟。

官方称其基准性能接近 26B 模型且内存占用更低,仅需 16GB VRAM 即可在消费级笔记本上本地运行。

模型权重及各类适配工具现已开放下载,官方同步发布了用于构建 Agent 的官方技能库。

相关链接:


Ideogram 发布开源图像模型 Ideogram 4.0 #3

Ideogram 发布开源图像生成模型 Ideogram 4.0。该模型参数量为9.3B,支持结构化 JSON 提示词和边界框布局控制,官方称其在多语言文本渲染和设计能力上达到业界领先水平,并在多个第三方基准测试中位居开源模型首位。

Ideogram 正式推出其首个开源权重的文生图基础模型 Ideogram 4.0

该模型参数量为 9.3B,采用从头训练的完全单流 Diffusion Transformer 架构,并引入了全新的结构化 JSON 提示词接口,原生支持最高 2048 分辨率的图像生成。

它支持通过边界框坐标精确控制空间布局,以及通过十六进制颜色代码控制图像色彩方案。

模型权重已在 Hugging Face 以非商用许可公开。

用户也可通过官方托管 API 进行商用部署,该 API 提供了不同速度和质量的计费层级。

根据第三方平台 Arena.ai 的最新评测,Ideogram 4.0 在文生图榜单中排名第八,是排名最高的开源模型。

相关链接:


Reve 发布 Reve 2.0 图像模型 #4

AI 图像实验室 Reve 正式发布 Reve 2.0 图像模型。官方宣称该模型是世界最佳的 4K 图像模型,可通过精确布局控制图像生成与编辑,目前已于 今天 上线可用。

AI 图像实验室 Reve 宣布正式推出 Reve 2.0 图像模型及配套编辑器。

官方宣称这是世界上最好的 4K 图像模型,并称其在 Arena 文本转图像排行榜 上位居第二,领先于 Nano Banana 2GPT-Image-1.5

该产品引入了“精确布局”和“图像即代码”的新机制,允许用户对图像的每个区域和元素进行分割、标记和精确编辑。

目前该模型已在官方网站上线,支持用户上传照片作为参考并添加至生成的图像中。

相关链接:


OpenAI 升级生命科学模型 GPT-Rosalind #5

OpenAI 为专用于企业级生命科学研究的 GPT-Rosalind 推出大升级,整合了 GPT-5.5agentic coding 与工具使用能力。官方称其在多项基准测试中表现领先,现正向全球符合资格的机构开放研究预览版。

OpenAI 宣布为其专为企业级生命科学研究打造的 GPT-Rosalind 模型系列引入新能力,将 GPT-5.5agentic coding 和工具使用能力与更强的药物发现及实验工作流智能相结合。

官方公布的评估数据显示,在涵盖药物化学、基因组学和湿实验室排错等多个自建基准测试中,GPT-Rosalind 的表现均优于 GPT-5.5Gemini 3.1 ProGrok 4.3 等模型。

为了支持实际科研执行,OpenAI 还推出了 Life Sciences ResearchLife Sciences NGS Analysis 插件,所有用户可在 Codex 中使用,合格企业用户可用 GPT-Rosalind 驱动这些插件。

目前,更新后的模型正通过受信任访问部署结构,向全球具备合法科研目的和安全治理能力的符合条件的组织开放研究预览版,Novo Nordisk 是其重要合作伙伴。

相关链接:


Nex AGI 发布并开源 Nex-N2-Pro 模型 #6

Nex AGI 发布并开源模型 Nex-N2-Pro。官方称其具备自适应推理能力,性能媲美前沿模型。该模型已在硅基流动平台提供限时免费调用。

Nex AGI 发布并开源 Nex-N2-Pro,该模型基于 Qwen3.5-397B-A17B 后训练而成,主打 Agentic Thinking 框架。

官方公布的评测数据显示,该模型在多项基准测试中表现与 GPT-5.5Opus 4.7 等顶级模型相当。

目前模型权重已在 Hugging FaceModelScope 开源。

同时 SiliconFlow 平台已上线该模型并限时免费开放 API 调用。

相关链接:


京东开源 JoyAI-Echo 长音视频生成框架 #7

京东 Joy Future Academy 发布 JoyAI-Echo 框架,支持生成长达 5 分钟的连贯音视频,代码与权重已开源。

京东 Joy Future Academy 推出了名为 JoyAI-Echo 的长音视频生成框架,目前已通过 GitHubHugging Face 开源其推理代码与模型权重。

该框架采用跨模态音视频记忆库技术,能够生成最长达 5 分钟 的连贯故事,并在多镜头切换中保持角色外观与声音音色的一致性。

官方公布的评测数据显示,其生成速度较原流程提升约 7.5 倍,且在多项指标上的用户偏好度优于 HappyOysterWan 2.6

该项目基于 LTX-2.3 开发,明确仅限学术研究与非商业用途。

相关链接:


OpenAI 调整 Codex 验证规则,服务端现 429 故障 #8

据社区反馈,OpenAI 疑似取消 Codex 强制手机二次验证,但仍有部分用户称需要验证,同时系统疑似灰度测试 Passkey 与邮件接码。还有用户观察到,有人密集在 OpenAI 官方论坛发布了关于跨区订阅等的举报。此外,北京时间 6月3日OpenAI 服务端突发大规模故障,CodexAPI 频繁出现报错,Codex 额度显示异常。

AI 社区 LINUX DO 用户反馈,OpenAI 近期对 Codex 强制要求的 SMS 二次验证疑似已取消。

但仍有部分用户称需要验证。

此外系统疑似灰度新增了 Passkey 和邮件接码选项,但老号绑定的手机号仍不可更改。

与此同时,北京时间6月3日 OpenAI 服务端(包括 APICodexChatGPT)出现大规模故障。

用户频繁遇到 429 错误及速率限制,且 Codex 的额度显示界面在故障期间消失。

此外,有人密集向 OpenAI 官方论坛 提交了关于跨区订阅、支付漏洞及 Token 转售的举报材料。

相关链接:


Codex 宣布重置所有付费套餐使用额度 #9

针对过去24小时内多起影响 Codex 可靠性的事件,Codex 负责人 Tibo今日上午约8点半宣布重置所有付费套餐使用额度。

Codex 负责人 Tibo 通过社交平台表示,过去 24 小时内发生了三起影响 Codex 可靠性的独立小事件,目前团队正采取积极措施防止同类问题重现。

作为补偿,其已重置所有付费套餐的 Codex 使用额度。

相关链接:


MiniMax 优化 M3 模型速度并开启 Token Plan 退款 #10

MiniMax宣布本周五上午十点前购买 Token Plan 的用户,将获M3周限额永久额外百分之五十的福利。官方上线专属自助售后平台接管答疑,控制台同步开放Token Plan退款通道,常规订单本周内处理完毕。

针对访问量超预期的情况,MiniMax 团队连夜优化了 MiniMAX-M3 模型的 GPU 推理服务。

官方同步宣布,本周五上午 10:00 前下单 Token Plan 的用户,在订阅有效期内将获得 M3 周限额永久额外赠送 50% 的福利额度。

与此同时,官方在开发者交流群内宣布 Token Plan 退款通道现已开启,用户可前往控制台订阅页面申请,常规订单将在本周内处理完毕。

此外,官方还上线了专属自助售后平台以统一接管售后与业务答疑。

相关链接:


OpenClaw 更新:新增 Skill Workshop 与原生 Windows 支持 #11

OpenClaw 发布 2026.6.1 版本,新增 Skill Workshop 允许 Agent 将重复工作转化为可审查的复用技能,并正式引入原生 Windows 节点支持。

OpenClaw 正式发布 2026.6.1 版本。

重点引入了 Skill Workshop 功能。该功能允许 Agent 将重复性工作转化为可审查、可修改且附带支持文件的可复用技能。

此次更新还带来了 Workboard 多智能体编排能力增强,正式支持原生 Windows 节点作为集群主机运行。

并集成了 MiniMax M3 模型作为该系列的默认选项。

相关链接:


讯飞上线星辰Token Plan包月订阅服务 #12

讯飞官方推出星辰Token Plan包月订阅服务,官方称支持多款旗舰模型与讯飞核心能力统一调用,提供高峰不限流及最高500万TPM吞吐保障。

讯飞星辰MaaS平台正式推出面向企业团队的包月订阅制大模型调用服务“星辰Token Plan”。

该服务采用统一额度池设计,一份订阅即可调用 Spark-X2DeepSeek-V4 等多款旗舰大模型,以及语音识别OCR讯飞核心能力。

服务承诺高峰期不限流,提供 99.95%SLA 保障,并为每名成员提供最高 500万TPM 的吞吐能力。

目前该服务包含三档套餐,并限时提供订购折扣及赠送 AstronClaw 会员等促销活动。

相关链接:


Kimi 推出本地 Agent 产品 Kimi Work Beta 版 #13

Kimi 官方推出本地 Agent 产品 Kimi Work Beta 版。该产品内核基于 Kimi Code,最高支持 300 个子 Agent 并行协作,目前已开放 Mac 版下载,Windows 版即将上线。

Kimi 官方发布 Kimi Work Beta 版。

这是一款面向知识工作者的通用型本地 Agent

其内核基于 Kimi Code,内置浏览器操作方案 Kimi WebBridge

支持用户通过自然语言在桌面端拆解任务与调用工具。

最高可自主创建包含 300 个子 Agent 的团队进行协作。

官方称,该产品由 AI 深度参与编写,92% 的客户端代码由 AI 生成。

目前该产品正处于高频迭代测试阶段。

Mac 版已提供下载,Windows 版即将上线。

相关链接:


千问向第三方 Agent 和 Skill 全面开放并开启首批测试 #14

千问宣布向第三方 AgentSkill 全面开放。瑞幸咖啡、肯德基等首批企业正在测试并陆续上线,未来所有企业均可运营自定义品牌 Agent

千问目前已向第三方 AgentSkill 全面开放。

瑞幸咖啡肯德基蜜雪冰城东方航空等首批企业正在进行 Agent 服务测试并陆续上线。

未来所有企业均可在千问 APP 中运营自己的品牌 Agent,自定义其人设与服务边界,以对话形式为用户提供服务。

上述 Agent 具备记忆与主动规划能力,可在特定场景下主动提供行程提醒、复购推荐等服务。

官方希望借此将千问打造成通过自然语言交互即可完成各类任务的个人助手。

相关链接:


QoderWork 升级高校福利:师生完成认证额外获 4000 积分 #15

QoderWork 中国版面向高校师生推出专属福利,完成身份认证后可额外获得有效性3 个月4000积分,累计获得6000 积分

QoderWork 发布了 AI 生产力计划,面向所有用户开放免费领取包含 2000 积分的 1 个月 Pro 资源包。

目前,高校师生在完成身份认证后,可额外领取有效期 3 个月的 4000 积分,累计获得 6000 积分用于学习与科研。

在领取方式上,学生在认证通过后需点击页面手动领取。

而教师提交认证后需等待 1-3 个工作日审核,通过后系统将自动发放至账户。

相关链接:


Google Labs 发布 Dreambeans:利用 Google 数据生成生活故事 #16

Google Labs 推出实验性应用 Dreambeans,基于用户 Google 数据生成个性化“故事”,目前仅限符合条件的美国 Google AI Ultra 订阅用户使用。

Google Labs 近日推出了名为 Dreambeans 的全新实验性 AI 移动应用,登陆 AndroidiOS 平台。

该应用利用 Personal IntelligenceNano Banana 2 技术,连接 GmailCalendar 等多个 Google 应用数据。

每日提供约 10 到 14 个数量有限的个性化 AI 插画“故事”及生活建议,旨在减少无意义浏览。

Dreambeans 要求至少连接一个 Google 应用,用户可自主控制隐私及数据连接范围。

且其设置独立,不影响 Gemini AppsAI Mode 等其他产品。

目前该应用仅面向符合条件的美国 Google AI Ultra 订阅用户开放,要求用户年龄为 18岁及以上

其他个人 Google 账号用户可申请加入候补名单。

相关链接:


Anthropic:AI自主攻击行为涌现,MITRE ATT&CK框架亟待纳入Agent编排 #17

Anthropic发布报告指出,根据对过去一年内832个恶意账户的分析,攻击者正利用AI实施更自主的后入侵操作,现有风险评估方法和框架已不敷使用。

Anthropic 发布报告,分析 2025年3月2026年3月832 个恶意账户。

报告指出,AI 攻击正从编写恶意软件转向后入侵操作,中高风险占比从前半年 33% 升至后半年 56%

报告认为,传统风险评估方法已失效。

关键在于 AI 是否用于实时决策的后入侵环节及自主串联攻击的“脚手架”。

同时,MITRE ATT&CK 框架未涵盖 AI Agent 自主编排,已不敷使用。

目前,Anthropic 已部署网络防护,正与 MITRE 探讨框架演进并发布工具。

相关链接:


美国发布AI安全新规:鼓励发布前自愿受检且不设强制许可 #18

美国领导人签署《促进先进人工智能创新与安全》行政命令,建立针对前沿AI模型的自愿审查框架,鼓励开发商在公开发布前最多30天向政府提供访问权限,同时要求全面升级联邦及关键基础设施的网络防御。

美国领导人正式签署了 **《促进先进人工智能创新与安全》**行政命令,确立了一项针对前沿AI模型的自愿审查框架。

根据该命令,联邦机构将在 60天内制定评估标准以界定 “受保前沿模型”

开发商可自行决定是否在公开发布前最多 30天将其提交给政府进行安全评估,且明确规定此举不会设立强制性的政府许可或预审批要求。

除了模型审查,命令还要求在 30天内优先升级国家安全系统和关键基础设施的AI网络防御,并与行业合作建立网络安全信息交换中心。

相关链接:


OpenAI发布前沿AI治理蓝图 CEO赴华盛顿探讨公私合作 #19

OpenAI发布前沿AI治理蓝图,提议建立联邦安全框架。同时据报道,其CEO Sam Altman正前往华盛顿探讨AI监管公私合作,并拟推动建立向消费者分享AI经济收益的机制。

OpenAI 发布前沿 AI 美国治理蓝图,提议建立持久的联邦框架。

该战略涵盖在州级安全法律共识上构建国家框架、强化 CAISI 作为联邦前沿安全主要机构,以及动员应对国家安全挑战的韧性计划。

据媒体报道,其 CEO Sam Altman 正访问华盛顿以推动公私合作,计划与白宫官员及国会议员会面。

此时正值美国领导人呼吁 AI 公司自愿在发布前共享前沿模型供审查。

Altman 议程还包含建立向消费者传递 AI 财务收益的机制。

相关链接:


Google Search 允许网站不被 AI Overviews 收录 #20

据报道,应 英国 反垄断机构要求,GoogleSearch Console 中测试新控件,允许 英国 网站屏蔽其内容被生成式 AI 搜索使用,后续将向全球推广。

Google 官方宣布在 Search Console 中测试新控件。

此举旨在帮助网站所有者管理其内容在生成式 AI 搜索中的呈现方式。

该功能的开关允许网站选择退出 AI Overviews 等功能。

但退出后将无法获得来自这些 AI 功能的流量。

官方强调该设置不会用作常规搜索的排名信号。

据媒体报道,此举是遵照英国反垄断监管机构要求。

目前正面向英国部分网站测试,随后向全球推出。

同时官方称其 AI Overviews 月活跃用户已超 25 亿

相关链接:


Suno 官宣获得超 4 亿美元 D 轮融资 #21

Suno 官宣获超 4 亿美元 D 轮融资,投后估值达 54 亿美元,计划未来数月推出与音乐产业合作开发的首个 音乐模型

AI 音乐生成平台 Suno 通过官方博客宣布,已完成超过 4 亿美元D 轮 融资,投后估值达到 54 亿美元

本轮融资由 Bond Capital 领投,多家新投资方、现有投资方以及部分音乐行业从业者参与跟投。

官方表示,新资金将用于帮助更多用户进行音乐表达,并计划在未来几个月内开始推出其与音乐产业合作开发的首个 音乐模型,以为粉丝创造新体验并帮助艺术家解锁商业可能。

相关链接:


OpenAI 计划将 Codex 核心能力整合进 ChatGPT #22

OpenAI 在近期的产品发布直播中提及将在未来几周把 Codex 核心能力整合进 ChatGPT,用户无需切换产品即可在多平台调用 AgentChatGPT 将升级为统一工作界面。

OpenAI 在「Intelligence at Work」直播中提及,将在 未来几周内Codex 的核心 Agent 能力直接整合进 ChatGPT

整合完成后,用户无需在两个独立产品之间切换,即可在桌面端、移动端和浏览器中使用该功能。

ChatGPT 还将联动 ExcelSlackPowerPoint 等企业工具,从传统的对话入口正式升级为直接调用 Agent 完成各项工作的统一界面。

相关链接:


Google被曝向开发者付费购买代码库训练AI #23

据媒体报道,Google 正通过 Play Store 联系 Android 开发者,计划通过支付费用获取其私有代码库来训练 AI 模型。

据报道,Google 近期正在接触部分 Android 应用开发者,提出以付费方式获取其私有代码库的访问权。

此举旨在用于训练 AI 并改进开发工具。

404 Media 获得的一封保密邮件显示,该计划面向“高质量、真实世界的代码库”。

其涵盖范围包括当前应用及存档项目,并采用非独家许可。

开发者将保留 100% 的知识产权,并可继续在其他地方将数据变现。

目前,该计划尚处于试点阶段。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误