AI 早报 2026-06-05

概览

要闻

  • NVIDIA 正式发布并开源 Nemotron 3 Ultra 模型 #1
  • OpenAI 发布 ChatGPT 新记忆架构 Dreaming #2
  • Anthropic 称 AI 递归自我改进或比预期更快到来 #3

模型发布

  • 字节跳动开源 Bernini 统一视频生成与编辑框架 #4
  • Higgs Audio v3 TTS 发布 支持百种语言与声音克隆 #5
  • Google Magenta 发布实时音乐生成模型 Magenta RealTime 2 #6
  • NVIDIA 发布 Nemotron 3.5 Content Safety 模型与配套数据集 #7
  • 香港生成式人工智能研发中心推出 HKGAI V3 大模型 #8

开发生态

  • Codex 推出 iOS 测试插件并修复 Token 计数 Bug #9
  • Claude Code 以 "ultracode" 作为触发词替换 "workflow" #10
  • Antigravity 向所有付费用户开放 /teamwork-preview #11
  • GitHub Copilot 上线百万级上下文与可配置推理级别 #12
  • HeyGen 推出视频与动态图形规范 frame.md #13
  • OpenAI 在 Responses 与 Completions API 中内建审核分数返回 #14

产品应用

  • NotebookLM 推出 Source Attribution 功能 #15
  • LM Studio 推出 iOS 移动应用 Locally #16

技术与洞察

  • Anthropic 发文介绍基于 Claude 的自助式数据分析架构 #17
  • 李飞飞团队发文厘清世界模型定义 #18
  • Guide Labs发布Clarity:首个内建可解释性AI平台开放研究预览 #19
  • Arena.ai 推出 Agent Mode 及真实任务评估排行榜 #20

行业动态

  • VoidZero 加入 Cloudflare,核心项目维持开源 #21
  • Google 宣布向犹他州所有 K-12 学校提供 Gemini for Education #22

前瞻与传闻

  • TRAE 即将上线四档付费“速通”权益 #23
  • 消息称 Anthropic 即将发布 Mythos 级别模型代号 Oceanus #24

Builder 动态

以下为最近 48 小时内的一线 builder 和官方工程博客增量信号(最新可用日期:2026-06-04),补充当天值得注意的产品与技术动向。

摘要:本组内容共 4 条,主要围绕设计实践展开,来源覆盖官方工程博客和一线 builder。


NVIDIA 正式发布并开源 Nemotron 3 Ultra 模型 #1

NVIDIA 正式发布 Nemotron 3 Ultra 开源模型,该模型采用 LatentMoE 架构,结合了 Mamba-2MoE 层,拥有 550B 总参数与 55B 激活参数,支持 1M 上下文长度,专为长周期 Agent 的编排与前沿推理设计,目前已在Hermes AgentOpenCode等多个平台限时免费开放使用。

NVIDIA 发布了最新旗舰开源大模型 Nemotron 3 Ultra

该模型总参数量为 550B,激活参数为 55B,采用结合 Mamba-2MoEAttention 层的 LatentMoE 混合架构。

它支持最高 1M token 的上下文长度,并支持包括中文在内的多种语言。

该模型专为复杂 Agent 系统中的前沿推理和编排构建,引入了多教师在线策略蒸馏(MOPD)技术以提升跨领域推理效率,并使用 NVFP4 精度以优化计算效率。

官方博客称,该模型在 SWE-benchTerminal-bench 等测试中,完成任务的 token 消耗显著降低,最多可节省约 30% 的成本。

同时,在 Blackwell 架构上实现了 5 倍的吞吐量提升。

该模型在 Artificial Analysis Intelligence Index 中取得了美国开源权重的最高分,且与其他同级别开源模型相比具有明显的吞吐量优势。

目前模型权重已上线 Hugging Face,采用 OpenMDW-1.1 许可证。

同时,Hermes AgentOpenCode 等平台已提供限时免费调用。

相关链接:


OpenAI 发布 ChatGPT 新记忆架构 Dreaming #2

OpenAI宣布为ChatGPT推出代号为**“Dreaming”的全新记忆架构**,该系统能在后台自动提炼并更新用户的偏好与上下文,同时新增**“记忆摘要”页面可查看、修改或手动引导这些记忆内容。目前该功能已面向美国地区的PlusPro**用户开放。

OpenAI 发布了代号为 “Dreaming”ChatGPT 全新记忆系统架构,旨在解决旧版记忆容易过时且需明确指令触发的问题。

新系统能在后台自动跨对话提炼用户偏好、项目及限制条件,并随时间推移自动更新陈旧信息。

用户现可通过新增的 “记忆摘要” 页面查看、修改或手动引导这些记忆内容。

该功能目前已率先面向 美国PlusPro 用户上线,官方称通过算力优化降低了约 5 倍 的计算消耗,未来几周将陆续扩展至更多国家及 FreeGo 用户。

相关链接:


Anthropic 称 AI 递归自我改进或比预期更快到来 #3

Anthropic 发布博客文章称,根据其内部数据,Claude 已在显著加速 AI 的研发进程,其中包括 超过 80% 的代码已由 Claude 自身编写,但其团队同时指出,在设定研究方向等关键判断力上,AI 与人类仍有差距,因此完全的“递归自我改进”尚未到来。Anthropic 呼吁展开全球协调对话,探讨包括前沿 AI 开发的减速或暂停选项。

Anthropic 官方研究院发布长篇博客文章**《当AI构建自身》**,系统性地展示了 AI 模型 Claude 在加速其自身开发过程中的多项内部指标。

目前超过 80% 的代码Claude 编写,工程师的人均代码产出量达到 2024 年的 8 倍

在最开放的工程任务上,Claude六个月成功率从约 26% 跃升至 76%

在优化 AI 训练代码这类实验中,其实现的速度提升也从约 3 倍飙升至约 52 倍

然而该公司也坦言,Claude 在研究判断力方面仍存在局限,尚未能在选择正确的研究方向和目标上取代人类。

因此完整的递归自我改进并非必然发生,但其到来的速度可能超出多数机构的预期。

Anthropic 呼吁展开全球协调对话,探讨包括前沿 AI 开发的减速或暂停选项,并指出这需要可验证的机制。

相关链接:


字节跳动开源 Bernini 统一视频生成与编辑框架 #4

字节跳动近期开源了视频生成与编辑框架 Bernini的推理代码,以及渲染器权重 Bernini-R。该框架结合MLLM规划器与DiT渲染器,支持文生视频及运动修改等任务,官方称其视频编辑能力已达闭源商业模型第一梯队。模型权重已发布于 HuggingFace

字节跳动开源了统一视频生成与编辑框架 Bernini 的推理代码及渲染器模型权重 Bernini-R,并同步放出了相关论文。

该框架集成了基于 MLLM 的语义规划器和基于 DiT 的渲染器,支持文生图、文生视频、多种视频编辑(含运动修改)、参考图引导编辑及内容插入等多种任务。

官方称其视频编辑能力在内部自建平台的盲测中已达到领先闭源商业模型的第一梯队。

模型权重采用 Apache 2.0 协议在 HuggingFace 发布,推荐使用打包了 Wan2.2 基础组件的 Diffusers 格式,并建议在 Hopper 架构 GPU 上运行以获得最佳性能。

相关链接:


Higgs Audio v3 TTS 发布 支持百种语言与声音克隆 #5

Boson AI 近日发布 Higgs Audio v3 TTS 模型,专为 Voice Agent 实时对话场景设计。官方称该模型在 100 种语言上达到个位数错字率,支持零样本声音克隆与细粒度语音控制,目前已开放非商用权重与 API

Boson AI 发布了 Higgs Audio v3 TTS 模型,旨在将文本直接转化为带有自然节奏和情绪的对话语音。

该模型支持 100 种语言的零样本声音克隆,并允许开发者通过内联标签实时控制情绪、语速及咳嗽或笑声等音效。

根据官方基准数据,其在多语种测试集上的错字率降至个位数,并在多款同类模型的对比中取得最优表现。

模型权重已基于非商用许可证在 Hugging Face 开放,同时官方提供 Boson API

相关链接:


Google Magenta 发布实时音乐生成模型 Magenta RealTime 2 #6

Google Magenta 团队发布了实时音乐生成模型 Magenta RealTime 2 及其配套的 C++ 推理引擎。该模型提供 24 亿2.3 亿 两种参数规格,支持通过 MIDI、音频和文本提示进行控制,目前仅限搭载 Apple Silicon 芯片的 Mac 在本地运行。

Google Magenta 团队正式推出了专为交互式音乐创作设计的实时生成模型 Magenta RealTime 2 (MRT2) 及其底层推理引擎。

该模型包含 24 亿 参数的基础版和 2.3 亿 参数的小配置版,能够响应 MIDI 输入、音频示例和文本提示,实现连续的低延迟音频流生成。

相较于上一代版本,MRT2 将控制延迟从约 3 秒 大幅缩减至约 200 毫秒,并通过基于 MLX 框架的 C++ 引擎实现了在 Apple Silicon 芯片上的本地化运行。

其中基础版实时生成需 M3 ProM2 Max 及以上配置,而小模型则可支持几乎所有的 Apple Silicon Mac 设备。

相关链接:


NVIDIA 发布 Nemotron 3.5 Content Safety 模型与配套数据集 #7

NVIDIA 近日发布 Nemotron 3.5 Content Safety 模型。该模型基于 Gemma 3 4B,能在单次推理中完成多模态多语言内容审查。

NVIDIA 日前正式发布 Nemotron 3.5 Content Safety 模型及配套的多模态安全数据集。

该模型基于 Google Gemma 3 4B IT 架构微调,能在单一上下文窗口内结合用户提示词、图像及助手回复进行统一的安全审查。

新增了自然语言自定义策略执行及可输出逐步推理痕迹的 THINK Mode

模型及数据集已基于 NVIDIA Open Model LicenseHugging Face 开放,并提供 NVIDIA NIM 及多种第三方平台部署选项。

相关链接:


香港生成式人工智能研发中心推出 HKGAI V3 大模型 #8

香港生成式人工智能研发中心正式发布 HKGAI V3 大模型。该模型已升级具备智能体能力,基于本地数据训练,支持两文三语及香港本地化应用场景。

香港生成式人工智能研发中心(HKGAI) 正式发布 HKGAI V3 大模型。

相较于去年推出的本港首个本地训练大语言模型 V1V3 版本现已升级具备智能体能力。

该模型以本地数据训练为基础,支持处理两文三语,能够深刻掌握香港独有的语境与文化,灵活处理多元化的本地应用场景。

香港特区政府官员在发布会上表示将成立相关委员会以完善 AI 生态圈。

HKGAI 后续也将发布 AI 生态合作机制,推动该模型在 “港文通” 等垂直场景的落地。

相关链接:


Codex 推出 iOS 测试插件并修复 Token 计数 Bug #9

OpenAI 为 Codex 推出 Build iOS Apps 插件,支持在应用内浏览器中查看、测试 iOS 应用。同时 Codex 负责人称正修复导致少统计部分 ProPlus 账户 TokenCodex Bug

OpenAI Developers 正式发布 CodexBuild iOS Apps 插件,支持在内置浏览器中直接查看、测试 iOS 应用及进行 SwiftUI 热重载。

据开发者解析,该功能通过串流真实 iOS 模拟器画面并读取原生 Accessibility 信息来实现视觉与交互操作。

同日,OpenAI 员工 Tibo 证实团队正在修复一个导致不到 15%ProPlus 账户 Token 被少统计的 Bug。

相关链接:


Claude Code 以 "ultracode" 作为触发词替换 "workflow" #10

为解决原触发词易被误触的问题,Claude 宣布将 Claude Code 动态工作流的显式触发词由 "workflow" 更改为 "ultracode"

ClaudeDevs 宣布对其 Claude Code 研究预览版中的动态工作流功能进行调整,将显式触发词从 "workflow" 更改为 "ultracode"

该动态工作流功能允许 Claude 即时编写编排脚本,并并行启动大量协调的子 Agent 来处理复杂任务。

相关链接:


Antigravity 向所有付费用户开放 /teamwork-preview #11

Antigravity 宣布为所有付费用户开放功能 /teamwork-preview,该功能可调度多达上百个Agent,并行实施与验证以完成复杂开发项目。

Google Antigravity 官方宣布,现已将 /teamwork-preview 命令的研究预览从原先仅限每月200美元Google AI Ultra 计划扩展至所有付费计划。

该功能可在 Antigravity 2.0 客户端中调用,利用多个分工明确的子 Agent 组成异步团队并行工作。

官方团队使用它通过单条提示成功从零构建了可运行 Doom 的操作系统,并复现了 AlphaZero 的轻量可玩版本。

官方强烈建议使用 Gemini 3.5 Flash 模型以控制成本,并警告即便在较高配额计划下,单次任务也可能迅速用尽每周令牌额度。

用户需提前购买额外 AI 积分,中断后可补购积分后继续。

相关链接:


GitHub Copilot 上线百万级上下文与可配置推理级别 #12

GitHub Copilot 宣布现已正式在 VS Code 等客户端中上线 100 万token 的上下文窗口与可配置推理级别。

GitHub 官方宣布为 GitHub Copilot 推出 100 万 token 上下文窗口及可配置推理级别。

这两项新能力旨在帮助开发者处理更复杂的跨文件项目与架构调试难题。

目前已正式在 VS CodeCopilot CLIGitHub Copilot App 中上线。

官方提醒,提升上下文窗口大小或推理级别会增加每次交互的 AI 额度 消耗。

建议仅在处理复杂任务时按需启用。

相关链接:


HeyGen 推出视频与动态图形规范 frame.md #13

HeyGen 宣布推出专为视频与动态图形设计打造的规范文件 “frame.md”,用于指导 Agent 制作品牌视频。用户可将现有的 design.md 转换为该规范,从而保持品牌跨屏幕的视觉统一。

HeyGen 官方宣布推出名为 frame.md 的全新规范文件,主要服务于视频与动态图形设计领域。

官方指出,过去 Agent 在处理视频时常将其错误转换回网页或幻灯片,而 frame.md 的核心作用是指导 Agent 按照特定规范生成保持品牌一致性的视频。

用户只需上传现有的 design.md 文件,即可将其转换为 frame.md 格式。

HeyGen 强调,为 Agent 提供正确的指令是提升其工作速度并避免无意义迭代的关键前提。

相关链接:


OpenAI 在 Responses 与 Completions API 中内建审核分数返回 #14

OpenAI 宣布,API 现支持在生成请求中直接返回审核分数,开发者可据此进行内容路由或拦截,无需额外调用

OpenAI 近日通过官方开发者账号宣布,其 Responses APICompletions API 现已内建审核分数返回能力。

开发者在调用生成接口时,只需在请求中加入 moderation 对象即可同时获得输入与输出内容的安全评分。

无需再单独请求 审核端点

返回的结果包含是否标记为有害、具体类别及置信度分数。

该结果可用于日志记录内容路由人工审核直接拦截

相关链接:


NotebookLM 推出 Source Attribution 功能 #15

NotebookLM 官方宣布推出 Source Attribution 功能。该功能允许用户查看生成每个产物所用的确切提示词与来源,并支持自定义调整。

NotebookLM 官方宣布正式上线新功能 Source Attribution

该功能向用户公开了生成特定产物的确切公式,其中包含所使用的 提示词 与具体的资料来源。

若用户需要对结果进行修改,可直接点击提供的 Iterate 选项进行自定义迭代。

相关链接:


LM Studio 推出 iOS 移动应用 Locally #16

LM Studio 正式推出 iOS 移动应用 Locally,允许 iPhoneiPad 用户通过 LM Link 功能,经由端到端加密连接远程桌面端调用本地大模型。

LM Studio 官方宣布,此前收购的 Locally 应用现已成为其官方移动端应用,并正式为 iPhoneiPad 推出 LM Link 功能。

该功能允许用户通过端到端加密的安全连接,在移动设备上远程访问并运行部署在家庭或工作电脑上的本地大模型,且所有聊天记录均保存在本地设备。

用户目前可在 App Store 下载 Locally 应用并与运行中的 LM Studio 桌面端配对使用。

但该移动应用及相关功能目前仅限于 iOS 平台。

相关链接:


Anthropic 发文介绍基于 Claude 的自助式数据分析架构 #17

Anthropic 官方博客发文介绍了其内部基于 Claude 构建的自助式商业分析系统架构,通过引入由人类掌握语义定义且与代码同库维护的 Skills 等多层机制,其总体准确率约达 95%

Anthropic 官方发文详述了其内部利用 Claude 实现自助式商业分析自动化的 Agentic 数据栈。

官方称,该架构通过四个层级来解决概念歧义、数据陈旧和检索失败三大问题。

目前已将 95% 的分析查询自动化,总体准确率约达 95%

该架构要求语义层定义必须由人类主导。

并将 Skills 文件与模型代码同库维护以实现自动化同步与验证。

相关链接:


李飞飞团队发文厘清世界模型定义 #18

李飞飞发文厘清世界模型概念,将其明确划分为渲染器仿真器规划器。作为核心桥梁,仿真器能输出物理状态。文章指出,这三者底层知识同源,未来将走向大一统的 “世界基础模型”

李飞飞World Labs 团队发文,基于强化学习的 POMDP 框架澄清“世界模型”这一被滥用的术语。

团队将该技术划分为输出视觉像素的渲染器、输出物理环境状态的仿真器,以及输出动作指令的规划器三大功能类别。

其中受关注度最低的仿真器被视为衔接渲染与规划的核心桥梁,其首款相关产品 Marble 已实现同时输出视觉与物理网格数据。

文章指出,由于三类模型共享底层世界知识,其技术边界正不断消融,未来将融合为可根据需求灵活切换输出形式的大一统世界基础模型。

相关链接:


Guide Labs发布Clarity:首个内建可解释性AI平台开放研究预览 #19

Guide Labs 推出 Clarity 平台,官方称其为全球首个内在可解释的AI平台,目前已以邀请制研究预览形式开放,能让用户追溯AI模型输出背后的概念和训练数据,并在对话中实时操控调整回答。

Guide Labs正式发布Clarity,该平台由其Steerling 8B模型驱动,据称是首个将可解释性内建于训练过程的AI系统,旨在解决现有模型黑箱、无法追溯输出与训练数据关联的问题。

Clarity提供三大核心功能。一是概念解释,即展示模型生成文本时所依据的人类可理解概念。

二是训练数据归因,可链接到训练集中最相似的语料片段。

三是概念操控,用户无需修改提示词,仅需通过放大或抑制特定概念即可实时改变模型回答。

目前Clarity仍处于仅限邀请的研究预览阶段。Guide Labs正与特定领域企业合作开发定制化可解释AI方案,并计划在未来数月推出输入归因等新能力。

相关链接:


Arena.ai 推出 Agent Mode 及真实任务评估排行榜 #20

Arena.ai 官方推出 Agent Mode,支持模型调用沙盒等工具自主执行多步任务,并同步上线基于真实用户反馈的 Agent Arena 排行榜。

Arena.ai 宣布上线 Agent Mode,将原有的单一聊天升级为可自主规划并执行复杂任务的多步工作流。

该模式为模型配备了网页搜索、bash 沙盒及文件系统等工具,使其能独立完成建站、研究及代码调试等任务。

官方统计其中编码任务占比达 29%

同步推出的 Agent Arena 排行榜基于超过 30 万个真实用户任务信号进行排名,目前 OpenAIGPT-5.5 (High) 位列第一。

用户现已可通过官网下拉菜单或指定网址直接访问该模式。

相关链接:


VoidZero 加入 Cloudflare,核心项目维持开源 #21

VoidZero 官方宣布加入 Cloudflare,旗下 ViteVitestRolldown 等核心开源项目将继续保持 MIT 许可,并由原团队继续主导开发。

VoidZero 官方宣布加入 Cloudflare,旗下 ViteVitestRolldownOxcVite+ 等核心项目将继续保持开源并遵循 MIT 许可证。

EvanVoidZero 团队将继续领导这些项目的开发,Cloudflare 承诺支持其开源使命。

由于开源工具商业化面临挑战,且双方此前在 Vite 技术及部署平台上已有协同,此次加入旨在让团队专注工具研发,并共同应对 AI Agent 带来的开发范式变化。

相关链接:


Google 宣布向犹他州所有 K-12 学校提供 Gemini for Education #22

Google 宣布与犹他州教育局达成合作,计划从 2026-2027 学年起,面向该州所有 K-12 学校免费提供 Gemini for Education

Google 宣布与犹他州教育局 (USBE) 建立合作,计划从 2026-2027 学年起,为犹他州所有 K-12 学校提供 Gemini for Education

此举将向全州超过 70.8 万名师生免费提供具备企业级安全保护的 AI 工具、专业培训以及 Google Career Certificates

在实际应用中,Gemini 可辅助教师生成定制化教学材料并总结课堂讨论,同时帮助学生探索复杂概念并获得个性化解释。

且官方承诺相关对话数据不会被用于训练 AI 模型。

相关链接:


TRAE 即将上线四档付费“速通”权益 #23

TRAE即将上线四档付费“速通”权益,用于提升高峰时段的对话响应速度。四档月费从99元1399元,提供100次到不限次的速通次数与云端任务并行上限,高档位支持优先体验SOTA模型。购买后权益与账号绑定,支持多端通用。原免费版继续保留,老版用户权益将自动平移。

TRAE 官方宣布即将推出全新的付费“速通”权益体系,包含 速通 Pro速通 Pro+速通 Ultra优速通 Express 四档。

该增值服务旨在提升用户在高峰时段的对话响应速度,支持按月计费,购买后权益与账号绑定,可在 TRAE IDE 及多个版本的 TRAE SOLO 中通用。

四档月费从 99元1399元 不等,对应每月 100次 到不限次的速通次数,以及 10个20个 云端任务并行数量上限,部分高档位还提供 SOTA模型 优先体验。

现有免费版核心功能不受影响,原“优速通”用户权益将自动平移至新版 Express 档位,系统暂不支持在生效周期内进行降级。

相关链接:


消息称 Anthropic 即将发布 Mythos 级别模型代号 Oceanus #24

据多个社交平台消息人士透露,Anthropic 正准备公开发布代号为 OceanusMythos 级新模型。该模型的检查点已面向部分红队人员开放测试。

据科技博主和测试账号在社交平台透露,Anthropic 正在筹备发布代号为 OceanusMythos 新模型,其内部检查点被标识为 claude-oceanus-v1-p

据称该模型的性能将超越现有的 Mythos Preview 版本,且已有红队测试员获得了访问权限。

不过消息指出,由于有人疑似通过 API 代理转售访问权限,相关的红队测试已被暂停。

相关链接:


提示:内容由AI辅助创作,可能存在幻觉错误