2026-06-05

AI 早报 2026-06-05

来源：AI HOT 日报 · 2026-06-05。内容由 AI HOT 编辑系统自动生成，本页同步归档并保留原始出处。

模型发布/更新

Nemotron 3.5 Content Safety：面向全球企业AI的可定制多模态安全

来源：官方 Hugging Face：Blog（RSS）

Nemotron 3.5 Content Safety基于Gemma 3 4B IT，提供128K上下文窗口，支持用户提示、可选图像与助手响应的统一多模态安全评估。新增自定义策略执行，允许企业用自然语言定义专属安全规则；THINK模式可输出可审计的逐步推理痕迹。显式训练覆盖12种语言，并借助基座模型零样本泛化至约140种语言。输出提供低延迟二分类、带分类标签、THINK推理痕迹三种模式。安全分类遵循Aegis 2.0框架（13核心类别+10细分类别）。同步发布多模态、多语言安全数据集，可在8GB+ VRAM GPU上实时部署。

Nex-N2-Pro 发布：基于 Qwen3.5 的 397B MoE 推理模型，性能达 GPT-5.5 水平

来源：官方·X X：硅基流动 SiliconFlow (@SiliconFlowAI)

neolab 推出 Nex-N2-Pro，基于 Qwen3.5-397B-A17B，总参数 397B 的 MoE 推理模型，支持 262K 上下文与多模态（VLM），性能达到 GPT-5.5 和 Claude Opus 4.7 级别。模型可自动调节推理深度，减少 30-50% 思考 token 且无性能折损，在 Terminal Bench 2.1、GDPVal、SWE-Verified 上取得 SOTA。擅长智能体编码、深度搜索和工具使用，兼容 Claude Code、Cursor 等工具。硅基流动已提供 T+0 支持，前两周免费使用。

NVIDIA Nemotron 3 Ultra 为长时间运行的智能体带来更快、更高效的推理能力

来源：官方 NVIDIA Technical Blog（开发者技术博客 · RSS）

NVIDIA 发布 Nemotron 3 Ultra 模型，专为长时间运行的 AI 智能体设计。该模型能够在多轮对话中保持上下文、调用工具、调用子智能体，并高效处理复杂工作流。随着多智能体协作导致模型 token 数量快速增长，Nemotron 3 Ultra 通过优化推理流程显著提升速度并降低计算成本，使长期运行的智能体任务更加可行。

Contents

AI 早报 2026-06-05

模型发布/更新

Nemotron 3.5 Content Safety：面向全球企业AI的可定制多模态安全

Nex-N2-Pro 发布：基于 Qwen3.5 的 397B MoE 推理模型，性能达 GPT-5.5 水平

NVIDIA Nemotron 3 Ultra 为长时间运行的智能体带来更快、更高效的推理能力