AI 早报 2026-06-09

来源:AI HOT 日报 · 2026-06-09。内容由 AI HOT 编辑系统自动生成,本页同步归档并保留原始出处。

概览

今日事件 31 · 一手报道 21 · 新模型 4 · 信源 25

模型发布/更新

小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

来源:官方·X X:小米 MiMo (@XiaomiMiMo)

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 [email protected]

苹果发布第三代 Apple Foundation Models(AFM)

来源:学术机构 Apple Machine Learning Research(RSS)

苹果推出第三代 Apple Foundation Models(AFM)基础模型家族,与 Google 合作定制,包含五个模型,覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能,包括全新 Siri 和智能工具,以用户为中心深度融合操作系统,隐私为核心设计原则。

VoxCPM2 技术报告发布

来源:官方·X X:面壁智能 OpenBMB (@OpenBMB)

面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。

全球首个:高德发布3D原生城市世界模型ABot-Earth0.5

来源:综合资讯 IT之家(RSS)

阿里巴巴旗下高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已建成覆盖190多个国家和地区的3D地图。用户输入卫星图或文字描述,10分钟即可在消费级GPU上生成公里级3D城市,输出可编辑3DGS格式,可直接导入Unity等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测,可前往abot-earth.amap.com提交申请。

产品发布/更新

Runway Aleph 2.0 编辑模型:一键适配任意视频格式

来源:官方·X X:Runway (@runwayml)

一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。

Apple Core AI 框架

来源:综合资讯 Hacker News 热门(buzzing.cc 中文翻译)

一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接(developer.apple.com)。该帖子由 buzzing.cc 中文翻译,发布于 2026 年 6 月 8 日 02:47(UTC)。

Kimi Code 焕新升级(附视频教程)

来源:公众号·官方 公众号:月之暗面(Kimi)

Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。

微信AI官宣内测:两种接入模式供开发者选择

来源:综合资讯 IT之家(RSS)

微信开发者官方今日发布指引,确认微信AI正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信AI直接操作页面;开发模式下开发者可自主开发技能,审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。

Claude 为 Connector 开发者推出性能监控仪表盘

来源:官方 Claude:Blog(网页)

Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。

行业动态

OpenAI 向 SEC 机密提交 S-1 草案,上市时间未定

来源:官方 OpenAI:官网动态(RSS · 排除企业/客户案例)

OpenAI 近日向 SEC 机密提交了 S-1 草案(即首次公开募股注册声明),目前尚未决定上市时间。

奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全

来源:综合资讯 IT之家(RSS)

本周一,OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文,宣布公司进入第三发展阶段,目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发,第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线,呼吁成立国际机构应对 AI 风险,必要时可暂缓前沿模型研发。同日,OpenAI 秘密提交 IPO 申请,但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。

苹果 WWDC 2026 直播

来源:综合资讯 Hacker News 热门(buzzing.cc 中文翻译)

苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。

NVIDIA与LG集团合作建设AI工厂,加速物理AI与自动驾驶

来源:官方 NVIDIA AI Blog

NVIDIA与LG集团合作建设AI工厂,为LG的机器人、自动驾驶、数据中心和GPU云服务提供加速计算基础设施。双方整合NVIDIA AI工厂平台与LG的消费电子、机器人技术,连接AI模型开发、物理AI数据生成、机器人仿真训练、边缘部署和工厂数字孪生。LG电子将利用NVIDIA Isaac Sim和Isaac Lab仿真训练CLOiD家用机器人,探索采用Isaac GR00T模型,并开发物理AI数据工厂。LG Innotek提供针对NVIDIA GPU优化的机器人传感组件,LG CNS集成NVIDIA机器人技术。双方还将基于NVIDIA DSX平台建设下一代AI工厂,涵盖冷却、模块化设计和800V直流能源方案。LG电子将基于NVIDI…

受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线

来源:官方 Apple:Newsroom(RSS)

由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。

论文研究

为生物学AI智能体铺路

来源:官方 Anthropic:Research(发表成果 · 网页)

一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。

Perplexity与哈佛:AI智能体提效87%降本94%

来源:官方·X X:Perplexity (@perplexity_ai)

我们与哈佛大学发表新研究,关于从聊天界面转向像Computer这样的自主智能体的转变。 超过3个月的研究结果表明,使用Computer的工人在完成任务上比仅使用搜索快87%,成本低94%,且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work

腾讯混元联合多家机构发布首个音频编辑基准MMAE

来源:官方·X X:腾讯混元 (@TencentHunyuan)

腾讯混元联合上海交大、南洋理工等机构推出MMAE(Massive Multitask Audio Editing Benchmark),这是首个全面评估AI语音/音频编辑能力的基准。MMAE要求模型理解现有音频并按自然语言指令精确修改,而非简单生成。当前模型在该基准上的精确匹配率(EMR)低于5%,暴露了可靠音频编辑的短板。MMAE包含2000个真实场景高保真样本、17741条细粒度评估项,覆盖声音/音乐/语音及混合共7种模态、6种任务复杂度(基础修改到多跳推理及多轮编辑)、8种操作类型(局部到全局)。论文、代码、数据集和演示已公开。

技巧与观点

OpenAI计划到2028年由AI主导研究

来源:X·KOL X:Rohan Paul (@rohanpaul_ai)

Sam Altman关于OpenAI未来路径的新博客称,到2028年3月,其大量研究将由AI完成。 该路径主要有3个目标:构建自动AI研究员,利用它加速科学和生产,然后给每个人一个个人AGI,帮助处理工作、学习、编程、商业、健康文书和决策。

微软AI CEO:超级智能即将到来,但不会取代你的工作

来源:综合资讯 The Verge:AI(RSS)

微软AI CEO Mustafa Suleyman在Decoder访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法,认为消费者产品需要足够好才能克服公众对AI的负面情绪。

小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕

来源:X·KOL X:小互 (@xiaohu)

小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。

Hivemind推出面向AI编程智能体的持续学习功能,即日起开放

来源:X·KOL X:Kim (@kimmonismus)

Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。

邵猛开源 Brand to DESIGN.md 技能,提醒复刻易生新“AI Slop”

来源:X·KOL