AI 领域日报|2026 年 6 月 2 日:Microsoft Build 2026 开幕、Nvidia Vera CPU 量产、Mellum2 开源

AI 领域日报|2026 年 6 月 2 日:Microsoft Build 2026 开幕、Nvidia Vera CPU 量产、Mellum2 开源

Microsoft Build 2026 在旧金山开幕,发布 MAI Voice 2 / Image 2.5 / Transcribe 1.5 三款新模型,Windows AI 智能体化进入内核层;Nvidia GTC 台北宣布 Vera CPU 专为智能体设计量产(比 x86 快 80%)、RTX Spark 联合微软推出 Surface Laptop Ultra;JetBrains Mellum2(12B MoE)以 Apache 2.0 开源;xAI Grok Build 0.1 进入公测(256K token、原生工具调用);百度李彦宏提出 DAA(日活智能体数)新度量衡;NSA + Cyber Command 成立 AI 联合任务组。

AI 领域日报
2026/6/2 · 8:08
3 订阅 · 3 内容

AI 领域日报|2026 年 6 月 2 日:Microsoft Build 2026 开幕发布三款 MAI 新模型、Nvidia GTC 台北宣布 Vera CPU 专为智能体打造、JetBrains Mellum2 开源

今日重点:Microsoft Build 2026 在旧金山开幕,同步发布 MAI Voice 2 / Image 2.5 / Transcribe 1.5 三款新模型;Nvidia GTC 2026 台北站黄仁勋宣布 Vera CPU 量产(比 x86 快 80%)、RTX Spark 超芯片联合微软发布 Surface Laptop Ultra;JetBrains 将 Mellum2(12B MoE)以 Apache 2.0 开源;xAI Grok Build 0.1 进入公测(256K token、原生工具调用);百度 Create2026 上李彦宏提出 DAA(日活智能体数)作为智能体时代新度量衡。

大模型动态

Nvidia GTC 2026 台北:Vera CPU 量产,为智能体重写服务器架构

6 月 1 日,黄仁勋在台北 GTC 2026 发表主旨演讲,宣布 Nvidia 正式进入 CPU 市场。1
英伟达 GTC 2026 台北站演讲现场
黄仁勋在 GTC 2026 台北发表主旨演讲,宣布 Vera CPU 全面量产 1
Vera CPU 专为 AI 智能体工作负载设计,基于 Olympus 核心架构,10 条指令/周期的单线程 IPC 是 Nvidia 所称的全球最高水准;LPDDR5X 内存带宽 1.2 TB/s,是主流 x86 的 3 倍;峰值延迟比 x86 低 40%。实测 SQL 数据库处理提速 3 倍,纽约证券交易所实时流处理任务提速 6 倍,智能体沙箱性能比 x86 高 1.8 倍(Nvidia 公布)。Vera CPU 目前已与全球主流 ODM/服务器厂商合作量产。2
同场发布还有:
  • Vera Rubin 超算集群:Nvidia 史上最复杂机架级系统,集成 Rubin GPU(NVL72)、Vera CPU、BlueField-4 和全球首款 200Gb CPO 光学以太网,已全面量产。单机架组装时间从 2 小时压缩至 5 分钟。
  • Nemotron-3 Ultra 开源基础模型:全球首个 SSM(状态空间模型)与 MoE(混合专家模型)混合架构开放模型,Nvidia 称推理速度提升 5 倍、总成本降低 30%,全盘开源模型权重、训练脚本和工具调用数据集。
  • Isaac GR00T 人形机器人平台:由 Schaeffler 制造,25 个自由度灵巧手,全身 31 个自由度,Jetson Thor 芯片驱动,定向面向高校和科研机构。

JetBrains Mellum2 开源:MoE 架构,推理延迟降一半

JetBrains 于今日宣布将 Mellum2 以 Apache 2.0 许可证开源。3
Mellum2 采用 MoE(混合专家)架构:总参数 12B,每个 token 仅激活 2.5B 参数。专门训练于自然语言和代码数据,不做多模态扩展。JetBrains 发布的技术报告(arXiv)显示,同等规模模型对比中,Mellum2 推理时间低于竞品一半。主要定位:高频 AI 工作流中的路由、RAG 摘要、子智能体快速执行,以及离线/私有化部署场景。
Mellum2 LiveCodeBench 性能对比图
Mellum2 在 LiveCodeBench v6 代码基准上与同级别模型的对比 3

百度文心 5.1:预训练成本仅同规模 6%,登顶 LMArena 搜索榜国内第一

百度 5 月已在 Create2026 大会正式发布文心大模型 5.1。在精简参数规模的同时,文心 5.1 的预训练成本约为业界同规模模型的 6%,在 LMArena 搜索榜排名中国第一、全球第四(截至发布当日数据)。4
大会上,百度创始人李彦宏提出 DAA(Daily Active Agents,日活智能体数) 概念,认为这一指标比 Token 消耗更接近智能体时代的实际价值。他预测:「未来全球日活智能体数很容易会超过 100 亿」,而当前 Meta 的日活用户约 34 亿。百度美股当日开盘涨超 7%。

AI 工具与产品

Microsoft Build 2026 旧金山开幕,发布 MAI 系列三款新模型

6 月 2 日,微软 CEO Satya Nadella 在旧金山 Fort Mason 开幕 Build 2026,本届以 AI 智能体化 Windows 为核心叙事。56
Microsoft Build 2026 发布的 MAI 系列三款模型信息图
MAI-Voice-2(15 语言 TTS)、MAI-Image-2.5(图像生成第 3)、MAI-Transcribe-1.5(25 语言转录)三款模型同步亮相 Build 2026 7
同步发布 MAI(Microsoft AI)系列三款新模型:7
模型定位关键规格
MAI-Voice-2多语言 TTS支持 15 种语言(含中文),支持情感语音合成
MAI-Image-2.5图像生成与编辑文生图 + 图像编辑,AI 竞技场排名第 3
MAI-Transcribe-1.5语音转文本支持 25 种语言,Build 2026 当日发布
Build 2026 本届最大议题在于 Windows 智能体化路径:AI 智能体获得 Windows 内核级执行权限,OpenClaw 风格的桌面智能体将成为主流框架。另一个硬件侧标志是 Surface Laptop Ultra 发布:基于 Nvidia RTX Spark 超芯片,集成 20 核 Grace CPU + 6144 个 Blackwell RTX 核心,统一内存最高 128GB,重量低于 4.5 磅,今秋上市(定价未公布)。8
GitHub Copilot 亦同步推进从「代码补全」到「代理监督」的转型——Build 的一个 session 标题直接命名为「Agent supervision is the new senior engineering skill」。

xAI Grok Build 0.1 公测上线,首个原生智能体编码模型

xAI 于 6 月 1 日宣布 Grok Build 0.1 进入公测,通过 xAI API 直接调用。9
Grok Build 0.1 的三个设计特点区别于通用代码模型:256K token 上下文窗口、原生工具调用(无需额外封装)、支持并行子智能体。目标场景是嵌入 agent 框架和开发者工具链,而非单点代码补全。目前处于 public beta 阶段。

视频生成技术

Nvidia RTX Spark 推动端侧视频 AI:1 PetaFLOP 本地算力

Nvidia 此次 RTX Spark 超芯片的落地,对视频生成技术有直接影响。RTX Spark 提供 1 PetaFLOP 本地 AI 算力,搭载在 Surface Laptop Ultra 上后,可在本地运行中等规模的视频生成模型,不依赖云端 API。这是消费级硬件首次提供此量级的本地推理能力。10
Nvidia 在 GTC2026 台北站同步发布 Cosmos 3 开源前沿世界模型,融合自回归与扩散 Transformer 架构,可处理像素、动作、声音和语言,生成符合物理规律的合成视频,主要用途是为机器人训练提供虚拟数据,不是直接面向消费级视频创作。
本周(5 月底至 6 月初),xAI Grok Imagine 工程负责人 Ethan He 接受 Latent Space 播客采访,分享了 Grok Imagine 从零到 3 个月内推出的内部细节,并阐述「视频智能体模型」与「世界模型」的差异路径。11

AI 前沿与安全

NSA + 网络司令部成立 AI 联合任务组,研究前沿模型安全部署

据美国技术政策媒体 TechPolicy.Press 5 月报道汇总,美国国家安全局(NSA)与网络司令部(Cyber Command)已联合成立 AI 任务组,研究前沿 AI 模型在政府和安全关键任务场景下的安全加速部署路径。12
美国众议院国土安全委员会网络安全与基础设施保护小组委员会定于 6 月 4 日召开听证会,主题为「AI 安全格局:前沿模型、自主系统与关键基础设施的交汇」。13
这两个进展的背景是:上周曝光的五角大楼与 Anthropic 之间关于军事 AI「终止开关」的分歧,至今没有制度性解决方案。NSA/Cyber Command 的任务组和国会听证共同指向同一个问题:在政府尚无统一 AI 治理框架的情况下,前沿模型进入敏感应用场景的速度明显快于监管节奏。

今日摘要

6 月 2 日的 AI 行业有一条清晰的叙事主线:智能体化落地从概念变成了工程问题。Microsoft Build 2026 把「AI 智能体」写进 Windows 内核;Nvidia 的 Vera CPU 专门为智能体低延迟任务重设了服务器 CPU 的设计目标;百度用 DAA 指标把「有没有智能体在真正干活」提炼成可量化的竞争维度;xAI 的 Grok Build 0.1 把「代码智能体」作为独立产品形态推进 API 公测。
视频生成这一周没有榜单大变动,但 Nvidia 端侧 1 PetaFLOP 算力落地消费级硬件,是本地视频生成在硬件侧迈出的实质一步。
安全侧,NSA 和国会同周发力,时间节点与五角大楼/Anthropic 争议高度吻合——距 WWDC 2026(6 月 8 日)还有不到一周,Apple 的 AI 路线图将是下一个观察窗口。

围绕这条内容继续补充观点或上下文。

  • 登录后可发表评论。