端侧AI的胜负正在转向可托管执行层

核心观点

本周端侧 AI、机器人、Agent 和模型部署的共同变化,不是单点算力继续抬高,而是“执行层”开始被产品化:机器人要有参考设计和确定性控制,Agent 要有沙箱、工作区、上下文 API 和调度能力,本地设备要能承接一部分持续运行任务。一个可辩论的判断是,未来 1 到 2 个季度,端侧 AI 平台的竞争会从“能跑什么模型”转向“能否托管可恢复、可审计、可调度的执行过程”。另一个反共识判断是,国产中阶 AIoT SoC 的窗口不一定被高端机器人主控压缩,反而可能在低功耗、长生命周期、多媒体感知和场景化 Agent 入口中获得更确定的量产位置。后续验证指标是:Jetson/Dragonwing/Windows AI PC/瑞芯微平台是否披露真实客户部署、运行时策略、模型适配清单、任务恢复机制和批量出货节奏。

本期主线

过去一周最值得连起来看的,不是某一家厂商又发布了更高 TOPS 的硬件,而是多条产业线同时在把“AI 能力”包成可托管的执行系统。NVIDIA 在 JetPack 7.2、NemoClaw、Physical AI Skills 和 Isaac GR00T Reference Humanoid Robot 上把开发、仿真、训练、评测、部署和 Jetson 端运行串成 Agent 可调用流程;Qualcomm 用 Dragonwing IQ10 Robotics Reference Design 把算力、传感器、控制接口、散热和软件栈打包成机器人参考设计;Microsoft 和 GitHub 则把企业上下文、本地模型、Cloud PC、终端调度和语音输入变成 Agent 执行环境的一部分。

这条主线对端侧厂商很关键。瑞芯微、星宸科技、全志、地平线、黑芝麻、爱芯元智、联发科、高通、Intel 和 NVIDIA Jetson 未来面对的客户问题,不会停留在“板子上能跑几帧、几个 token”。机器人客户会问传感器时间同步、实时控制和现场维护;企业 Agent 客户会问权限、沙箱、日志、成本和跨设备恢复;AIoT 客户会问多媒体、低功耗和长期供货。谁能把这些问题压进稳定的执行层,谁才更接近量产订单。

重点进展

JetPack 7.2 把 Jetson 从推理板卡推向物理 Agent 节点

  • 事实:NVIDIA 于 2026 年 6 月 1 日介绍 JetPack 7.2 和 NemoClaw 对 Jetson 的支持。官方披露,JetPack 7.2 带来 agentic AI skills、Yocto 项目支持、Jetson Orin 上的 CUDA 13、Jetson Thor 上的 MIG 支持和实时内核;Jetson AGX Orin 32GB 的 AI 算力提升到 241 TOPS。NVIDIA 还称 Jetson agent skills 覆盖 Linux 定制、内存优化、模型 benchmarking 等开发任务,NemoClaw 可用单命令部署到 Jetson。
  • 我的判断:这次更新的重点不是 Jetson 又多支持一个模型,而是 NVIDIA 在把边缘设备变成“可被 Agent 管理的生产节点”。Yocto、实时内核、MIG、内存优化和 benchmarking 都是量产客户更在意的工程细节,说明物理 AI 的瓶颈正在从演示算法转向现场可维护性。
  • 产业影响:Jetson 会继续占据高端机器人、工业视觉和医疗设备的参考上限,同时也会给国产 SoC 厂商施压:客户会要求 SDK 不只提供模型转换,还要提供系统裁剪、资源隔离、模型压测和部署自动化。
  • 后续观察:关注 JetPack 7.2 是否在 Solomon、工业检测、医疗机器人和农业机械等部署中披露可复现案例;同时看 Jetson Thor 的 MIG 与实时内核是否被机器人厂商用于隔离感知、规划和安全任务。
  • 来源:NVIDIA Blog

Isaac GR00T 参考人形把机器人开发从拼装推向基准平台

  • 事实:NVIDIA 于 2026 年 6 月 1 日宣布 Isaac GR00T Reference Humanoid Robot。该参考设计基于 Isaac GR00T 平台,组合 Unitree H2 Plus 人形本体、Sharpa 五指灵巧手、Jetson Thor onboard compute 和 Isaac GR00T 开放软件与模型;Ai2、ETH Zurich、Stanford Robotics Center、UC San Diego 等研究机构将使用该参考设计。官方称该平台预计 2026 年晚些时候由 Unitree 提供,Unitree G1 的 GR00T 参考工作流也预计很快在 GitHub 和 Hugging Face 上提供。
  • 我的判断:这条动态容易被理解为 NVIDIA 给高校做了一个机器人套件,但真正重要的是“参考本体 + 参考手 + 参考算力 + 参考软件 + 参考工作流”的组合正在出现。机器人基础模型如果没有可共享硬件和评测管线,很难从视频演示进入可比较的工程进步。
  • 产业影响:这会强化 Jetson Thor 在高端人形研究和开发者生态中的默认位置,也会把国产机器人本体厂商推向两种选择:要么接入类似 GR00T/LeRobot/Hugging Face 的开放工作流,要么建立自己的数据、仿真和评测闭环。
  • 后续观察:关注 Unitree G1 工作流是否如期开放、参考机器人价格和供货周期是否可接受,以及研究机构是否发布跨本体迁移、少样本微调和真机任务成功率数据。
  • 来源:NVIDIA via GlobeNewswire

Qualcomm Dragonwing IQ10 RRD 把机器人主控做成部署型整机模块

  • 事实:Qualcomm 于 2026 年 6 月 1 日介绍 Dragonwing IQ10 Robotics Reference Design,称其面向 Computex 2026 展示,并由 NEURA Robotics、Advantech、APLUX、Booster、Innodisk、MeiG、NEXCOM、Radxa、Thundercomm、VinMotion 等生态伙伴支持。官方披露该参考设计最高 700 TOPS AI 性能,集成 18 个 Qualcomm Oryon CPU cores、多核 NPU、GPU,原生支持最多 12 路 GMSL2 摄像头、LiDAR、ToF、IMU 等传感器,并支持 PCIe、TSN、USB、CAN、EtherCAT、CAN-FD 等确定性控制接口,工作温度范围为 -40 到 70 摄氏度。
  • 我的判断:Dragonwing IQ10 RRD 的产业意义不在“TOPS 追上高端平台”,而在于 Qualcomm 正在把机器人主控从芯片销售推进到可部署系统销售。12 路摄像头、实时 I/O、散热、电源和软件生命周期管理,比单颗 NPU 参数更接近机器人 OEM 的真实痛点。
  • 产业影响:NVIDIA 与 Qualcomm 的路线会共同改变机器人上游采购标准:主控平台必须同时回答传感器接入、运动控制、模型部署、MLOps、热设计和供应链问题。地平线、黑芝麻、瑞芯微、爱芯元智、Intel 等若要扩大机器人份额,也需要拿出类似完整的参考架构,而不是只给出开发板。
  • 后续观察:关注 2026 年 9 月全球可用性是否兑现,早期伙伴是否推出真实机器人产品,以及 700 TOPS 在持续功耗、热限制和多传感器并发下的有效性能。
  • 来源:Qualcomm OnQ Blog

Windows 把本地 Agent 从辅助推理推进到可治理执行环境

  • 事实:Microsoft 于 2026 年 6 月 2 日在 Windows Developer Blog 披露 Build 2026 更新:Windows 365 for Agents 在 Agent 365 内 GA,可为 AI agents 提供 Cloud PCs 执行多步企业工作流;Aion 1.0 Instruct 和 Aion 1.0 Plan 进入预览,其中 Aion 1.0 Plan 是 14B 参数、32K 上下文的本地 reasoning 与 tool-calling 模型,可在支持设备上随 Windows 提供;GitHub Copilot CLI 还将支持 /fleet,由云端主 Agent 制定计划,再按任务复杂度把一部分子任务路由给本地模型。
  • 我的判断:这是 AI PC 叙事中更值得重视的一面。本地模型不是只用来省 token 或做摘要,而是要成为混合 Agent 执行系统里的受控算力层:简单、隐私敏感、低延迟、持续运行的子任务在本地跑,高复杂任务再交给云端。
  • 产业影响:这会直接影响 Intel、AMD、NVIDIA、Qualcomm 和联发科等 PC/边缘平台的竞争指标。未来企业采购 AI PC 时,可能会关心本地 Agent 能否接入 Intune、Entra、Defender、Purview、MXC 和 Windows AI APIs,而不只是 NPU TOPS。
  • 后续观察:关注 Aion 1.0 Plan 的设备门槛、实际延迟、工具调用成功率和是否支持第三方 Agent;同时看 /fleet 是否在 GitHub Copilot CLI 中形成可观测的云端/本地任务分配策略。
  • 来源:Windows Developer Blog

Work IQ APIs 把企业数据层改造成 Agent 的上下文底座

  • 事实:Microsoft 于 2026 年 6 月 2 日宣布 Work IQ APIs 将于 2026 年 6 月 16 日 GA。官方称 Work IQ 会连续处理邮件、日历、会议、聊天、文件、人员、协作模式和业务系统信号,形成对组织运行方式的语义理解;Work IQ APIs 包括 Chat、Context、Tools、Workspaces 四个域。Microsoft 还披露,Work IQ APIs 把工具调用压缩为 10 个通用工具,并通过 MCP progressive disclosure 减少工具面;Workspaces 可在 Microsoft 365 tenant 边界内保存 Agent 执行中的数据、文件、记忆、进度和中间输出。
  • 我的判断:这条动态说明企业 Agent 的核心资源正在从“模型能力”转向“可治理上下文”。当 Agent 高频、连续、多步骤地访问企业数据时,传统为人类界面设计的 API 会显得过碎、过慢、过难审计,企业会更愿意购买面向 Agent 重构过的上下文层。
  • 产业影响:这会倒逼国内云厂商、办公软件、知识库和企业 IM 厂商把数据接口从搜索 API 升级为 Agent-ready context API。对端侧设备而言,本地 Agent 若要进入企业工作流,也必须能与这类上下文底座同步权限、状态和审计结果。
  • 后续观察:关注 6 月 16 日 GA 后 Work IQ APIs 的客户采用、Copilot Credits 成本曲线、10 个通用工具是否足够覆盖真实业务动作,以及国内企业软件是否跟进类似的上下文工作区。
  • 来源:Microsoft 365 Blog

Copilot CLI 调度能力说明 Agent 正在进入“持续任务”形态

  • 事实:GitHub 于 2026 年 6 月 2 日更新 Copilot CLI,rubber duck 和语音输入 GA,prompt scheduling 和新的实验性终端界面可在 /experimental 中试用;6 月 3 日编辑注说明 prompt scheduling 属于 /experimental,不是 GA。新增 /every/after 命令,可在当前 CLI session 中定期或延后运行 prompt 或 skill;语音输入本地运行,首次启用时会下载运行时并选择语音转文本模型。
  • 我的判断:调度命令看似是小功能,但它把 Agent 从“一问一答”推进到“持续检查、持续运行、持续提醒”的形态。只要 Agent 能定时跑测试、看 token、查 issue、生成文档或巡检日志,它就开始接近轻量自动化系统,而不仅是交互式助手。
  • 产业影响:持续任务会增加端侧和工作站侧的价值,因为企业不可能把所有低价值、长时间、隐私敏感的轮询任务都放在昂贵云端模型上。AI PC、开发机和边缘服务器会成为这类低频但持续的 Agent worker。
  • 后续观察:关注 prompt scheduling 是否从 session 内实验能力升级为持久任务管理,是否支持权限、失败重试、日志和团队共享;同时看本地语音输入是否成为端侧 Agent 的低延迟入口。
  • 来源:GitHub Changelog

瑞芯微 RK3572 提供了国内端侧平台的另一种量产逻辑

  • 事实:瑞芯微于 2026 年 5 月 8 日发布 RK3572,定位面向中阶 AIoT 市场的八核处理器。官方披露该芯片采用 8nm 制程,集成双核 Cortex-A73 与六核 Cortex-A53,内置 4TOPS NPU,集成 Mali-G310 GPU 并支持 Vulkan 1.4;支持双屏异显,最高 4K@60fps + 2K@60fps,支持 4K 视频编解码、最高 8K 视频解码、5 路摄像头输入和 12M ISP。瑞芯微称 RK3572 相比上一代中阶平台性能提升超过 100%,典型场景功耗降低 50% 以上。
  • 我的判断:RK3572 不会和 Jetson Thor、Dragonwing IQ10 在高端人形主控上正面竞争,但它代表了更大体量的端侧 AI 现实:大量设备需要的是多媒体、低功耗、摄像头输入、ISP、显示、Vulkan 和低成本 NPU 的组合,而不是最高峰值算力。
  • 产业影响:如果 Agent 和多模态能力继续下沉,RK3572 这类平台可能在 POS、教育办公、智能家居中控、轻量视觉盒子和消费级机器人中先跑出规模。对全志、星宸科技、爱芯元智等国内厂商也是同样逻辑:能否把小模型、VLM 前处理、语音、视频和设备控制做成稳定方案,比追逐参数发布更重要。
  • 后续观察:关注 RK3572 的开发板、模组、RKNN/多模态模型适配、客户设计导入和真实出货;同时看其 4TOPS NPU 是否能支撑本地小语言模型、语音交互和视觉检测的组合式任务。
  • 来源:瑞芯微

反共识观察

第一,端侧 AI 的下一轮门槛可能不是更高算力,而是“可托管执行层”。NVIDIA、Qualcomm、Microsoft、GitHub 的本周信号共同指向一件事:客户并不只想要模型输出,而是要一个能被隔离、调度、恢复、审计、压测、计费和现场维护的执行过程。这个判断可以被验证:如果未来 1 到 2 个季度厂商发布会里更多出现 Yocto、MIG、实时内核、MXC、Cloud PC、Workspaces、MLOps、DevOps、prompt scheduling、模型 benchmarking 和 fleet routing,而不只是 TOPS 与参数量,说明产业焦点已经从“跑模型”转向“管执行”。

第二,高端机器人平台的繁荣不一定挤压中阶 AIoT SoC,反而可能给它们打开更多下沉场景。Jetson Thor 和 Dragonwing IQ10 会定义高端机器人与开发者平台的上限,但真正大规模铺开的智能硬件、工业视觉、低速机器人、家居中控和轻量 Agent 节点,仍需要便宜、低功耗、多媒体能力强、供货周期长的 SoC。这个判断同样可验证:看未来 4 周是否有更多端侧厂商披露小模型/VLM/语音组合方案、开发板量产、客户导入和 SDK 适配,而不是只跟随高端人形机器人叙事。

观察清单

  • JetPack 7.2 的 Yocto、CUDA 13、MIG、实时内核和 agent skills 是否进入机器人、工业视觉、医疗设备客户的量产文档。
  • Isaac GR00T Reference Humanoid Robot 是否按计划在 2026 年晚些时候由 Unitree 供货,Unitree G1 工作流是否开放并产生第三方复现。
  • Qualcomm Dragonwing IQ10 RRD 的全球可用性、生态伙伴产品和持续功耗数据是否在 2026 年 9 月前后披露。
  • Windows Aion 1.0 Plan、MXC、Windows 365 for Agents 和 /fleet 是否形成可审计的本地/云端 Agent 分工。
  • Work IQ APIs 在 6 月 16 日 GA 后是否出现真实客户案例、价格反馈和 10 个工具的覆盖边界。
  • Copilot CLI prompt scheduling 是否从 session 内实验能力升级为持久任务、团队任务或企业策略管理。
  • 瑞芯微 RK3572 是否出现模组、开发板、RKNN 模型清单和 AIoT 客户导入,星宸、全志、爱芯元智是否跟进类似低功耗多模态方案。

评论