AgenticAI算力下沉与RISC-V端侧推理提速
◷ 2026-05-24
📁 行业动态
👤 laumy
🔥 0 热度
💬 评论 今日要点
- Agentic AI 正在从云端聊天入口扩展到企业本地工作站、服务器和软件开发流程,带动低延迟推理、沙箱执行和私有化部署需求。
- 端侧 AI 的重点不再只是拍照增强和语音识别,手机 SoC 厂商开始把 Agent 引擎、系统级感知和跨应用执行能力纳入平台竞争。
- RISC-V 在高性能 IP 与向量化推理方向继续补齐短板,生态竞争点从“能运行”转向“能否高效承载 AI 算子和开发工具链”。
- 机器人公司开始把具身智能模型、轮式人形本体和低成本量产方案绑定,端侧推理和实时控制能力的重要性继续上升。
公司与产品动态
Dell 将 Agentic AI 方案扩展到桌面与数据中心
- 来源:Dell Technologies Newsroom
- 摘要:Dell 与 NVIDIA 发布面向企业 Agentic AI 的新一轮方案,覆盖桌面工作站、AI PC、本地服务器和数据中心基础设施。方案强调在企业边界内运行智能体工作负载,并结合 Dell Pro Max、PowerEdge 与 NVIDIA AI Enterprise 软件栈,为开发、客服、知识管理等场景提供可落地的本地推理路径。
- 影响判断:Agentic AI 的部署形态正在从“只调用云端模型”走向“本地 GPU 工作站和私有服务器协同”。这会放大企业对小型化 GPU 系统、模型压缩、RAG、权限隔离和推理编排的需求。
- 相关方向:
AI算力 Agent 企业AI 本地推理
联发科发布端侧 Agent 引擎布局
- 来源:MediaTek Dimensity Developer Conference
- 摘要:联发科在天玑开发者大会上展示端侧 Agent 能力,重点包括多模态感知、意图理解、跨应用执行和与终端系统能力的结合。其方向不是单独发布一个模型,而是把 Agent 能力嵌入手机 SoC、系统服务和应用生态。
- 影响判断:手机厂商和芯片平台正在把端侧 AI 从单次推理升级为连续任务执行。NPU、内存带宽、低功耗调度和应用权限机制会共同决定端侧 Agent 的体验上限。
- 相关方向:
端侧AI NPU Agent 手机SoC
OpenAI 推动 Codex 进入企业开发流程
- 来源:OpenAI
- 摘要:OpenAI 在企业开发者场景中继续推进 Codex,把代码理解、修改、测试和任务拆解封装为可在工程流程中运行的智能体。Codex 的产品形态体现出 AI 从问答式辅助走向可执行的软件工程任务流。
- 影响判断:代码 Agent 会制造大量短时、并发、低延迟的推理请求,并需要和代码仓库、测试沙箱、CI 系统连接。对底层算力平台而言,这类负载更看重任务调度、上下文管理和推理吞吐的综合效率。
- 相关方向:
Agent AI开发工具 推理基础设施
AI 芯片与算力架构
NVIDIA 推出面向 AI 工厂的 Vera CPU
- 来源:NVIDIA Newsroom
- 摘要:NVIDIA 披露 Vera CPU,用于支撑未来大规模 AI 工厂中的 GPU、CPU、网络和内存协同。该产品延续了 NVIDIA 将数据中心从单卡竞争推向整机柜、整集群架构竞争的路线。
- 影响判断:大模型训练和 Agentic AI 推理都在提高 CPU、GPU、网络、内存系统之间的耦合度。Vera 的价值不只是单个 CPU 核心性能,而是围绕 Blackwell、Rubin 等平台形成更完整的 AI 基础设施控制点。
- 相关方向:
AI芯片 数据中心 AI工厂 GPU集群
RISC-V 与开放指令集
SiFive 第三代 P550 与 P570 强化高性能 RISC-V IP
- 来源:SiFive
- 摘要:SiFive 发布第三代 Performance P550 与 P570 IP,面向高性能嵌入式、边缘计算和潜在的数据中心控制面场景。新一代 IP 继续强调 RISC-V 在性能、可扩展性和可定制化上的平台能力。
- 影响判断:RISC-V 若要进入更高算力层级,不能只依赖开源指令集叙事,还需要成熟 CPU IP、编译器、调试工具和软件生态共同支撑。P570 这类产品会推动 RISC-V 从 MCU/IoT 向边缘 AI 和通用计算延伸。
- 相关方向:
RISC-V CPU IP 边缘计算 开放指令集
- 来源:J-STAGE
- 摘要:浙江大学与合作研究者提出 FWHT-RVV,通过 RISC-V Vector Extension 加速大语言模型中常见的快速沃尔什-哈达玛变换相关计算。论文面向 Transformer 推理优化,关注量化和矩阵计算中的底层算子效率。
- 影响判断:RISC-V 在 AI 推理中的关键问题不是能否运行模型,而是常用算子能否被指令扩展、编译器和库高效利用。类似研究说明 RVV 有机会在端侧大模型和低功耗推理中承担更具体的优化角色。
- 相关方向:
RISC-V RVV 大模型推理 端侧AI
推理框架与软硬协同
vLLM 持续迭代大模型高吞吐推理能力
- 来源:vLLM GitHub Releases
- 摘要:vLLM 近期继续围绕大模型服务化推理迭代,重点方向包括吞吐优化、模型适配、并发调度和与主流 GPU 软件栈的兼容。开源推理框架正在成为模型厂商、云厂商和企业私有化部署之间的关键中间层。
- 影响判断:Agentic AI 会让推理负载更碎片化,单纯追求单请求速度不够,还需要高并发、多模型、多租户和长上下文管理能力。vLLM 这类框架的成熟度会直接影响 GPU 集群利用率和企业部署成本。
- 相关方向:
推理框架 GPU Agent 软硬协同
大模型与 Agent
Google DeepMind 推进 AI Co-Scientist 多智能体科研系统
- 来源:Google DeepMind
- 摘要:Google DeepMind 介绍 AI Co-Scientist,把多智能体协作、文献理解、假设生成和实验规划用于科研发现流程。该系统的重点不是单次问答,而是让多个智能体围绕复杂目标进行迭代推理。
- 影响判断:科研 Agent 对长上下文、检索、推理链和工具调用的依赖更高,会推动模型服务从“生成文本”走向“持续规划和验证”。这类负载会加重对上下文缓存、并行推理和可靠工具执行的需求。
- 相关方向:
Agent 大模型 科研AI 推理基础设施
Anthropic 收购 Stainless,强化 API 与 Agent 生态
- 来源:Anthropic
- 摘要:Anthropic 宣布收购 Stainless,后者专注于 API SDK 生成和开发者工具。Anthropic 表示 Stainless 团队将继续支持其现有客户,同时帮助 Anthropic 改善开发者体验和 API 生态。
- 影响判断:Agent 需要稳定调用外部工具和服务,API 描述、SDK、权限边界和错误处理会成为模型能力之外的基础设施。Anthropic 加强开发者工具链,说明大模型竞争正在延伸到 Agent 执行环境。
- 相关方向:
Agent 开发者工具 API生态
机器人与具身智能
艾利特发布轮式人形机器人 Centaur-G1
- 来源:Elite Robots
- 摘要:艾利特发布 Centaur-G1 轮式人形机器人,面向工业、商业和科研等场景,强调轮式底盘、双臂操作和可扩展的软件平台。该形态在移动效率、稳定性和成本之间做了不同于双足人形机器人的取舍。
- 影响判断:轮式人形机器人更容易优先进入仓储、巡检、服务和教学场景,落地速度可能快于复杂双足平台。其产业价值取决于本体成本、端侧感知推理、运动控制和任务规划软件能否形成闭环。
- 相关方向:
机器人 具身智能 端侧推理
智元机器人 WITA 模型进入生成式 AI 服务备案
- 来源:新京报
- 摘要:据新京报报道,智元机器人相关的 WITA 模型进入生成式人工智能服务备案名单。报道显示,具身智能公司正在把机器人本体、基础模型和面向服务的合规能力同步推进。
- 影响判断:机器人基础模型进入备案流程,意味着具身智能不再只是实验室演示,也开始面对真实产品和服务的合规要求。后续机器人公司需要同时解决模型能力、端侧部署、数据闭环和行业准入问题。
- 相关方向:
机器人 具身智能 大模型 政策合规
供应链与政策
台湾检方起诉涉嫌走私 NVIDIA AI 芯片的人员
- 来源:Associated Press
- 摘要:AP 报道称,台湾检方起诉多名涉嫌向中国大陆走私 NVIDIA AI 芯片的人员,案件涉及出口管制背景下的高端 AI 芯片流向问题。报道未显示 NVIDIA 参与相关行为。
- 影响判断:高端 AI 芯片供应链正在受到出口管制、合规审查和灰色流通风险的共同影响。对国内 AI 训练和推理部署而言,硬件可获得性、国产替代和云端算力调度都会继续受到政策变量影响。
- 相关方向:
供应链 AI芯片 出口管制 算力
今日观察
- Agentic AI 正在把算力需求从集中式云服务推向企业本地、开发者工作流和终端设备,未来的竞争会更多落在“模型 + 推理框架 + 权限系统 + 硬件平台”的组合能力上。
- RISC-V 的 AI 价值正在从生态概念进入算子优化和高性能 IP 阶段,但要真正承载端侧大模型,还需要编译器、推理库和芯片实现共同成熟。
- 机器人产业的路线正在分化:双足人形强调通用性,轮式人形强调更快落地;两条路线都会推高对端侧多模态推理和实时控制芯片的需求。
- 出口管制和芯片供应链不确定性会继续影响 AI 算力部署节奏,企业在选型时需要同时评估性能、可获得性、合规风险和软件生态。
评论