行业动态

本地智能竞争正在转向可治理闭环

核心观点本周更值得连起来看的不是某一颗芯片、某一个模型或某一个 Agent 产品，而是端侧 AI、机器人世界模型、运行时和企业 Agent 权限开始同时向“可执行、可复用、可审计”的闭环收敛。一个可辩论的判

◷ 2026-06-21 📁 行业动态 👤 laumy 🔥 0 热度 💬 0 评论

概述本文记录lerobot smolvla异步推理实践，将SmolVLA的策略server部署到AutoDL上，真机client在本地笔记本上运行。下面是代码的流程图：环境准备先登录

◷ 2025-08-28 📁 lerobot 👤 laumy 🔥 987 热度 💬 0 评论

准备下载同步的仓库 mkdir blog git clone git@github.com:laumy0929/wordpress-export-to-markdown.git git clone git@github.com:laumy0929/notes.git git clone …

◷ 2025-08-26 📁 前后端 👤 laumy 🔥 198 热度 💬 0 评论

框架本文主要对lerobot SmolVLA策略代码进行分析，下面是策略实现关键部分框图。 SmolVLAPolicay类封装向上提供策略的调用。SmolVLAConfig是对Smol

◷ 2025-08-25 📁 lerobot 👤 laumy 🔥 1745 热度 💬 0 评论

什么是插值插值的核心问题是：在已知两个点的情况下，如何找到它们之间的中间点。举个人走路的例子，起点在家门口(A点)，终点在公司(B点)，总的路程为1000米，假设人是匀速移动，如果

◷ 2025-08-24 📁 算法模型 👤 laumy 🔥 361 热度 💬 0 评论

概述 SmolVLA 是一套轻量级视觉-语言-行动（VLA）策略：前端用小型 VLM（视觉 SigLIP + 语言 SmolLM2）做感知与理解；后端用一个“动作专家”专门预测一段连续的低层控制。它与Pi0相比，参数

◷ 2025-08-23 📁 算法模型 👤 laumy 🔥 1773 热度 💬 0 评论

概述传统机器人策略模型往往局限在单一任务或平台，难以跨场景泛化。与此同时，大规模视觉-语言模型（VLM）已展现出卓越的语义理解与任务指令解析能力。如果能将 VLM 的语义理解能力与 Flow Matching 的连

◷ 2025-08-22 📁 算法模型 👤 laumy 🔥 1268 热度 💬 0 评论

背景上一篇文章分析了diffusion扩散模型。diffusion扩散模型做法是加噪声、再一步步去噪，训练过程复杂，还需要 carefully 设计噪声调度。 Flow Matching提出了更直接的方式：与其

◷ 2025-08-22 📁 算法模型 👤 laumy 🔥 2039 热度 💬 0 评论

概述图像生成是当下研究的热点，diffusion是一种人工智能领域图像生成的基础模型，当下Stable diffusion、DALL·E、MidJourney文生图模型的基座都使用了

◷ 2025-08-21 📁 算法模型 👤 laumy 🔥 1043 热度 💬 0 评论

VLM与LLM 如果说我们有一张图片、一个图表想让大模型来帮忙理解那应该要怎么实现了？标准的LLM语言大模型只能处理文本序列，是不能够读取图像的，如果没有办法将视觉的数据转换为LLM

◷ 2025-08-20 📁 算法模型 👤 laumy 🔥 1326 热度 💬 0 评论

背景计算机视觉领域，一直都是卷积天下。传统的卷积神经网络(CNN)依赖于卷积核提取局部特征，效果很好，但是也有一些不足，如需要人工设计卷积结构包括卷积核大小和层数，另外就是难以捕捉

◷ 2025-08-19 📁 算法模型 👤 laumy 🔥 425 热度 💬 0 评论