行业动态

本地智能竞争正在转向可治理闭环

核心观点 本周更值得连起来看的不是某一颗芯片、某一个模型或某一个 Agent 产品,而是端侧 AI、机器人世界模型、运行时和企业 Agent 权限开始同时向“可执行、可复用、可审计”的闭环收敛。一个可辩论的判

◷ 2026-06-21 📁 行业动态 👤 laumy 🔥 0 热度 💬 0 评论

文章列表

网站github page同步

准备 下载同步的仓库 mkdir blog git clone git@github.com:laumy0929/wordpress-export-to-markdown.git git clone git@github.com:laumy0929/notes.git git clone …

◷ 2025-08-26 📁 前后端 👤 laumy 🔥 198 热度 💬 0 评论

LeRobot SmolVLA:从训练到推理链路剖析

框架 本文主要对lerobot SmolVLA策略代码进行分析,下面是策略实现关键部分框图。 SmolVLAPolicay类封装向上提供策略的调用。SmolVLAConfig是对Smol

◷ 2025-08-25 📁 lerobot 👤 laumy 🔥 1745 热度 💬 0 评论

从数学角度理解flow matching中的线性插值

什么是插值 插值的核心问题是:在已知两个点的情况下,如何找到它们之间的中间点。 举个人走路的例子,起点在家门口(A点),终点在公司(B点),总的路程为1000米,假设人是匀速移动,如果

◷ 2025-08-24 📁 算法模型 👤 laumy 🔥 361 热度 💬 0 评论

浅析Pi0 :VLM 与 Flow Matching 的结合之道

概述 传统机器人策略模型往往局限在单一任务或平台,难以跨场景泛化。与此同时,大规模 视觉-语言模型(VLM) 已展现出卓越的语义理解与任务指令解析能力。如果能将 VLM 的语义理解能力 与 Flow Matching 的连

◷ 2025-08-22 📁 算法模型 👤 laumy 🔥 1268 热度 💬 0 评论

Flow Matching:让生成模型“流动”起来

背景 上一篇文章分析了diffusion扩散模型。diffusion扩散模型做法是加噪声、再一步步去噪,训练过程复杂,还需要 carefully 设计噪声调度。 Flow Matching提出了更直接的方式:与其

◷ 2025-08-22 📁 算法模型 👤 laumy 🔥 2039 热度 💬 0 评论

视觉 Token 如何注入语言模型?VLM拆解

VLM与LLM 如果说我们有一张图片、一个图表想让大模型来帮忙理解那应该要怎么实现了? 标准的LLM语言大模型只能处理文本序列,是不能够读取图像的,如果没有办法将视觉的数据转换为LLM

◷ 2025-08-20 📁 算法模型 👤 laumy 🔥 1326 热度 💬 0 评论

解读ViT:Transformer 在视觉领域如何落地

背景 计算机视觉领域,一直都是卷积天下。传统的卷积神经网络(CNN)依赖于卷积核提取局部特征,效果很好,但是也有一些不足,如需要人工设计卷积结构包括卷积核大小和层数,另外就是难以捕捉

◷ 2025-08-19 📁 算法模型 👤 laumy 🔥 425 热度 💬 0 评论