算法模型

为什么AlphaGo能自学围棋?强化学习基本概念

强化学习简介 什么是强化学习 以直升机控制飞行的程序来举例。 自动驾驶的直升机配备了机载计算机、GPS、加速度计、陀螺仪和磁罗盘,我们可以实时确定的知道直升机的位置。如何使用强化学习来让

◷ 2025-10-18 📁 算法模型 👤 laumy 🔥 372 热度 💬 0 评论

机器人全身控制浅谈:理解 WBC 的原理

概念 WBC(Whole-Body Control,全身控制)是什么?机器人是由“各关节”组成的,其不是“各关节各玩各的”而是一个耦合的整体。在某个时刻可能要做很多事情,比如保持平衡(

◷ 2025-09-29 📁 算法模型 👤 laumy 🔥 1506 热度 💬 0 评论

机器人控制利器:MPC入门与实践解析

背景 MPC(Model Predictive Control)模型预测控制,是一种控制方法,广泛应用在机器人、无人驾驶、过程控制、能源系统等领域。它的核心思想用一句话来总结:利用系统模型预测未来,并通过

◷ 2025-09-28 📁 算法模型 👤 laumy 🔥 1066 热度 💬 0 评论

从数学角度理解flow matching中的线性插值

什么是插值 插值的核心问题是:在已知两个点的情况下,如何找到它们之间的中间点。 举个人走路的例子,起点在家门口(A点),终点在公司(B点),总的路程为1000米,假设人是匀速移动,如果

◷ 2025-08-24 📁 算法模型 👤 laumy 🔥 361 热度 💬 0 评论

浅析Pi0 :VLM 与 Flow Matching 的结合之道

概述 传统机器人策略模型往往局限在单一任务或平台,难以跨场景泛化。与此同时,大规模 视觉-语言模型(VLM) 已展现出卓越的语义理解与任务指令解析能力。如果能将 VLM 的语义理解能力 与 Flow Matching 的连

◷ 2025-08-22 📁 算法模型 👤 laumy 🔥 1268 热度 💬 0 评论

Flow Matching:让生成模型“流动”起来

背景 上一篇文章分析了diffusion扩散模型。diffusion扩散模型做法是加噪声、再一步步去噪,训练过程复杂,还需要 carefully 设计噪声调度。 Flow Matching提出了更直接的方式:与其

◷ 2025-08-22 📁 算法模型 👤 laumy 🔥 2039 热度 💬 0 评论

视觉 Token 如何注入语言模型?VLM拆解

VLM与LLM 如果说我们有一张图片、一个图表想让大模型来帮忙理解那应该要怎么实现了? 标准的LLM语言大模型只能处理文本序列,是不能够读取图像的,如果没有办法将视觉的数据转换为LLM

◷ 2025-08-20 📁 算法模型 👤 laumy 🔥 1326 热度 💬 0 评论

解读ViT:Transformer 在视觉领域如何落地

背景 计算机视觉领域,一直都是卷积天下。传统的卷积神经网络(CNN)依赖于卷积核提取局部特征,效果很好,但是也有一些不足,如需要人工设计卷积结构包括卷积核大小和层数,另外就是难以捕捉

◷ 2025-08-19 📁 算法模型 👤 laumy 🔥 425 热度 💬 0 评论

具身智能ACT算法

基本原理 简单总结一下什么是ACT算法。传统的机器算法过程是观测关节位置J1经过模型预测动作A2然后执行,观测到J2预测数A3,观测到J3遇到A4依次类推,这样就有一个问题,假设预测

◷ 2025-08-03 📁 算法模型 👤 laumy 🔥 1042 热度 💬 0 评论

transformer

模型结构 transform使用了自注意力机制,由编码器和解码器组成。 编码器 transformer的编码器输入一排向量,输出另外一排同样长度的向量。transformer的编码中加入

◷ 2025-07-18 📁 算法模型 👤 laumy 🔥 510 热度 💬 0 评论

自注意力机制

运作原理 自注意力机制要解决的是让机器根据输入序列能根据上下文来理解。举个例子,输入句子为"我有一个苹果手机",对于机器来说这里的"苹果"应该

◷ 2025-07-17 📁 算法模型 👤 laumy 🔥 327 热度 💬 0 评论

YOLOv2和YOLOv3

YOLOv2 回顾一下YOLOv1有哪些缺陷? 边界框训练时回归不稳定,导致定位误差大。 每个网格只能预测两个边界框且只能识别一类目标。 小目标检测效果差。 针对以上的问题,YOLOv2进行了改进,下

◷ 2025-07-13 📁 算法模型 👤 laumy 🔥 678 热度 💬 0 评论

YOLOv1目标检测原理

介绍 YOLO在目标视觉检测应用广泛,You Only Look Once的简称。作者期望YOLO能像人一样只需要看一眼就能够立即识别其中的物体、位置及交互关系。能够达到快速、实时检测的效果。 YOLO

◷ 2025-07-12 📁 算法模型 👤 laumy 🔥 991 热度 💬 0 评论