导购 网站模板,仿新浪首页网站模板,广州做企业网站找哪家公司好,男科医院咨询免费腿足机器人之二运动控制概览 高层运动规划MPCRL 中层逆运动学和逆动力学底层执行器控制传感器校正 上一篇博客是腿足机器人的骨架和关节的机械和电气组件#xff0c;关节不仅需要通过机械设计实现复杂的运动能力#xff0c;还必须通过电子组件和控制系统来精确控制这些运动。… 腿足机器人之二运动控制概览 高层运动规划MPCRL 中层逆运动学和逆动力学底层执行器控制传感器校正 上一篇博客是腿足机器人的骨架和关节的机械和电气组件关节不仅需要通过机械设计实现复杂的运动能力还必须通过电子组件和控制系统来精确控制这些运动。 和人类类似本篇博客介绍腿足机器人运动系统的设计机器人关节的控制系统是其运动的大脑负责解读传感器反馈并向执行器发送指令以精确调节位置、速度和扭矩。这一系统由传感器、控制器和执行器共同工作确保运动控制的准确性和效率。
腿足机器人的所有运动最终都会反应在对关节的控制上大体上关节的运动一般采用运动学和强化学习两类方法如运动学逆解算法用于规划关节角度如肘式/膝式腿的几何求解强化学习RL优化步态生成如NVIDIA Isaac Lab端侧部署方案。
机器人上的各个传感器连续监测关节的位置、速度及其他相关参数并向控制器提供反馈。控制器将这一反馈与期望的设定值进行比较生成纠正信号以调整关节的运动。这种反馈回路允许实时调整确保关节即使在外部干扰或负载变化的情况下也能准确地遵循预定轨迹。
闭环控制系统提供高精度和稳定性非常适合需要精确定位和运动控制的应用如机器人手术和制造过程。
早期机器人运动控制以波士顿波力Spot机器人为典型代表其采用的PD前馈控制技术可以见第三篇博客。 而当前较新主流腿足机器人运动控制以PDMPC/强化学习为主流程大致可以分为高层运动规划、中层逆运动学与逆动力学以及底层执行器控制三层。本篇博客先概览简要介绍各个部分以建立top-down机器人运动控制的整体概念。
一个完整的动作流程大致如下
传感器数据IMU、关节编码器、力传感器→ MPC规划/RL规划 → 逆运动学 → 关节目标角度 → PD控制器 → 电机驱动信号高层运动规划
在接收到运动指令行走、奔跑之后高层算法模型预测控制MPC或者强化学习RL算法负责全局规划底层PD确保实时跟踪两者协同实现动态运动。
MPC
在奔跑/行走的动作规划和控制中高层运动规划模块主要完成步态生成和轨迹生成两部分。其运行频率在50-100Hz每10-20ms规划一次。
对于步态生成则可基于机器人动力学模型滚动规划未来几步的质心CoM轨迹和足端接触力确保动态平衡在行走的时候计算支撑多边形内的零力矩点ZMP位置防止跌倒。躯干姿态和加速度可以使用IMU测量足端接触力科使用六轴力传感器测量关节的角度和速度使用关节编码器测量。
对于轨迹生成包括足端轨迹和质心轨迹足端轨迹指的是规划摆动退的抛物线轨迹奔跑时或直线轨迹行走时质心轨迹是指通过简化模型如倒立摆模型生成质心高度和水平位置的变化曲线。
以ANYmal机器人为例
传感器数据---MPC估计---生成$\theta_{desired}$---PD控制器---电机驱动MPC层每50ms计算一次未来0.5秒的足端轨迹和接触力PD层以1kHz频率跟踪关节角度公式 τ K p ( θ d e s i r e d − θ ) K d ( θ ˙ d e s i r e d − θ ) \tau K_p(\theta_{desired}-\theta) K_d(\dot \theta_{desired}-\theta) τKp(θdesired−θ)Kd(θ˙desired−θ)
模型预测控制存在如下挑战
挑战解决方案模型不准确自适应控制如在线参数估计 鲁棒PD参数执行器延迟提高控制频率 预测滤波如卡尔曼滤波地面接触突变阻抗控制调节PD的 K p K_p Kp为虚拟刚度 K d K_d Kd为虚拟阻尼实时计算资源限制简化模型如单刚体模型 代码优化定点运算、并行计算齿轮箱背隙、电机饱和等非线性问题通过前馈和抗饱和策略避免性能下降多关节联动导致力矩耦合结合解耦控制或全状态反馈如LQR地面反作用力突变力传感器反馈 自适应阻抗控制动态调整 K p K_p Kp K d K_d Kd)
RL
强化学习的目标是通过试错学习最优策略Policy其输出形式取决于具体任务和算法设计。在腿足机器人中RL的输出通常分为两类
输出类型描述示例优点缺点直接关节控制RL策略直接输出各关节的目标角度或扭矩无需中间计算策略网络输出12个关节的目标角度对应机器人自由度1.无需依赖精确的动力学模型RL通过仿真学习直接优化关节动作; 2.适合复杂动作如翻滚、跳跃传统模型难以精确建模1. 需要大量训练数据计算成本高 2.可解释性差难以手动调整策略高层指令生成RL输出末端执行器轨迹如足端位置或质心运动指令需通过IK转换为关节角度RL规划足端轨迹再通过逆运动学求解关节角度1.结合传统控制方法如IK提高稳定性和可解释性 2.减少RL策略的复杂度输出维度更低依赖逆运动学求解的准确性可能受模型误差影响
上面的两种在业界都有案例比如OpenAI的Dactyl机械手通过RL直接控制关节扭矩实现灵活操作而MIT Cheetah 3通过RL优化足端轨迹再通过IK控制关节。也有在RLIK的基础上再结合MPC的混合架构如适应复杂地形的波士顿动力Atlas机器人。
RL方法的一个挑战是获得训练数据在机器人行走之前采集数据的成本是高昂的所以一般训练都是先基于仿真环境在在仿真中定义奖励函数如前进速度、能量效率、姿态稳定性然后通过PPO或SAC算法优化策略模型预测结果然后再迁移到实际的环境中。
挑战解决方案RL训练效率低使用仿真-现实迁移Sim2Real技术结合域随机化Domain RandomizationIK求解不唯一引入优化目标如最小能量、关节力矩平滑通过QP求解唯一解实时性不足部署轻量化神经网络如TinyML推理加速框架tensorRT或使用分层控制高频PD 低频RL更新
现代系统如ANYmal、Unitree倾向于结合RL高层规划与传统控制IKPD兼顾学习能力与实时可靠性。
中层逆运动学和逆动力学
运动学关注的是机器人在不受外力影响时的运动状态如位置、速度和加速度。而动力学则考虑在实际运动过程中力和扭矩如何影响机器人的运动这包括了对刚体的质量分布及其与关节相互作用的分析。这两个领域是理解机器人如何与外界相互作用并执行任务的基础对优化机器人的设计和功能至关重要。
在高层中主要是机器人质心规划逆运动学IK是将质心轨迹和足端轨迹映射到各关节角度。例如给定足端目标位置 ( x , y , z ) (x,y,z) (x,y,z)根据足端轨迹方程如抛物线轨迹根据 v v v水平速度 h h h抬腿高度 T T T摆动时间求解髋、膝、踝关节的角度 ( θ h i p , θ k n e e , θ a n k l e ) (\theta_{hip}, \theta_{knee}, \theta_{ankle}) (θhip,θknee,θankle)这可以使用雅可比矩阵或者数值优化方法如梯度下降实时计算求解。
逆动力学则是计算关节所需要的力矩 τ \tau τ满足运动学和动力学约束 τ M ( q ) q ¨ C ( q , q ˙ ) q ˙ G ( q ) J T F e x t \tau M(q) \ddot q C(q,\dot q)\dot q G(q) J^{T}F_{ext} τM(q)q¨C(q,q˙)q˙G(q)JTFext
其中 M M M是惯性矩阵 C C C是科氏力 G G G是重力 J J J是雅可比矩阵 F e x t F_{ext} Fext是地面反作用力。
底层执行器控制
腿足机器人的驱动器控制算法如PID和PD是实现其运动稳定性和动态响应的核心技术。 PID/PD跟踪高层指令实现高频率1-10kHz即每0.1~1ms更新一次的精确执行。 以PD控制为例为了跟踪关节目标角度 q d e s i r e d q_{desired} qdesired和速度 q ˙ d e s i r e d \dot q_{desired} q˙desired需要给电机一定的力矩其计算如下 τ f b K p ( q d e s i r e d − q a c t u a l ) K d ( q ˙ d e s i r e d − q ˙ a c t u a l ) \tau_{fb}K_p(q_{desired}-q_{actual})K_d(\dot q_{desired}-\dot q_{actual}) τfbKp(qdesired−qactual)Kd(q˙desired−q˙actual)
由于机器人自重、惯性带来的影响可以加上逆动力学计算的理想力矩 τ f f \tau_{ff} τff,则最终的力矩可以表示为 τ τ f f τ f b \tau \tau_{ff} \tau_{fb} ττffτfb 这一力矩通过液压阀或者电机驱动器转为物理动作。
传感器校正
开篇提到一个完整动作流程的第一步是传感器的数据获取然后才是估计姿态这是因为传感器有噪声、环境也不确定性此外还有动态系统的随机性。这里使用到的是概率机器人理论后续博客揭示这里简要看一下。
腿足机器人需要实时估计自身姿态如躯干角度、关节位置和运动状态如速度、加速度但传感器数据IMU、编码器、力传感器通常包含噪声。其核心思想是先不参考传感器数据会有一个先验状态然后结合传感器对状态进行修正使用到的方法有卡尔曼滤波、粒子滤波等。
此外在腿足机器人动态环境中运动时需考虑障碍物位置、地面摩擦系数等不确定性因素。概率方法用于增强规划的鲁棒性会使用概率路线图Probabilistic Roadmap, PRM、蒙特卡洛树搜索Monte Carlo Tree Search, MCTS等方法评估候选路径和不同动作序列成功的概率。
概率方法的核心作用
控制流程概率方法解决的问题状态估计卡尔曼滤波、粒子滤波传感器噪声与动态不确定性运动规划PRM、MCTS环境障碍物与地形不确定性强化学习随机策略、熵正则化探索-利用权衡与策略鲁棒性模型预测控制高斯过程、随机MPC动力学模型误差与外部干扰足地交互贝叶斯估计、概率摩擦锥接触状态与地面特性不确定性