基于反作用轮的 3D 倒立摆的非线性分析与控制
摘要
本文介绍了基于反作用轮的 3D 倒立摆 Cubli 的非线性分析和控制设计。 使用广义动量的概念,将基于反作用轮的 3D 倒立摆的关键特性与 1D 情况的特性进行比较,以提出相对简单和直观的非线性控制器。 最后,在 Cubli 上实现了所提出的控制器,并给出了实验结果
INTRODUCTION
本文介绍了图 1 所示 Cubli 的非线性分析和控制。Cubli 是一个边长为 150 mm 的立方体,三个反作用轮相互垂直安装。 与其他 3D 倒立摆试验台 [1] 和 [2] 相比,Cubli 具有两个独特的功能。 一是其占地面积相对较小(因此得名 Cubli,源自瑞士德语中“立方体”的缩略词)。 另一个特点是它能够在没有任何外部支撑的情况下从静止位置跳起来,通过突然制动以高角速度旋转的反作用轮。 在 [3] 中介绍了跳跃的概念,在 [4] 中介绍了线性控制器,本文重点分析非线性模型和非线性控制策略。
与 [5] 和 [6] 中提出的工作相反,本文从纯机械的角度来处理控制器设计。 Cubli 的基本机械特性被利用来提出具有物理洞察力的简单直观的推导([5]:1D,反作用轮,反馈线性化;[6]:3D,检测质量,线性控制器,局部稳定性)。 由此产生的平滑、渐近稳定的控制律提供了基于四个直观参数的相对简单的调整策略,从而使控制律适用于实际实现
本文的其余部分结构如下:第 II 节首先介绍了反作用轮基于一维倒立摆的简要非线性分析和控制。 接下来,非线性系统动力学是从第 III 节中的第一原理推导出来的,然后分别在第 IV 节和第 V 节中进行详细的分析和控制设计。 最后,实验结果在第六节中给出,结论在第七节中得出。
ANALYSIS AND CONTROL OF A 1D INVERTED PENDULUM
本节介绍了基于 1D 反作用轮倒立摆的分析和非线性控制策略。 由于 1D 和 3D 情况下某些关键属性的相似性,分析 3D 倒立摆在后面的部分。
Modelling
让 $\varphi $ 和 $\psi $ 描述如图 2 所示的一维倒立摆的位置。接下来,让 $\Phi_w $ 表示反作用轮的转动惯量, 表示系统围绕身体固定坐标系中枢轴点的总转动惯量,以及 和 代表总质量和枢轴点到整个系统重心的距离。
系统的拉格朗日 [7] 由下式给出:
其中 ,g 是恒定的重力加速度。 广义动量定义为:
让 T 表示电机施加到反作用轮上的扭矩。 现在,可以使用欧拉-拉格朗日方程将扭矩 T 作为非势能推导出运动方程。 这产生:
请注意,(2)和(3)中广义动量的引入导致系统的简化表示,其中(4)类似于由(5)中的积分器增强的倒立摆。
由于反作用轮的实际位置并不重要,我们引入 来表示简化的状态集并描述机械系统的动力学如下:
Analysis
(1)状态空间:对于后续分析,状态空间定义为:
(2)均衡:系统的均衡由下式给出:
评估给出以下平衡:
每个均衡都是一个封闭的不变量集,其常数 $p_{\psi} $可能不为零。 从机械上讲,这意味着摆锤可以在直立位置静止,而其反作用轮以恒定角速度旋转。 进一步的线性分析表明,在李雅普诺夫的意义上,直立平衡点 是不稳定的,而悬挂平衡点 是稳定的
Control Design
控制器的目标是将倒立摆驱动到直立位置 $ \varphi = 0$ 并使反作用轮的角速度 为零,具体来说:
现在,考虑以下反馈控制律:
其中:
定理 2.1:(10)中给出的控制律 使得平衡点 在域$\chi^- = \chi \ \left { \varphi = \pi ,p_{\varphi = 0,p_{\psi } = 0} \right } $ 上稳定且渐近稳定
证明:考虑下面的李雅普诺夫候选函数 $V: x\in \chi \longrightarrow \mathcal{R} $
where 存在类函数 with $\epsilon < min\left { \frac{2mg}{\pi^2 } , \frac{\alpha }{2}, \frac{1}{2\delta \hat{\Theta_0} } \right } $ such that and 这里 是正定和有效的李雅普诺夫候选。
上述李雅普诺夫候选函数沿闭环轨迹的时间导数为:
由于$\dot{V}(x) \le 0, \forall x \in \chi $ 我们从李雅普诺夫稳定性定理得出结论,点 是稳定的。
现在,为了证明 在 中的渐近稳定性,让我们定义集合:
考虑 的不变集内的轨迹 。显然,它们必须满足 $ \varphi = 0, z = 0$ 和系统动力学 (6)。 这意味着 ,因此 中最大的不变量集是 。 现在,根据 Krasovskii-LaSalle 原理 [9](定理 4.4),对于任何轨迹 ,
有关基于一维反作用轮的倒立摆的类似控制设计和稳定性证明,请参见 [10]。
Remarks
(1)、Lyapunov 函数 (11) 的解释:Lyapunov 函数 (11) 可以通过标准的反推方法 [9]、[10] 找到。 如果忽略反作用轮动力学并且假设 p 是控制输入,则函数 是有效的李雅普诺夫函数候选。 沿轨迹要求将意味着,即 。这导致解释 z 惩罚与控制律的偏差,该偏差将应用于 忽略车轮动力学时的系统。 因此,降低调整参数 δ 会导致更积极的控制器,该控制器将倾斜置于车轮速度之上。
(2)、控制器 (10) 的扩展:Lyapunov 函数 (11) 可以通过额外的积分器状态进行扩充:
where 因此,控制器 (10) 必须扩展 以提供直立平衡的稳定性。 这对于实际实施也可能很重要,因为它考虑了建模错误。
控制律(10)的解释:(10)中给出的控制律可以改写为 :
where :
这只不过是由比例、(双)微分和积分部分组成的线性控制器。 此外 $\gamma $可以解释为积分器权重。
SYSTEM DYNAMICS OF THE REACTION WHEEL-BASED 3D INVERTED PENDULUM
让 表示整个 Cubli 围绕枢轴点 O 的总转动惯量(见图 3), 表示每个反作用轮的转动惯量(在相应旋转轴的方向上)并定义 。接下来,让$\vec{m} $ 表示从枢轴点到重心的位置向量乘以总质量,$\vec{g} $ 表示重力向量。张量在特定坐标系上的投影由前面的上标表示,即。箭头符号用于强调向量(和张量)应该先验地被认为是赋范向量空间中的线性对象,与其相对于特定坐标系的坐标表示分离。由于身体固定坐标系 $\left { B \right } $ 是最常用的投影坐标系,为了简单起见,我们通常将其前面的上标去掉。进一步注意,是正定的。
系统的拉格朗日由下式给出:
其中 表示主体角速度表示反作用轮角速度。 的组件包含施加到反作用轮上的扭矩。 在身体固定坐标系中,向量 m 是常数,而 g 的时间导数由 给出。 应用于向量 的波浪号运算符,即 表示 的偏斜对称矩阵。 介绍广义动量。
p_{\omega_{w}}= \frac{\partial \mathcal{L}}{\partial \omega_{w}}^{\mathrm{T}}=\Theta_{w}\left(\omega_{h}+\omega_{w}\right) \tag{14}
\begin{aligned}
\dot{g} &=-\tilde{\omega}_{h} g, \tag{15}
\end{aligned}
\dot{p}{\omega{h}} =-\tilde{\omega}{h} p{\omega_{h}}+\tilde{m} g, \tag{16}
\dot{p}{\omega{w}} =T . \tag{17}
请注意,有多种推导运动方程的方法; 例如,在 [4] 中使用了虚拟功率的概念。 附录 2 显示了使用拉格朗日形式主义的推导,并强调了 1D 和 3D 情况之间的相似之处。 拉格朗日形式主义也激发了广义动量的引入。 现在,使用$\dot{\vec{v}}=\dot{v}+\omega_{h} \times v$,旋转坐标系中向量的时间导数,(15)-(17)可以进一步简化为:
\begin{aligned}
\dot{\vec{g}} =0, \tag{18}
\end{aligned}
\dot{\vec{p}}{\omega{h}} =\vec{m} \times \vec{g}, \tag{19}
\dot{p}{\omega{w}} =T . \tag{20}
这特别突出了 1D 和 3D 倒立摆之间的相似性。 由于向量的范数与其在坐标系中的表示无关,因此脉冲变化的 2 范数由$\left\|\dot{\vec{p}}_{\omega_{h}}\right\|_{2}= \|\vec{m}\|_{2}\|\vec{g}\|_{2} \sin \phi$给出。 在这种情况下,$\phi$ 表示向量 $\vec{m}$ 和 $\vec{g}$ 之间的角度。 此外,在 1D 情况下,$p_{w_w}$ 是所施加扭矩 T 的积分。 # ANALYSIS ## Conservation of Angular Momentum 从(19)可以看出$\vec{p_{w_h}} $ 的变化率总是与$\vec{m}$ 和$\vec{g}$ 正交。 由于$\vec{g}$ 是常数,$\vec{p_{w_h}} $ 在整个轨迹中永远不会改变它在$\vec{g}$方向上的分量。 用 Cubli 的身体固定坐标系表示,可以写成$\frac{d}{d t}\left(p_{\omega_{h}}^{\mathrm{T}} g\right) \equiv 0$ 这不过是绕轴角动量守恒~ ## State Space 由于后续的分析和控制将在固定体坐标系中进行,状态空间定义为集合 $\mathcal{X}=\{x=\left(g, p_{\omega_{h}}, p_{\omega_{w}}\right) \in \mathbb{R}^{9} \mid\|g\|_{2}= 9.81\} $。 注意$\omega_{h}=\hat{\Theta}_{0}^{-1}\left(p_{\omega_{h}}-p_{\omega_{w}}\right)$。 ## Equilibria 该程序与第 II-B.2 小节中介绍的程序相同。 从 (19) 中可以看出,只有当$m \| g \text {, i.e., } g=\pm \frac{m}{\|m\|_{2}}\|g\|_{2}$ 时,才满足条件 $\dot{\vec{p}}_{\omega_{h}}=0$。 从 (20) 得出 $p_{w_w} = const, T = 0$。使用 (15) 和 (16) 导致 $\omega_{h}=\hat{\Theta}_{0}^{-1}\left(p_{\omega_{h}}-p_{\omega_{w}}\right) \| g \text { and } p_{\omega_{h}} \| g$, 这正好对应于$p_{w_h}$ 的守恒部分。 将所有内容结合在一起会导致以下平衡:
\begin{gathered}
\mathcal{E}{1}=\left{(x, T) \in \mathcal{X} \times \mathbb{R}^{3} \mid g^{\mathrm{T}} m=-|g|{2}|m|{2},\right. \
\left.p{\omega_{h}}\left|m, \hat{\Theta}{0}^{-1}\left(p{\omega_{h}}-p_{\omega_{w}}\right)\right| m, T=0\right}, \
\mathcal{E}{2}=\left{(x, T) \in \mathcal{X} \times \mathbb{R}^{3} \mid g^{\mathrm{T}} m=|g|{2}|m|{2},\right. \
\left.p{\omega_{h}}\left|m, \hat{\Theta}{0}^{-1}\left(p{\omega_{h}}-p_{\omega_{w}}\right)\right| m, T=0\right} .
\end{gathered}
线性化表明,在李雅普诺夫的意义上,直立平衡点 E1 是不稳定的,而悬挂平衡点 E2 是稳定的。 # NONLINEAR CONTROL OF THE REACTION WHEEL-BASED 3D INVERTED PENDULUM 让我们首先定义控制目标。 由于角动量$\vec{p_{w_h}} $ 在$\vec{g}$ 的方向上是守恒的,控制器只能将$\vec{p_{w_h}} $ 的与$\vec{g}$ 正交的分量归零。 因此,将向量 $\vec{p_{w_h}} $ 分成两部分是很方便的:一个在 $\vec{g}$ 的方向上,另一个与它正交,即:
\vec{p}{\omega{h}}=\vec{p}{\omega{h}}{\perp}+\vec{p}_{\omega_{h}}{g} \quad \text { and } \quad \vec{p}{\omega{h}}{g}=\left(\vec{p}_{\omega_{h}}{\mathrm{T}} \vec{g}\right) \frac{\vec{g}}{|\vec{g}|_{2}^{2}} .
B\left(\dot{\vec{p}}{\omega{h}}{\perp}\right)=\dot{p}_{\omega_{h}}{\perp}+\tilde{\omega}{h} p{\omega_{h}}^{\perp}=\tilde{m} g \tag{21}
\begin{aligned}
& \mathcal{T}=\left{x \in \mathcal{X} \mid g^{\mathrm{T}} m=-|g|{2}|m|{2}, \omega_{h}=\hat{\Theta}{0}^{-1}\left(p{\omega_{h}}-\right.\right. \left.\left.p_{\omega_{w}}\right)=0, p_{\omega_{h}}^{\perp}=0\right}
\end{aligned}
为了证明渐近稳定性,必须排除悬挂平衡(稍后将变得清楚)。 这可以通过引入集合 $\chi^− =\frac{\chi}{x^−} $来完成,其中 $x^−$ 表示悬垂平衡 $w_h = 0$:
x^{-}=\left{x \in X \mid g=\frac{|g|{2}}{|m|{2}} m, p_{\omega_{h}}^{\perp}=0, p_{\omega_{h}}=p_{\omega_{w}}\right}
u=K_{1} \tilde{m} g+K_{2} \omega_{h}+K_{3} p_{\omega_{h}}-K_{4} p_{\omega_{w}} \tag{22}
\begin{aligned}
&K_{1}=(1+\beta \gamma+\delta) I+\alpha \hat{\Theta}{0} \
&K{2}=\alpha \hat{\Theta}{0} \tilde{p}{\omega_{h}}^{\perp}+\beta \tilde{m} \tilde{g}+\tilde{p}{\omega{h}} \
&K_{3}=\gamma\left(I+\alpha \hat{\Theta}{0}\left(I-\frac{g g{\mathrm{T}}}{|g|_{2}{2}}\right)\right) \
&K{4}=\gamma I, \quad \alpha, \beta, \gamma, \delta>0
\end{aligned}
and $I \in \mathbb{R}^{3 \times 3}$ is the identity matrix 定理 5.1:(22)中给出的控制器使由(18)-(20)定义的系统的闭不变集 $\tau $在 $x \in \chi^- $ 上稳定和渐近稳定。 证明:考虑以下李雅普诺夫候选函数$x \longrightarrow \mathbb{R} $:
V(x)=\frac{1}{2} \alpha p_{\omega_{h}}{\perp}{{\mathrm{T}}} p_{\omega_{h}}{\perp}+m{\mathrm{T}} g+|m|{2}|g|{2}+\frac{1}{2 \delta} z^{\mathrm{T}} \hat{\Theta}_{0}^{-1} z \tag{23}
z=z(x)=\alpha \hat{\Theta}{0} p{\omega_{h}}^{\perp}+p_{\omega_{h}}+\beta \tilde{m} g-p_{\omega_{w}}
当$\mathcal{K}_{\infty}$函数$a(x):=\epsilon x^{2}, \text { with } \epsilon< \min \left\{\frac{2}{\pi^{2}}\|m\|_{2}\|g\|_{2}, \frac{1}{2 \delta\left\|\hat{\Theta}_{0}\right\|_{2}}, \frac{\alpha}{2}\right\}$ is such that $V(x) \ge a\left(\left\|\left(p_{\omega_{h}}, p_{\omega_{w}}, z\right)\right\|_{2}\right), \forall x \in \mathcal{X}$ 此外$V(x = x_0) = 0$ 意味着 $x = x_0$,其中 $x_0 \in \tau $ 。 因此 V 是一个正定函数和一个有效的 Lyapunov 候选 接下来,沿着闭环系统的轨迹评估 $\dot{V} $:
\begin{aligned}
\dot{V}(x) &=\alpha p_{\omega_{h}}{\perp}{p}_{\omega_{h}}{\perp}+m^{\mathrm{T}} \dot{g}+\frac{1}{\delta} z^{\mathrm{T}} \hat{\Theta}{0}^{-1} \dot{z} \
&=m^{\mathrm{T}} \tilde{g} \hat{\Theta}{0}^{-1}(\beta \tilde{g} m+z)+\frac{1}{\delta} z^{\mathrm{T}} \hat{\Theta}{0}^{-1} \dot{z} \
&=-\beta(\tilde{g} m)^{\mathrm{T}} \hat{\Theta}{0}^{-1}(\tilde{g} m)+z^{\mathrm{T}} \hat{\Theta}{0}^{-1}\left(\tilde{m} g+\frac{1}{\delta} \dot{z}\right) \
&=-\beta(\tilde{g} m)^{\mathrm{T}} \hat{\Theta}{0}^{-1}(\tilde{g} m)-\frac{\gamma}{\delta} z^{\mathrm{T}} \hat{\Theta}_{0}^{-1} z \leq 0, \forall x \in \mathcal{X} .
\end{aligned}
由于 $\dot{V}(x) \leq 0 , \forall x \in \mathcal{X}$,我们从李雅普诺夫稳定性定理得出结论,点 $x_0 \in \tau $是稳定的: 为了证明集合 $\tau$ 在 $\chi^−$ 中的渐近稳定性,定义集合 $\mathcal{R}:=\{x \in \mathcal{X}-\mid \dot{V}(x)=0\}$。 条件 $\dot{V}(x) = 0$ 立即导致 $z = 0, m || g$,使得$\mathcal{R}$ 可以重写为 $\mathcal{R}=\left\{x \in \mathcal{X}^{-} \mid m \| g, p_{\omega_{w}}=\alpha \hat{\Theta}_{0} p_{\omega_{h}}^{\perp}+p_{\omega_{h}}\right\}$。 现在,让我们考虑包含在 $\mathcal{R}$ 中的不变集内轨迹的系统动力学。这给出:
\begin{aligned}
g | m & \Rightarrow g=-\frac{m}{|m|{2}}|g|{2} \Rightarrow \dot{g}=0 \
& \Rightarrow \omega_{h} | g \quad \because \dot{g}=-\tilde{\omega}_{h} g \
\end{aligned} \tag{24}
g | m, z=0 \Rightarrow \omega_{h}=\alpha p_{\omega_{h}}^{\perp} \
\Rightarrow \omega_{h} | p_{\omega_{h}}^{\perp} \tag{25}
然而,由于 $p_{w_h}^{\perp} \perp g$ 根据定义,(24) 和 (25) 意味着 $w_h = 0$ 和$ p_{w_h}^{\perp} = 0$。这表明 $\tau $ 是 $\mathcal{R} $ 的最大不变子集。现在,根据 Krasovskii-LaSalle 原理 [9](定理 4.4) ,由此可知,对于任何轨迹$ x(t)$:
\lim {t \rightarrow \infty} x(t)=x{f}, \quad x(0) \in \mathcal{X}^{-}, \quad x_{f} \in \mathcal{T}
## Remarks [[ANovelCameraPathPlanningAlgorithmForRealTimeVideoStabilization]] [[DigitalVideoStabilizationAndRollingShutterCorrectionUsingGyroscope]] [[GyroscopeBasedNonlinearFilterForVideoStabilization]] [[HybridMotionEstimationForVideoStabilizationBasedOnIMUSensor]] [[NonlinearAnalysisAndControlOf3DInvertedPendulumBasedOnCounterwheelAction]] [[ProbabilityTheoryandMathematicalStatistics]]
