基于 IMU 传感器的视频稳定混合运动估计
Abstract
在本文中,我们提出了一种混合方法来估计运动并通过切换函数稳定视频,该方法在 Kanade-Lucus-Tomasi (KLT) 跟踪器和 IMU 辅助运动估计器之间切换估计的运动。为了实现这一点,由于 KLT 跟踪器在较大运动期间的性能不佳,我们使用 KLT 跟踪器来校正低旋转的运动,并使用 IMU 辅助运动估计器来校正高旋转,此外,卡尔曼滤波器用于去除不需要的运动,从而平滑轨迹。
Introduction
在相机市场,光学图像稳定(OIS)系统安装在相机镜头或图像传感器上,价格相当昂贵 [3]。另一方面,数字稳定系统通过在相机移动时补偿捕获图像的移动来处理图像,它可以分为三个步骤,即运动估计、运动平滑和图像扭曲 [4,5]。
数字视频稳定中运动估计的常用技术是分别使用块匹配 [9]、KLT (Kanade-Lucus-Tomasi) 跟踪器 [10,11]、SIFT [12] 和 SURF [13]。最近,Dong et al. [14] and Lim 等人 [15] 使用 KLT 跟踪器以高帧率和低计算成本实时估计运动, KLT 跟踪器通过 Good Feature to Track 检测特征点,并使用 Lucas-Kanade 方法估计连续帧的光流。该跟踪器在评估小运动中的运动方面取得了成功,但在局部运动和全局运动发生显着变化时失败 [15],然而,可以通过使用 IMU(惯性测量单元)数据来估计大运动。
我们提出了一种混合函数来切换运动估计算法,以确定两个连续帧之间的转换。 在低运动的情况下,我们应用 KLT 跟踪器来计算两个连续帧上运动物体的光流。 然而,在快速旋转的情况下,来自 IMU 传感器的旋转数据用于通过计算来自预定义运动点和参考点的运动来估计运动。
Related Work
Karpenko 等人 [3] 仅使用陀螺仪数据创建滚动快门以实现视频稳定。此外,一些研究分别包括 IMU 数据和特征跟踪,例如 Ryu 等人 [26] 提出了通过将旋转运动纳入 KLT 跟踪的运动估计,它使用来自 IMU 的位置来预测下一帧,从而证明速度和准确性。
Proposed Framework
本文的挑战是如何估计连续帧在移动相机上的运动,例如,由于相机旋转引起的大旋转和基于场景中运动物体的局部运动。
根据我们的目标,我们应用了一种混合方法来近似确定估计移动相机运动的方法,如图
1 中的流程图所示。
为了使用混合方法估计运动,我们采用由 IMU 传感器
其中
- 使用 OpenCV(开源计算机视觉)中的相机校准模块校准相机以找出焦距(f)。
- 校准陀螺仪以防止陀螺仪漂移问题与偏置偏移。我们可以通过测量陀螺仪长时间静止时的输出信号来评估偏置偏移,并通过卡尔曼滤波器降低噪声。
- 使用 Li 和 Ren [16] 提出的陀螺仪数据和光流之间的关系估计
,使用 CC+LS13 方法。 - 确定陀螺仪和相机输入之间的
时间偏差。然后,我们可以正确估计 。
Motion Estimation
为了挑战每个环境中的运动估计,我们开发了一种可靠且有效的方法,用于通过混合算法切换算法,以计算连续帧的运动流。 该方法分为两个功能,其中包括 KLT 跟踪器和 IMU 辅助运动估计器。
A KLT Tracker
如果
其中
其中
- 如果
和 都小,这意味着 R 也小,则该区域是平坦的; - 如果
大于 ,则 R 为负,则该区域为边; - 如果
和 都大,则 R 大,区域为 corner。
这种改进后的方法被称为 Good Feature to Track。
然而,为了实时运行算法,特征点和它们的匹配在计算时间内必须在两个连续的帧内。我们对拼接全景图进行了实验,以确认一定数量的特征点的效率,这对于单应矩阵来说是足够的。
图 2a 显示了拼接前的原始图像,图 2b、c 分别说明了使用 200 个特征点和
2000 个特征点的全景图像。
这些图像是相似的,但大特征点过度计算了拼接图像。因此,我们提出的方法使用少于
200 个特征点来允许对运动变换的合理估计。
两个连续帧之间的特征点匹配需要快速逼近,因此,我们使用光流来匹配检测到的角点。光流是图像对象在连续帧之间由于物体或相机的运动而产生的明显运动的模式。它表示角点在
dt 时间后从前一帧
等式(4)可以通过去除公共项并在右手边采取泰勒级数近似后除以 dt
以简单的形式表述。 我们获得了图像梯度
然而,式 (5) 在一个方程中有两个未知数 (u, v)。 一些研究人员提出了解决这个问题的方法,但我们使用了 Lucas-Kanade 方法,这是估计光流的标准方法。 Lucas-Kanade 通过在拐角点周围取 3 × 3 块的相邻像素解决了这个问题,假设所有 9 个点都具有相同的运动。 然后,可以使用最小二乘拟合方法求解具有正确方程的两个未知数,其定义如下:
例如,图 3a、b 分别显示了在正常运动和快速运动期间来自 KLT 特征跟踪器的光流。 后一种运动情况是无序的,导致对单应矩阵的估计效率低下。在大运动期间,KLT 特征跟踪器确实失败了。因此,我们在大运动的情况下使用 IMU 辅助的运动估计器方法来减少任何运动矢量误差。
总之,KLT 跟踪器已经根据前一帧中的特征点和当前帧中移动到新位置的特征点创建了运动向量。 这两组来自 KLT 跟踪器的特征点用于估计刚性变换的单应矩阵以稳定图像帧。
An IMU-Aided Motion Estimator
在
其中
其中 j 等于
- 和 (10) 可以由来自 IMU
传感器的运动矢量合成。运动矢量的方向和大小取决于测量的旋转。 图 5
显示了从一组具有不同 φ 值的点计算的运动矢量,对于图 5a
中的低旋转速率,运动矢量在方向和大小方面相似。另外,快速旋转中运动矢量在不同的方向和大小上是有序的,如图
5b,c
来自 IMU
传感器的一组参考点和新位置点被应用于估计刚性变换的单应性矩阵。两种方法的运动流比较运动矢量如图
6 所示,KLT 跟踪器的光流为快速运动矢量如图 6 所示,同时组织从 IMU
数据估计运动。
上一步中参考图像(S0)和当前图像(Sn)的近似设定点用于定义运动模型。运动估计通过找到 2 × 2 矩阵 A 和 2 × 1 向量 t 来近似这些设定点之间的仿射变换 [A|t],其公式如下所示:
为了求解(11)中的
自由度 (12) 包括标度 (S)、旋转角度 (q) 以及 x 轴和 y 轴上的平移
Motion Smoothing and Image Warping
为了从估计的运动中去除噪声,我们使用卡尔曼滤波器来减少噪声并获得平滑的运动
[30]。 卡尔曼滤波器通过使用前一个状态 [31]
来近似下一个状态,这适合连续帧的动态系统。
其中 F 矩阵是前一状态
其中
其中
Experimental Results and Discussion
假设 IMU 和 Camera 之间的延迟是常数 [32]。它可以通过应用围绕 z
轴移动相机以测量
我们提出的方法与独立的 KTL 跟踪器和 IMU 辅助运动估计器进行了比较。 为了合理的评估稳定视频的性能,我们使用帧间变换保真度(ITF)[34] 通过总结峰值信噪比(PSNR)以单个值表示稳定视频的质量 ,由下式给出:
其中
其中
其中 N 和 M 是视频尺寸。 ITF 和 PSNR 的高代表稳定视频的质量。
参考文献
< A Hybrid Motion Estimation for Video Stabilization Based on an IMU Sensor >