一种机械臂末端位姿估计方法、系统、设备与存储介质

allin2025-05-14 93

本申请涉及机械自动化，尤其是机械臂位姿估计，特别涉及一种机械臂位置估计方法、装置、设备与存储介质。

背景技术：

1、根据应用场景和需求，机器人的形态各不相同，大致上可分为作业机器人、协作机械臂和agv(automated guidedvehicl)等。在应用过程中，以机械臂为例，为了引入自动化和智能化控制方法，通常需要知道当前机械臂的位姿(空间位置和姿态)。除此之外，在使用机械臂进行基于视觉引导的工业加工时，也需要对机械臂进行视觉估计。

2、位姿矩阵的使用有助于描述机械臂在空间中的绝对位置和方向，同时方便了坐标系之间的转换和组合。在机械臂控制中，位姿矩阵常用于描述机械臂末端执行器的姿态，以便进行路径规划和轨迹控制。并且，位姿矩阵可用于描述物体的姿态变换，实现物体的渲染和动画效果。

3、现有的位姿估计方法主要是建立3d点和图像中的2d像素级关键点之间的稀疏匹配关系，然后通过基于ransac的pnp算法来估计姿态。根据匹配方法的不同，可以分为三类：直接2d-3d的匹配方法、基于图像检索的方法和基于学习的回归方法。直接2d-3d的匹配方法主要是从查询图像中提取特征点，然后和三维场景进行特征匹配。基于图像检索方法是二维到二维之间进行特征映射，该方法在搭建匹配关系时需要建立图像匹配数据库。基于学习的坐标回归方法是直接估计三维场景的坐标，通过训练神经网络，可以从输入查询图像直接得到三维场景的坐标。

4、虽然上述方法都能在特定场景中取得良好的位姿估计效果，但是基于特征点匹配和基于图像检索的方式由于需要搭建场景关系，依赖于图像的特征点或者描述子，特征点和描述子的健壮性，会直接影响估计位姿的精度，因此这些方法泛化能力不强；而基于学习的回归模型在回归3d场景坐标时为了训练出一个好的模型，需要大量的训练数据和训练时间，成本高昂，因此很难推广到复杂的环境中。

技术实现思路

1、本发明提供一种机械臂位姿估计方法、系统、设备与存储介质。上述方法有助于实现机械臂末端位姿的精确估计。

2、本发明提供了一种机械臂末端位姿估计方法，包括：

3、通过机械臂搭载的工业相机，环绕加工对象采集不同视角的训练图像，训练图像经过colmap算法处理，获得机械臂末端对应的位姿以及加工对象的稀疏点云，将其输入到神经辐射场渲染模型进行训练，获得加工对象带纹理的三维模型并导入nerfstudio；

4、采集机械臂当前位置和视角下的图像，根据图像在nerfstudio中评估加工对象的观测区域范围，设计密集的虚拟相机观测轨迹获得渲染视频，调节观测轨迹抽帧的帧率，从渲染视频中提取观测轨迹上的渲染图像及渲染图像对应的位姿矩阵；

5、将机械臂当前位置的待估计图像与提取的渲染图像进行相似度匹配，将相似度最大的渲染图像对应的位姿矩阵作为估计的机械臂末端当前位置的位姿矩阵。

6、优选的，所述辐射场渲染模型选择隐式辐射场nerf或隐式辐射场nerf的衍生模型。

7、优选的，所述相似度匹配通过多种图像评价指标结合优化算法实现。

8、优选的，所述图像评价指标包括峰值信噪比、结构相似性和学习感知图像块相似度。

9、优选的，所述优化算法为差分进化算法。

10、优选的，所述差分进化算法根据峰值信噪比、结构相似性和学习感知图像块相似度设计目标函数，目标函数如下：

11、

12、其中，psnr为峰值信噪比，ssim为结构相似性，lpips为学习感知图像块相似度，sj为目标函数，w1、w2及w3为峰值信噪比、结构相似性和学习感知图像块相似度的权重，为归一后的psnr值。

13、优选的，所述峰值信噪比、结构相似性和学习感知图像块相似度的计算公式如下：

14、

15、其中，psnr为峰值信噪比，ssim为结构相似性，lpips为学习感知图像块相似度，mse表示大小为m×n的图像i和图像k之间的差异，maxi为图片最大像素值；μx和μy为样本x和y的均值，σx和σy为标准差，σxy为协方差，l为像素值，k1与k2分别取0.01与0.03，h和w分别为图像的高度和宽度，w为权重，z为特征图。

16、本发明同时提供一种机械臂末端位姿估计系统，包括：

17、图像采集处理模块，用于通过机械臂搭载的工业相机，环绕加工对象采集不同视角的训练图像，训练图像经过colmap算法处理，获得机械臂末端对应的位姿以及加工对象的稀疏点云，将其输入到神经辐射场渲染模型进行训练，获得加工对象带纹理的三维模型并导入nerfstudio；

18、图像采集渲染模块，用于采集机械臂当前位置和视角下的图像，根据图像在nerfstudio中评估加工对象的观测区域范围，设计密集的虚拟相机观测轨迹获得渲染视频，调节观测轨迹抽帧的帧率，从渲染视频中提取观测轨迹上的渲染图像及渲染图像对应的位姿矩阵；

19、位姿估计模块，用于将机械臂当前位置的待估计图像与提取的渲染图像进行相似度匹配，将相似度最大的渲染图像对应的位姿矩阵作为估计的机械臂末端当前位置的位姿矩阵。

20、本发明同时提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述机械臂末端位姿估计方法。

21、本发明同时提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述机械臂末端位姿估计方法。

22、与现有技术相比，本发明通过纯视觉方法估计机械臂末端位姿，先通过采集机械臂末端待加工对象的多视角图像，然后训练一个nerf模型得到待加工对象带纹理的隐式三维模型，利用nerfstudio进行可视化并根据查询图像的大概方位设计稠密的虚拟相机观测轨迹，在得到渲染视频后对轨迹进行抽帧并提取对应帧的位姿矩阵，利用差分进化算法计算查询图像与轨迹提取的渲染图像之间的相似度，相似度最大的渲染图像所对应的位姿矩阵就是估计的当前机械臂末端位姿矩阵。本发明所提出的位姿估计框架可以避免重建冗余的点云模型或者建立全局的图像数据库，并且不依赖于特征点和描述子，不需要大量的数据训练回归模型，实现了简单快速准确的位姿估计。

技术特征：

1.一种机械臂末端位姿估计方法，其特征在于，包括：

2.如权利要求1所述的一种机械臂末端位姿估计方法，其特征在于，所述辐射场渲染模型选择隐式辐射场nerf或隐式辐射场nerf的衍生模型。

3.如权利要求1所述的一种机械臂末端位姿估计方法，其特征在于，所述相似度匹配通过多种图像评价指标结合优化算法实现。

4.如权利要求3所述的一种机械臂末端位姿估计方法，其特征在于，所述图像评价指标包括峰值信噪比、结构相似性和学习感知图像块相似度。

5.如权利要求3所述的一种机械臂末端位姿估计方法，其特征在于，所述优化算法为差分进化算法。

6.如权利要求5所述的一种机械臂末端位姿估计方法，其特征在于，所述差分进化算法根据峰值信噪比、结构相似性和学习感知图像块相似度设计目标函数，目标函数如下：

7.如权利要求6所述的一种机械臂末端位姿估计方法，其特征在于，所述峰值信噪比、结构相似性和学习感知图像块相似度的计算公式如下：

8.一种机械臂末端位姿估计系统，其特征在于，包括：

9.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～7任一项所述的方法。

10.一种计算机设备，其特征在于，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1～7任一所述的方法。

技术总结
本发明公开了一种机械臂末端位姿估计方法、系统、设备与存储介质，属于机械自动化技术领域，通过纯视觉方法估计机械臂末端位姿，首先通过机械臂末端搭载的工业相机采集待加工对象的多视角图像，然后训练一个NeRF模型，得到待加工对象带纹理的隐式三维模型后，利用NeRFStudio进行可视化并根据查询图像的大概方位设计稠密的虚拟相机观测轨迹，在得到渲染视频后对轨迹进行抽帧并提取对应帧的位姿矩阵，最后利用差分进化算法计算查询图像与轨迹提取的渲染图像之间的相似度，将相似度最大的渲染图像所对应的位姿矩阵作为估计的当前机械臂末端位姿矩阵。上述方法有助于实现机械臂末端位姿的精确估计。

技术研发人员：胡启春,蔡宇,魏小龙,尹贻祯,徐浩军,何卫锋
受保护的技术使用者：中国人民解放军空军工程大学
技术研发日：
技术公布日：2024/10/31

转载请注明原文地址: https://www.8miu.com/read-21078.html

专利

最新回复(0)