导图社区 论文阅读笔记
这是一篇关于论文阅读笔记的思维导图,主要内容包括:无人机视觉识别。本文通过优化目标检测算法、设计新型降落标识物、改进降落平台结构,成功解决了船载无人机在复杂海洋环境中的自主降落问题。研究提出的改进 YOLOv8 算法、多 ArUco 码组合标识物和重检测机制等创新方案,为船载无人机的实际应用提供了重要的理论和技术支持。
编辑于2025-09-05 16:28:04论文阅读笔记
无人机视觉识别
雾气天气下无人机的视觉降落技术及避 障策略研究
创新点
改进的 A 算法*:通过节点遍历优化和启发函数的改进,解决了传统 A* 算法在路径规划中可能斜穿障碍物或在狭窄缝隙中规划不当的问题。引入了基于正切函数的加权因子 μ 和对数函数的加权因子 η,能够在不同障碍物密度环境下自适应调整路径搜索策略,从而找到更优的全局路径。
全局规划算法A*:是一种结合了Dijkstra算法(保证最优)和贪心最佳优先搜索(提高效率)的启发式全局路径规划算法,核心是通过评估函数平衡“已走成本”与“预估剩余成本”,实现高效寻优.
2.改进的 DWA 算法:在动态窗口算法(DWA)的评价函数中增加了对 A* 路径拟合度的子函数,评估 DWA 生成的轨迹与 A* 路径的偏离程度,并惩罚偏离过大的轨迹。这使得局部路径规划更加平滑且贴合全局路径,减少了无人机陷入局部最优的可能性,同时提高了避障效率。
DWA 算法:
DWA(Dynamic Window Approach,动态窗口法)是一种用于移动机器人的局部路径规划算法,核心是在速度空间(线速度、角速度)中采样可行速度,模拟其轨迹并评估优劣,最终选择最优速度控制机器人避障。
3.图像增强技术的应用:针对雾气天气下视觉识别困难的问题,提出了直方图均衡化与最小值滤波相结合的方法,显著提升了 ArUco 标记的识别帧率和姿态解算精度。此外,通过饱和度增强处理,进一步提高了 YOLOv8 模型在雾气环境中的检测性能。
4.深度学习与传统方法结合:利用 YOLOv8 模型实现了降落点的高效识别,同时结合固定高度坐标变换实现定位,简化了复杂的姿态解算过程。在高雾密度条件下,该方法仍能保持较高的识别能力,相比传统 ArUco 方法更具鲁棒性。
5.多传感器融合与仿真验证:在 Gazebo 物理仿真环境中集成了三维激光雷达、摄像头等传感器数据,通过 ALOAM 定位算法和 OctoMap 构建场景栅格地图,实现了全局路径规划与局部避障的无缝衔接。最终,无人机能够自主寻找最优路径并精准降落至目标位置。
相机成像原理
相机成像原理是视觉识别功能的核心,它基于小孔成像模型。光线通过小孔被传感器收集,在像素平面形成一个倒立的像。为了更精确地描述这一过程,建立了图像坐标系 x'O'y' 和相机光心坐标系 xOy,z 轴贯穿光心垂直于 xOy 平面。通过几何关系可以得到图像坐标与相机坐标之间的变换关系。 进一步来看,相机成像还涉及到世界坐标系 OWXWYWZW 的转换。在该坐标系中,P 点的世界坐标为(Xp , Yp ,Zp ),通过三阶旋转矩阵 R 和 3 维平移列向量 T 来表示世界坐标系与相机坐标系的变换。此外,假设图像位于像素坐标系的第一象限,并建立像素坐标系 uo ′v,图像坐标系的中心在像素坐标系中的坐标为(u0 , v0 )。最终,通过联立多个变换公式,能够实现从像素坐标系到世界坐标系的完整转换。 总结来说,相机成像原理包括以下几个关键步骤: 小孔成像:光线通过小孔后在像素平面上形成倒立的像。 坐标系转换:通过几何推导和矩阵运算,完成图像坐标系、相机光心坐标系以及世界坐标系之间的转换。 畸变校正:在实际应用中,由于镜头设计和制造因素可能导致图像失真,因此需要通过标定方法(如张正友标定法)来减小系统误差。 如果您有特定需求或希望了解某一具体部分(如畸变校正或坐标变换细节),可进一步明确问题,我将为您提供更详细的解答。
四旋翼无人机受制于电池储能的约束,导致其航程和航行时间有限。 为了更好地满足无人机海上环境的作业需求,主流的解决方法有两种:一是增加 无人机的电池容量,从而延长无人机单次作业时长,然而,更大的电池不仅会增 加无人机的总重量和成本,还会进一步影响无人机的稳定性和操控性。另一种方 法是通过增加作业频次,来完成作业需求,这种解决方法会导致无人机需要进行 频繁的起降和电池更换或充电[1]。因此,为了解决续航时间短的问题,无人机自主 降落技术应运而生,这项技术允许无人机在任务完成或电池耗尽前,自主返航并 降落到指定位置,从而实现续航能力的延长和任务的连续性。通过自主降落,无 人机能更加高效地完成长时间、多任务的海洋作业,减少频繁的人为干预,提高 无人机作业的稳定性和可靠性。
基于视觉识别的船载无人机自主降落方法研究--任世委
本文在船载无人机自主降落技术中的创新点主要包括以下两个方面:
改进的 YOLOv8 目标检测算法 提出了一种基于改进 YOLOv8 算法的目标检测方法,通过优化 C2f 模块、特征融合模块以及引入小目标检测层,显著提升了在复杂海洋环境中对降落标识物的识别精度和鲁棒性。这些改进使得算法能够更好地应对海浪波动、目标遮挡等复杂环境因素,尤其在小目标检测方面表现突出。 多 ArUco 码组合的降落标识物设计 设计了一种内外层嵌套结构的多 ArUco 码组合降落标识物,利用冗余设计提高降落过程中的可靠性。外层标识负责高空引导,内层标识提供精准降落定位,即使在部分标识物因遮挡或倾斜而丢失的情况下,仍能确保无人机准确降落。这种设计有效应对了海浪波动引起的平台倾斜问题,提升了船载无人机在动态环境中的适应能力。 总结来看,这些创新点从目标检测算法和降落标识物设计两方面入手,共同提升了船载无人机在复杂海洋环境中的自主降落性能。
自动加紧结构的创新作用 防止无人机滑动或侧翻 自动加紧结构是一种机械夹紧装置,能够在无人机降落后自动抓紧无人机,从而避免因海浪波动或外部干扰导致的无人机滑动或侧翻风险58页。这一设计显著增强了降落后的安全性与稳定性,特别是在动态海洋环境中(5页)。 支持全流程安全降落 自动加紧结构不仅保障了无人机在降落瞬间的平稳固定,还为后续操作提供了可靠的基础。结合多 ArUco 标识物的设计,整个降落流程实现了从高空引导到最终稳定的闭环控制,进一步提升了系统的整体可靠性(58页)。
改进的YOLOv8算法通过多方面的优化显著提升了船载无人机在复杂海洋环境中的自主降落能力,具体体现在以下几个方面:
1. 改进C2f模块以增强特征提取能力 改进后的C2f模块通过引入RepViTBlock,结合轻量级Vision Transformers(ViTs)架构与卷积神经网络(CNN)的优点,提升了对复杂场景和多尺度目标的适应能力。RepViTBlock利用创新的特征混合策略和多分支设计,能够更高效地提取语义信息,减少计算资源需求。 此外,EMA(Efficient Multi-scale Attention)模块替代了传统的SE注意力机制,进一步增强了模型对多尺度特征的捕捉能力,同时降低了计算复杂度。这种改进使得模型能够在保持高检测精度的同时提升计算效率。 2. 改进特征融合模块以提升多尺度信息处理能力 针对传统特征融合模块在复杂背景和模糊特征下表现不足的问题,研究引入了自适应边界融合(ABF)模块,通过动态调整注意力权重降低计算开销,有效融合浅层特征的边缘信息和深层特征的语义信息。这种改进使网络在复杂背景下能够更精准地识别小目标,如降落标识物。 3. 添加小目标检测层以增强细节识别能力 在YOLOv8的结构中新增了小目标检测层,与ABF模块进行残差连接,进一步提升了对细粒度细节信息的保留能力。这一改进设计使得模型在复杂场景中能够更好地识别远距离或图像中小物体的目标,例如降落标志物。 4. 结合重检测机制提升鲁棒性 针对因目标遮挡、丢失或相机视角变化等问题可能导致的检测失败,研究在KCF算法基础上增加了重检测机制。当目标丢失时,系统会自动调用改进的YOLOv8算法重新检测目标,并更新KCF跟踪器模板,确保目标的持续跟踪。实验结果表明,该重检测机制在非水平状态和残缺状态下均表现出更高的识别精度和置信度。 5. 综合效果验证 实验结果表明,改进后的YOLOv8算法在自制数据集上的性能显著优于原算法和其他主流算法。例如,改进后的算法在mAP0.5值上达到了93.5%,比原算法提升了3个百分点;检测速度为128.2ms,在保持高精度的同时维持了较高的实时性。此外,针对实际应用场景,如降落标识物处于非水平状态或部分残缺的情况,改进算法表现出更强的鲁棒性和适应性。 综上所述,改进的YOLOv8算法通过优化特征提取、多尺度信息融合、小目标检测以及结合重检测机制,显著提升了船载无人机在复杂海洋环境中对降落标识物的识别精度和鲁棒性,从而增强了其自主降落能力。
C2f模块是YOLOv8算法中的核心组成部分之一,负责增强特征提取和特征聚合能力。它的设计不仅能够提高特征的表达能力,同时还能通过更高效的特征融合和压缩,减轻计算负担。 C2f模块首先通过一个卷积操作对输入的特征图进行处理,将输入通道数变为两倍。该卷积通常使用1×1的卷积核,目的是增加特征通道数,并为后续的特征提取做准备。接下来,经过第一个卷积层输出的特征图被一分为二,一部分特征图直接进入后续的拼接操作,而另一部分则传递给Bottleneck模块。这种分割机制使得一部分原始特征信息能够直接保留下来,与经过处理后的特征图共同参与最终的特征聚合。 在C2f模块中,分割后的特征图由多个Bottleneck模块逐层处理。每个Bottleneck模块由两个卷积层组成,并可以选择是否使用Shortcut(残差连接)。残差连接的目的是通过跳跃连接提高梯度的传播效果,从而缓解深层网络中的梯度消失问题。Bottleneck模块的任务是逐步提取更加复杂和高层次的特征,增强网络的表达能力。所有Bottleneck模块的输出特征图与之前分割的特征图被拼接在一起,形成一个新的特征图。这一步的作用是进行多尺度特征的聚合,使得模型能够同时捕捉到不同尺度的目标信息,从而提高目标检测的精度。最后,通过一个卷积操作对拼接后的特征图进行压缩,将通道数减小到目标输出通道数。这个卷积操作用于减少特征图的维度,以便后续的计算处理更加高效。 C2f模块通过将多个Bottleneck模块的输出特征图和原始的特征图拼接在一起,聚合了不同层次、不同尺度的特征信息。这有助于模型在处理复杂场景和多尺度目标时提高检测精度。C2f模块中的两个卷积操作(Conv1和Conv2)可以有效地对特征图进行压缩,减少计算量,同时保持或增强模型的特征表达能力。C2f模块的设计使得模型能够在计算效率和精度之间取得良好的平衡。
船载无人机自主降落过程中,视觉识别的关键步骤可以总结为以下几个阶段:
1. 高空初步识别阶段 在无人机执行完飞行任务后,首先通过GPS导航接收船只的GPS位置信息,确定返航的大致区域。在这一阶段,无人机依靠高空良好的GPS信号飞至船只正上方,并逐步下降到距离船体约15米的高度。此时视觉识别系统尚未完全介入,主要依赖GPS提供粗略定位。 2. 低空视觉识别与精确定位阶段 当无人机降至15米以下时,进入低空视觉识别阶段。此阶段的核心任务是通过改进的YOLOv8算法识别降落平台上的特定标识物(如ArUco码),并结合KCF跟踪器实时锁定目标。具体步骤如下: 目标检测:利用改进的YOLOv8算法对降落平台进行识别,尤其关注由多个ArUco码组合而成的降落标识物。这些标识物在复杂海洋环境中具有较高的鲁棒性和抗干扰能力。 动态优化:在识别过程中,无人机通过视觉算法实时检测降落平台的振荡、倾斜等非水平面状态,并动态调整自身的飞行姿态和位置,使其稳定在距离降落平台约3米的高度范围内。 目标跟踪:KCF算法负责持续跟踪目标,确保即便在降落平台因海浪波动而发生偏移的情况下,无人机仍能准确锁定降落点。 3. 降落确认阶段 在无人机接近降落平台的最后阶段,系统进入降落确认模式。这一阶段的主要任务包括: 最终位置校准:无人机悬停在降落平台上空,通过高精度的视觉识别算法确认降落标识的具体位置。例如,内层ArUco码的置信度通常达到0.8以上,确保识别的准确性。 安全着陆:当无人机接触到降落平台的感应片时,平台上的机械爪会自动激活并夹紧无人机,防止其因船只摇晃或风力影响而滑动或倾覆。 4. 重检测机制的应用 为了应对目标丢失、遮挡或残缺等复杂情况,系统引入了基于改进YOLOv8的重检测机制。当KCF跟踪器的置信度低于预设阈值(如0.7)时,系统会自动调用YOLOv8重新检测目标,并更新KCF跟踪器的模板。此外,每隔固定帧数(如30帧)强制调用YOLOv8进行目标检测,以修正可能产生的边界框漂移和尺寸误差。 总结 船载无人机自主降落过程中的视觉识别关键步骤包括: 高空GPS返航阶段,初步定位船体位置; 低空视觉识别阶段,通过改进YOLOv8和KCF算法实现精准定位与动态跟踪; 最终降落确认阶段,结合高置信度的视觉识别和机械装置确保安全着陆; 引入重检测机制,提高系统在复杂环境下的鲁棒性。 这些步骤共同保障了无人机在复杂海洋环境中的自主降落性能。
三阶段策略
1. 高空 GPS 返航阶段 在高空返航阶段,无人机通过 GPS 导航系统从远处返回到船体附近。此阶段主要解决 GPS 信号丢失的问题,确保无人机能够安全回到船体附近区域5页。 2. 低空视觉识别阶段 当无人机接近船体后,进入低空视觉识别阶段。在此阶段,无人机通过视觉跟踪算法识别并靠近船载平台的特定降落标志物15页。视觉识别算法(如改进的 YOLOv8)能够应对复杂背景和多尺度目标,显著提升了对降落标识物的检测精度与鲁棒性34页。 3. 最终着陆阶段 在最终着陆阶段,无人机进入降落程序。当无人机的中心与降落标志物的中心方向对准,并达到预设的垂直高度时,开始垂直下降。此阶段要求对平台的动态特性进行实时监控,若检测到水平偏差超过设定阈值,系统会自动停止下降并进行横向调整以重新对准目标。一旦偏差回到允许范围内,下降过程将继续,直到无人机安全接触平台并锁定电机,完成降落18页。 总结来看,三阶段策略结合了 GPS 导航、视觉识别技术和精准降落控制,确保无人机在复杂海洋环境中具备高稳定性和精确性24页。
总结:本文通过优化目标检测算法、设计新型降落标识物、改进降落平台结构,成功解决了船载无人机在复杂海洋环境中的自主降落问题。研究提出的改进 YOLOv8 算法、多 ArUco 码组合标识物和重检测机制等创新方案,为船载无人机的实际应用提供了重要的理论和技术支持。
1. 研究背景与目标 本文旨在解决船载无人机在复杂海洋环境中自主降落的问题,通过优化目标检测算法、设计新型降落标识物、以及改进降落平台结构,提升无人机在动态海况下的降落精度和可靠性。
2. 主要研究内容与成果 (1)三阶段降落策略与硬件选型 三阶段降落策略:包括高空 GPS 返航阶段、低空视觉识别阶段和最终着陆阶段,结合 GPS 导航和视觉识别技术,显著提高了降落的稳定性和精确性。 核心模块选型:选用 Jetson Orin Nano 作为计算单元(具备 40 TOPS 的算力),DF200-1080P 工业摄像头(支持高分辨率和广角视野),T-motor 2216 无刷电机和 T1045 自锁桨叶等高性能硬件,确保无人机在恶劣海洋环境中的稳定运行。 (2)改进 YOLOv8 算法的目标检测 在 YOLOv8 基础上进行了多项改进: 改进 C2f 模块:引入 RepViTBlock 替代 Bottleneck,增强特征提取能力,同时降低计算资源需求。 改进特征融合模块:采用自适应边界融合(ABF)模块,提升多尺度特征的融合效率。 新增小目标检测层:增强了对远距离或小型降落标识物的检测能力。 自制数据集用于训练和测试改进后的算法,实验结果表明,改进算法在平均精度(mAP)和召回率等方面均优于原算法。 (3)降落标识物设计与跟踪 多 ArUco 码组合标识物:设计内外层嵌套结构,外层提供高空引导,内层实现精准降落定位,冗余设计确保在部分遮挡或倾斜情况下的可靠识别。 KCF 跟踪与重检测机制:结合 KCF 算法设计重检测机制,在目标丢失时重新定位,显著提升了目标跟踪的鲁棒性和适应性。 (4)虚拟仿真与实机验证 搭建虚拟仿真环境,测试无人机自主降落性能,并进行单 ArUco 码和多 ArUco 码的实机对比实验,验证多 ArUco 码组合标识物的优越性。 实际船载环境中测试完整降落方案,证明系统的实用性和可靠性。
3. 创新点 改进 YOLOv8 算法:通过改进 C2f 模块、特征融合模块和小目标检测层,显著提升了降落标识物的检测精度和鲁棒性。 多 ArUco 码组合标识物:利用内外层嵌套结构和冗余设计,有效应对海浪波动和遮挡问题,确保降落过程的准确性和稳定性。 机械夹紧装置:设计具备自夹紧功能的船载降落平台,防止无人机因船体晃动或风力作用滑移或倾覆。
4. 展望未来研究方向 尽管本文取得了一定成果,但仍存在一些待优化的方向: 全自动化任务:增加快充装置或换电系统,解决续航限制问题,提升任务效率。 多模态传感器融合:引入激光雷达、热成像摄像头等传感器,进一步提升目标检测的鲁棒性,适应极端复杂环境。 扩展任务场景:增加任务载荷(如海洋监测设备),研究降落平台与无人机的互动技术,提升系统的综合应用能力。 实际工程应用:将研究成果应用于更广泛的实际场景,推动技术从实验室走向工程实践。