随着科技进步与安防巡检需求的增加,无人机在安防巡检领域的应用受到了广泛关注,并被广泛地应用于工厂、校园、企业等场景中
[1]。无人机通过搭载多功能传感器,能够执行视频监控
[2]、人员检测
[3]、目标跟踪
[4]等任务。特别是在室外环境中,相比于传统地面巡检方式,无人机能够更加高效地完成安防巡检工作。例如,在森林火灾的早期检测中,无人机能够在高空进行大范围的监测
[5];在校园安全保障工作中,无人机巡检系统能够迅速识别人群聚集情况
[6]。
然而,随着巡检任务复杂性的增加,对无人机系统的自主性要求也随之提高。目前,许多系统仍依赖遥控操作,缺少成熟的自主巡检技术。虽然Liang等
[7]通过在地面站对数据进行处理,减轻了机载计算机在目标跟踪中的计算压力,但这种方法有传输延迟,影响了系统的实时性。随着机载嵌入式系统计算能力的提升,集成计算机视觉功能的无人机开始受到研究者的重视。例如,通过嵌入式系统实现的相关滤波(kernelized correlation filters,KCF)算法
[8]、高效卷积运算(efficient convolution operators,ECO)
[9]等。Çintaş等
[10]提出了一种基于YOLO(you only look once)
[11]目标检测算法和KCF目标跟踪算法的嵌入式系统方案,实现了无人机在飞行中的自动目标检测和跟踪,但这些方法在精度和准确性上仍有待提高。随着专为深度学习而设计的模块化机载计算机的出现,无人机自主安防巡检成为可能。
在安防巡检无人机系统中,准确稳定的目标跟踪是完成任务的关键。由于传统的相关滤波器跟踪方法缺乏鲁棒的特征表示,导致跟踪结果不够准确。近年来,基于孪生网络(siamese network,SN)
[12]的跟踪算法因其在视觉跟踪的性能和效率之间取得了令人满意的平衡而受到广泛的关注。但在遇到干扰物或目标外观变化时,其跟踪效果会下降。为了克服这一缺点,Bhat等
[13]提出DiMP(discriminative model prediction)算法,通过引入判别式跟踪架构,充分地利用了目标和背景的外观信息,在有效处理外观变化的同时,极大提高了算法的跟踪性能。同时,DiMP采用最速梯度下降法对模型进行优化,克服了计算资源限制,在无人机平台上实现了深度学习跟踪算法的应用。鉴于DiMP目标跟踪方法在速度和精度上的优势,其改进方法不断涌现。Danelljan等
[14]提出了PrDiMP算法,从概率回归公式的角度提高了目标分类器的判别能力,在处理复杂场景和目标遮挡时取得了较好的结果。但基于DiMP跟踪方法目标分类器仅使用来自预训练模型骨干网络中的单层特征,导致其区分目标的能力有限,难以用于图像细节的提取。针对此问题,Wang等
[15]将Transformer架构应用到了跟踪领域,提出TrDiMP算法,该算法通过结合不同帧之间的信息来获取更丰富的语义信息,从而提高了跟踪精度。但TrDiMP算法训练和推理时间的增加使其难以在嵌入式机载电脑上实时运行,这在无人机自主跟踪任务中是一个显著的缺点。
本文基于DiMP算法和装有嵌入式机载计算机的无人机平台设计了一套视觉无人机安防巡检系统,实现了无人机的自主控制和目标跟踪功能,提高了巡检效率和准确性。同时,针对实际巡检过程中无人机视角下目标偏小导致的跟踪失败的问题,在DiMP跟踪算法的基础上进一步构建了图像金字塔结构。通过浅层网络提取不同分辨率下的语义信息,增强了网络对小目标特征的提取能力,在保证跟踪速度的基础上,提高了算法在实际应用中跟踪小目标的准确性。最后,经过实验验证,改进后的跟踪算法在室外环境中展现了卓越的跟踪性能,为安防巡检系统提供了切实可行的方案。