民用航空与安全工程

复杂背景下基于改进YOLOv8n的隧道火灾检测算法

  • 曲娜 ,
  • 张晗 ,
  • 时尚 ,
  • 魏文龙
展开
  • 沈阳航空航天大学 安全工程学院,沈阳 110136

曲娜(1979—),女,辽宁营口人,副教授,博士,主要研究方向为火灾检测、风险评估,E-mail:

收稿日期: 2024-12-19

  修回日期: 2025-03-30

  录用日期: 2025-04-01

  网络出版日期: 2025-12-25

基金资助

国家自然科学基金(61901283)

辽宁省自然科学基金(2023-MS-241)

Tunnel fire detection algorithm based on improved YOLOv8n under complex background

  • Na QU ,
  • Han ZHANG ,
  • Shang SHI ,
  • Wenlong WEI
Expand
  • College of Safety Engineering,Shenyang Aerospace University,Shenyang 110136,China

Received date: 2024-12-19

  Revised date: 2025-03-30

  Accepted date: 2025-04-01

  Online published: 2025-12-25

摘要

为解决因隧道背景复杂性而造成的隧道火灾检测误检率较高的问题,基于YOLOv8n网络模型,提出改进的隧道火灾检测算法。首先,在主干网络部分,采用FasterNet网络进行替换并保留原有的SPPF模块,实现更全面的特征提取;其次,为了提高模型在复杂背景下对不规则目标的检测精度,在C2f模块中引入D-LKA注意力机制;最后,引入Focaler-IoU优化模型损失函数,进一步降低了干扰物导致的误检或漏检问题。实验结果表明,相较于YOLOv5、YOLOv7和YOLOv8n原模型,改进后的模型准确率分别提高了7.6%、5.6%和3.5%,平均准确率均值分别提升了8.3%、7.7%和5.1%,相比于其他基于YOLOv8n的改进算法,模型的平均准确率均值分别提升了3.3%、6.4%。

本文引用格式

曲娜 , 张晗 , 时尚 , 魏文龙 . 复杂背景下基于改进YOLOv8n的隧道火灾检测算法[J]. 沈阳航空航天大学学报, 2025 , 42(6) : 71 -77 . DOI: 10.3969/j.issn.2095-1248.2025.06.009

Abstract

To solve the problem of high false detection rates in tunnel fire detection caused by the complexity of tunnel environments based on the YOLOv8n network model, an improved tunnel fire detection algorithm was proposed.First, in the backbone network, the FasterNet network was used for replacement while retaining the original SPPF module to achieve more comprehensive feature extraction; Secondly, in order to improve the detection accuracy of the model for irregular targets in the complex background, the D-LKA attention mechanism was introduced in the C2f module; Finally, Focaler-IoU to optimize the model loss function was introduced, which further reducing the problem of false positives or false negatives caused by distractors. The experimental results show that compared with YOLOv5, YOLOv7 and the original models of YOLOv8n, the accuracy of the improved model is increased by 7.6%, 5.6%, and 3.5% respectively, and the average accuracy means are increased by 8.3%, 7.7%, and 5.1% respectively. Compared with other YOLOv8n-based improved algorithms, the mean average precision of our proposed model is increased by 3.3% and 6.4% respectively.

近年来,随着经济的高速发展,我国在隧道建设方面投入了大量资源。由于隧道空间长而狭小、密闭性强,一旦发生火灾,就会导致救援难度大、人员无法疏散的问题,造成人员伤亡及大量财产损失。
早期学者大多基于图像处理,提取火焰和烟雾的特征信息,结合分类器实现火灾检测与分类1-3。相较于传统的图像处理,深度学习对复杂环境的适应度更高,Cao等4采用RNN循环神经网络,并针对其长短期记忆网络提出了ABi-LSTM注意力增强双向长短期记忆网络,在多个场景下均取得了较好的准确率。Barmpoutis等5将Faster R-CNN与多维纹理分析相结合,得到很高的火焰检测精度。针对火灾检测在复杂背景下的难点,刘楠6采用了一种基于加权灰度熵差的背景建模方法,对图像进行分区域曝光,精准实现火灾识别。但由于以上网络结构复杂,检测速度慢,众多学者开始关注YOLO系列模型。张彬彬等7提出在YOLOv3网络中加入卷积模块,并改进注意力机制和损失函数,提高了难识别目标的检测精度。马庆禄等8在YOLOv5中加入卷积注意力模块并改进损失函数,有效地解决了公路隧道烟火混淆而不易识别的问题。余伟朝9提出了CBS + YOLOv5s算法,降低厂房火灾中复杂背景对目标的干扰,有效改善不同厂房环境下因复杂背景造成的漏检情况。
基于以上研究,为减少复杂背景下隧道火灾的误检,本文在YOLOv8n的基础上引入了快速特征提取网络FasterNet,采用可变形大核注意力D-LKA融合部分C2f模块,并利用Focaler-IoU替换原模型的损失函数,提高了模型在复杂背景下的检测性能。

1 数据预处理

1.1 隧道火灾复杂性分析

在进行隧道火灾检测时,背景环境比较复杂,往往存在一定的干扰,一是烟雾干扰物,在昏暗光线的影响下隧道内墙壁易与烟雾发生混淆,部分环境较差或施工中的隧道产生的粉尘及喷洒系统产生的水雾也与烟雾较相似;二是火焰干扰物,有些车灯光线较强,且隧道内存在大量照明灯光、红绿灯及指示灯牌等也易被误检为火焰;三是车辆与隧道内临时存放的施工设备及隧道本身固定的结构物会对火灾区域形成遮挡,也会加大隧道火灾的检测难度。

1.2 实验配置

本文所使用的实验配置环境为:CPU为Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz 2.21 GHz;GPU为Nvidia GeForce GTX 1050 Ti;操作系统为window10;编程语言为Python3.8;深度学习平台为PyTorchv1.10;训练和预测模型采用Ultralytics公司的YOLOv8n;训练选用轮次为150。

1.3 实验数据集

本文通过上网搜集及隧道火灾视频截取采集图片等方式,建立了一个隧道火灾烟雾数据集。为增强数据集训练效果,分别随机对20%的图像进行图像翻转、对比度增强、裁剪平移、亮度调节等数据增强技术。为了适应各种不同的场景,还补充了一部分随机场景下的火灾图像。另外,为了降低复杂背景对模型造成的影响,选取了与火焰、烟雾易混淆的物体图像,单独分为其他类。本数据集共计10 335张图片,包含火焰、烟雾及其他3类目标,按8∶2的比例划分训练集和测试集,其中训练集8 268张、测试集2 067张。

2 YOLOv8n算法模型与改进

2.1 YOLOv8n模型

YOLOv8是Ultralytics公司推出的一种高精度目标检测算法,在图像分类、目标检测和实例分割等方面均具有良好表现,YOLOv8模型结构如图1所示,其主要组成结构包括Backbone、Neck和Head。
图1 YOLOv8模型结构
YOLOv8n是YOLO系列中最轻量的模型,具有较快的处理速度,但其精度还有待提升,故本文采用目标检测算法YOLOv8n模型进行隧道火灾检测实验,并在此基础上加以改进,实现检测速度更快、稳定性更高、检测精度更高的目标。

2.2 FasterNet快速特征提取网络

本文采用基于部分卷积(partial convolution,PConv)的FasterNet模型对YOLOv8n原主干网络进行替换,解决了原CSPDarknet网络卷积层过多、计算冗余的缺陷。FasterNet模型是Chen等10提出的一种轻量化网络,本文在FasterNet的基础上保留了原主干网络中的空间池化金字塔部分,以此保证本文网络自适应的输出。
FasterNet Block模块是FasterNet网络模型中的主要特征提取模块,其中的PConv仅对一部分通道应用常规卷积以进行特征的提取,而其他通道保持不变。由于通道数的减少,模型参数量随之降低,特征提取过程中的计算量也得以减少,Conv、PConv的浮点运算数(floating point operations per second,FLOPs)如式(1)所示。
F L O P s C o n v = h w k 2 c 2 F L O P s P C o n v = h w k 2 c p 2
式中:h、w分别为图像的长和宽;k为卷积核的大小;c为常规卷积通道数;cp 为局部卷积的通道数。基于PConv构建的FasterNet网络结构不仅有效地降低了模型计算量,提高运行速度,更保留了特征信息的完整性,保证了模型运行的精度,提高了模型的整体性能,从而实现了更有效的目标检测11

2.3 可变形大核注意力

可变形大核注意力12(deformable large kernel attention,D-LKA)最早作为一种用于医学图像分割的有效注意力机制而被提出,采用大卷积核并结合可变形卷积,有效提升了模型对小目标和不规则形状目标的检测能力,尤其对复杂背景或不同光照条件下的目标检测具有突出效果。因此,本文将D-LKA机制融入C2f模块13,进一步强化了在复杂或昏暗背景下模型对火焰及烟雾的检测能力,性能有所提升。
在D-LKA模块中,大卷积核和可变形卷积有效结合,提高了模型对复杂图像的适应性,该模块由多个卷积层构成,其架构如图2所示。除2D卷积层和可变形卷积层之外,还采用了激活函数GELU,用来增强非线性。总的来说,D-LKA注意力机制动态调整卷积核,并结合大核卷积获取了更多目标特征,有效抑制了复杂背景中的噪声,减少了背景干扰,更好地适用于复杂的火灾检测。
图2 D-LKA模块架构

2.4 Focaler-IoU损失函数

对于目标检测任务来说,对损失函数进行改进是提高目标检测精度的有效途径。本文采用Focaler-IoU14替代原损失函数,通过线性区间映射的方式重构模型IoU损失,提升检测器性能,以使模型在不同的检测任务中得到较好的精度。Focaler-IoU以其独特的方法弥补了现有损失函数在边界框回归方面存在的不足,进一步提高了模型的检测性能15
Focaler-IoU主要通过交并比(intersection over union,IoU)的值来调整损失,其定义如式(2)所示。
I o U f o c a l e r = 0 , I o U < d I o U - d u - d , d I o U u 1 , I o U > u
式中:u、d分别为上、下限阈值。当交并比的值在下限阈值和上限阈值之间,损失呈线性递增的函数。在隧道火灾检测中,易被分类为火焰或烟雾的负样本众多,Focaler-IoU有效降低了负样本的权重,避免了背景干扰物对火灾检测的影响,使检测正样本的精度得以提高。同时由于Focaler-IoU优化直接作用于预测框与真实框之间的重叠度,能够精准检测大规模的火焰和小规模的火花,对于遮挡条件下的火灾仍能保持较好的检测性能。

2.5 网络整体结构

本文从以上3个角度对模型进行改进,首先,引入结构更简单的FasterNet网络替换计算量相对较大的CSPDarknet网络;其次,在Neck部分的C2f模块中引入可变形大核注意力机制,得到一个新的C2f_D-LKA模块;最后,采用Focaler-IoU替换原网络的CIoU损失函数。改进后的模型结构如图3所示。
图3 改进后的模型结构

3 实验结果与分析

3.1 评价指标

为了验证改进后的模型的有效性,本文采用了目前在目标检测领域比较常用的评价指标进行数据对比,包括准确率(P)、召回率(R)、平均准确率(AP)、平均准确率均值(mAP),以上指标如公式(3)—(6)所示。
P = T P T P + F P
R = T P T P + F N
A P = 0 1 P R d R
m A P = 1 C i = 1 C A P i
式中:TP为模型将正例样本正确地预测为正例的数量;FP为模型将负例样本错误地预测为正例的数量;FN为模型将正例样本错误地预测为负例的数量;C为输入样本类别的数量。

3.2 消融实验

为验证本文提出的各项改进方案对网络模型检测性能的提升效果,进行了消融实验,详细分析FasterNet、D-LKA和Focaler-IoU的可行性和有效性,消融实验结果如表1所示。
表1 消融实验结果 (%)
FasterNet D-LKA Focaler-IoU P R mAP@0.5
× × × 61.7 52.4 57.3
× × 65.9 55.2 60.9
× × 61.8 53.0 57.7
× × 61.3 54.4 58.2
65.2 56.5 62.4
实验结果表示,相比于YOLOv8n原模型,单独采用FasterNet、D-LKA及Focaler-IoU时,模型的准确率分别提升4.2%、0.1%及降低0.4%,召回率分别提升2.8%、0.6%、2%,平均精确率均值分别提升3.6%、0.4%及0.9%;同时将3个改进方案引入时,改进后的模型准确率提升了3.5%,召回率提升了4.1%,平均准确率均值提高了5.1%,各评价指标比起原YOLOv8模型均有大幅提高,本改进方案优化效果显著。
为了进一步验证模型的可行性,本文对所有类别进行更详细的分析,各类别实验结果如表2所示。在3种改进方案分别单独融合后,火焰样本的平均准确率分别提升了1.9%、0.4%和0.9%,烟雾样本的平均准确率分别提高了3.7%、0.8%和1.3%,而其他样本的平均准确率则分别提高了5.0%、降低了0.2%、提高了0.5%。本模型同时将3种改进方案融入原网络模型,改进后的模型mAP提高了5.1%,对火焰、烟雾的平均准确率分别提高了3.0%、5.4%,均大幅度高于原始模型和单独改进模型,另外,改进后的模型对其他样本的平均准确率提高了6.8%,有效地验证了改进模型的负样本识别性能,减少了复杂背景对隧道火灾检测的干扰。
表2 各类别实验结果 (%)
FasterNet D-LKA Focaler-IoU mAP AP fire AP smoke AP other
× × × 57.3 73.1 57.5 41.5
× × 60.9 75.0 61.2 46.5
× × 57.7 73.5 58.3 41.3
× × 58.2 74.0 58.8 42.0
62.4 76.1 62.9 48.3

3.3 对比试验

为验证本文算法与其他算法相比的优越性,本文与YOLOv5、YOLOv7及其他改进算法进行检测性能的比较,其中,改进算法116在主干网络中引入DCN_C2f模块及SC-SA注意力模块,并采用WIoU机制以增强检测性能;改进算法217引入CA注意力机制,采用MPDIoU替换原损失函数,同其他算法对比实验结果如表3所示。
表3 同其他算法对比实验结果 (%)
算法 P R mAP@0.5
YOLOv5 57.6 51.3 54.1
YOLOv7 59.6 50.0 54.7
YOLOv8n 61.7 52.4 57.3
改进算法1 62.5 53.1 59.1
改进算法2 63.3 54.3 56.0
本文算法 65.2 56.5 62.4
表3中数据可知,相较于之前的版本,YOLOv8n的准确率、召回率和平均准确率有所提高,相比于YOLOv8n原模型,改进算法1的各项指标有所提高,改进算法2的准确率、召回率有一定提升,但平均准确率均值表现不佳,而本文改进后的算法比YOLOv8n原网络模型及改进算法的三项评价指标均有进一步提高。

3.4 结果可视化分析

为了更直观地验证本文改进模型的检测性能,本文对改进前后的预测结果图进行对比分析,结果分别如图45所示。从图4a和图5a的比较可以看出,原模型并没有检测到图中的烟雾目标,存在漏检的情况;从图4b和图5b的比较可得,改进后的模型检测范围更加全面,可以识别地面上被原模型漏检的小型火焰;从图4c和图5c的对比能够看出,原模型存在重复的情况,改进模型将其整合,得到的检测目标更加准确。
图4 YOLOv8n预测结果
图5 本文算法预测结果

4 结论

为了解决隧道这类复杂场景中难以进行火灾检测的问题,本文提出一种在YOLOv8n模型上加以改进的隧道火灾检测算法模型,以FasterNet替换主干网络,将D-LKA引入C2f模块,同时采用Focaler-IoU优化网络损失,进一步提高复杂背景下的目标检测性能。由实验数据可知,本文改进后的模型平均准确率均值相较于YOLOv5、YOLOv7分别提高了8.3%、7.7%;相较于基于YOLOv8的其他改进算法分别提升了3.3%、6.4%;相较于YOLOv8n原始模型提升了5.1%,其中,对火焰、烟雾和其他样本的平均准确率分别提高3.0%、5.4%、6.8%,这充分表明本文采用的改进方法不仅对模型整体性能有较大的提高,对各类目标的检测能力也有较大的提升。在后续的研究中,将进一步补充隧道火焰及烟雾样本,同时进一步加以轻量化,使模型在提升精度的同时,降低模型参数量,缩短检测时间。
[1]
Chen T H Wu P H Chiou Y C.An early fire-detection method based on image processing[C]//2004 International Conference on Image Processing,Singapore:IEEE,2004:1707-1710.

[2]
Celik T Demirel H Ozkaramanli H,et al.Fire detection using statistical color model in video sequences[J].Journal of Visual Communication and Image Representation200718(2):176-185.

[3]
肖潇,孔凡芝,刘金华.基于动静态特征的监控视频火灾检测算法[J].计算机科学201946(S1):284-286,299.

[4]
Cao Y C Yang F Tang Q F,et al.An attention enhanced bidirectional LSTM for early forest fire smoke recognition[J].IEEE Access20197:154732-154742.

[5]
Barmpoutis P Dimitropoulos K Kaza K,et al.Fire detection from images using faster R-CNN and multidimensional texture analysis[C]//ICASSP 2019-2019 IEEE International Conference on Acoustics,Speech and Signal Processing.Brighton:IEEE,2019:8301-8305.

[6]
刘楠.基于3D卷积神经网络的复杂场景火灾识别算法的研究[D].天津:天津科技大学,2019.

[7]
张彬彬,帕孜来·马合木提.基于YOLOv3改进的火焰目标检测算法[J].激光与光电子学进展202158(24):289-296.

[8]
马庆禄,鲁佳萍,唐小垚,等.改进YOLOv5s的公路隧道烟火检测方法[J].浙江大学学报(工学版)202357(4):784-794,813.

[9]
余伟朝.基于深度学习的厂房火灾预警方法研究[D].西安:西安石油大学,2023.

[10]
Chen J R Kao S H He H,et al.Run,don’t walk:chasing higher FLOPS for faster neural networks[C]//2023 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Vancouver:IEEE,2023:12021-12031.

[11]
高民,陈高华,古佳欣,等.FLM-YOLOv8:一种轻量级的口罩佩戴检测算法[J].计算机工程与应用202460(17):203-215.

[12]
Azad R Niggemeier L Hüttemann M,et al.Beyond self-attention:deformable large kernel attention for medical image segmentation[C]//2024 IEEE/CVF Winter Conference on Applications of Computer Vision.Waikoloa:IEEE,2024:1276-1286.

[13]
伍济钢,周刘洋,曾嘉,等.基于IRS-YOLO的内河船舶检测识别方法[J].光电子·激光202536(8):848-856.

[14]
Zhang H Zhang S. Focaler-IoU: more focused intersection over union loss[EB/OL]. (2024-01-19)[2024-05-11].

[15]
齐欣,王军,王广义,等. 复杂条件下水表识别算法研究与实现[J/OL]. 小型微型计算机系统1-9.(2024-07-30)[2024-08-20].

[16]
Shen L Y Lang B H Song Z X.DS-YOLOv8-based object detection method for remote sensing images[J].IEEE Access202311:125122-125137.

[17]
王成健,徐振平,文汉云.改进YOLOv8的果园葡萄检测算法[J].现代计算机202430(12):8-12,18.

文章导航

/