• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于改进YOLOv12 算法的智能烟雾预警系统应用研究

刘 坤
  
大通媒体号
2025年94期
苏州健雄职业技术学院 人工智能学院 江苏太仓 215411

摘要 : 本文针对 YOLOv 系列最新算法 YOLOv12 进行深入研究,该算法通过引入注意力模块和残差高效层聚合网络,精简了框架设计优化训练管道,提高算法推理速度,提升检测精度。在此基础上,结合火焰和烟雾实时预警要求,对 YOLOv12 算法进行改进,设计基于双路特征融合机制和动态误报过滤模块,增强系统烟雾特征提取能力,有效降低干扰物影响,为城市工业区、森林荒地等火焰预警提供可靠解决方案。

关键词:YOLOv12 算法、火焰预警、注意力机制

中图分类号:G641.0

文献标识码:A

1. 引言

2021-2023 年上半年,火灾造成的直接财产损失约 178.5 亿元;2024 年全国共接报火灾90.8 万起,死亡人数2001 人、受伤人数2665 人,直接财产损失 77.4 亿元。传统的火焰和烟雾报警都是基于传感器判断烟雾浓度达到一定数值或者温度上升到某个特定值才会触发报警器报警,这就不可避免地造成报警时间较长的问题,而采用基于目标检测技术检测火灾的方法是火灾报警有效方式之一。随着 YOLO 算法不断更新迭代,最新的 YOLOv12 算法除了继承前代产品的优点,同时引入一些关键技术,大大降低误报率和延时,因此特别适合于火焰和烟雾报警系统。本文主要研究YOLO 目标检测算法在火焰检测中的应用。

2.YOLOv12 框架研究

YOLOv12以区域注意力模块(A2)、残差高效层聚合网络(R-ELAN)为主题创设出一整套的实时检测方法 , 并且在 COCO 数据集上实现55.8% mAP(50-95),相对于YOLOv10 提升 2.1% ,推理延迟保持在6.8ms(T4 GPU)。YOLOv12 的突破性创新在于利用注意力机制,解决传统实时检测的需求,与之前模型算法对比如图1 所示。

图 1 YOLOv12 与历代版本的性能基准测试 Figure 1: Benchmarking YOLOv12 Against Previous Versions [1]

YOLOv12 标志着实时物体检测领域的开创性进步,通过整合以注意力为中心的机制、精简的架构设计和优化的训练管道,实现了模式的转变。在前代产品奠定的坚实基础上,YOLOv12完成以下优化和改进。

2.1 全局注意力用区域注意力模块替代

传统全局注意力的计算复杂度为 (L2d)Intet(d=256,d).L2=0(L2.d) ,因此导致产生延时较大。YOLOv12 提出的 A2 模块将特征图划分为垂直或水平区域,仅在局部区域内计算注意力,将计算量大大降低。该方法将计算成本降至 O(½n²h,保留了超过 75% 以上的感受野,特别是能很好地解决小目标的检测问题。

2.2. 残差高效层聚合网络设计

基于原 ELAN 架构,R-ELAN 采取两方面的关键改进,即增加块级残差设计,在残差连接中引入 0.01 缩放因子,稳定残差连接,从而提升 YOLOv12-X 等大模型训练时的收敛速度;在保持特征融合能力的前提下,减少网络参数,采用“转换层 1×1 卷积→区域注意力→残差连接”的特征聚合方法,在降低参数量的同时保留特征整合能力。实验表明,该结构使模型在遮挡场景下的检测鲁棒性提高 18% ,但依旧保留着很好地检测精度。

2.3 计算效率优化

YOLOv12 增加一系列的改动,在尽可能保证精度的同时尽量提高计算量,并将新的核心设计理念放在重塑 YOLO 结构上,使用图 2 所示剩余高效层聚合网络(R-ELAN)、FlashAttention 和 7x7 可分离卷积,使得 YOLOv12 有着极高的吞吐量和精度,在此基础上保证了 YOLOv12针对图像中的物体检测和实例分割的优良效果,让 YOLO12 可以有效地应对复杂的视觉场景中的细节不同的复杂图像或者部分被遮挡的情况。

图2 残差式高效层聚合网络结构图 [2]

Figure 2: Residual Efficient Layer Aggregation Network as presented in paper [2]

3.YOLOv12 算法在智能烟火预警系统应用研究

近些年,基于深度学习的目标检测技术快速发展,在火焰检测过程中不仅要检测到图片中的目标还要兼顾实时性。对于这一问题,王国睿等人 [3] 提出了基于 Transformer 改进 YOLOv4[4] 的火灾检测算法,而 Li 等 15] 基于 YOLOv4 主干网络改进 MobileNetv3,提出 YOLO-Edge火焰检测算法并有效减小了模型所占内存大小,实现良好轻量化效果。皱辉军等 [5] 提出了基于 YOLO5s 改进的轻量级识别网络,并尝试将火焰模型部署到嵌入式设备上。此外,吴舒健等 [6] 提出一种基于改进YOLOv5 的视频火灾检测方法,在 YOLOv5 的 SPP 模块中引入空洞卷积模块,提高了特征提取能力以及小尺度目标的检测能力,达到在火灾初期检测出小范围火苗的目的 [7]。

图3 改进的YOLOv12 烟雾预警系统架构 Figure3. Improved YOLOv12 Smoke Warning System Architecture

为了提高火灾预警等应用场景下的火焰检测的实时性,针对烟雾检测任务而言,需要解决这样几个问题,一个是烟雾形态存在多样性,烟雾是半透明状态且有不规则扩散特点,烟雾在空气中的位置、形状、大小、色彩、密度等均有可能发生转变,不能简单使用边界框对烟雾做标定,二是存在明显的工作现场黑烟或者白烟的特点,所有要求模型具有多模态特性,三是干扰物相似性大,很多物体都与烟火特征相似度很高,比如红色灯光、飘动的白色塑料布等。此外,对系统的实时性要求很高,如果火势蔓延的速度很快,可能导致灾难性的后果,火情检测系统要在 20ms 内做出响应。

为了使 YOLOv12 算法和模型更适合烟雾预警系统,本文针对YOLOv12 算法提出三个方面的改进,其改进后 YOLOv12 系统架构如图3 所示。

3.1 双路特征融合机制

基于烟雾半透明和动态扩展模式,传统单一路特征提取并不能准确地反应其本质特征。本文在 YOLOv12 的 R-ELAN 基础上增加双支路特征融合,通道增强支路加入频域特征提取模块,将 RGB 图像快速傅里叶变换 (FFT) 为频域,提取低频能量分布,一般情况下烟雾区域的低频能量占比大于 85% ,且具有高频边缘衰减特性;由于烟雾边界模糊而导致高频分量降低 40%~60% ,支路使用 1×1 卷积降低通道至原来的 1/4,可大大减少计算量。加入空间感知支路,在保证原有的空间信息的基础上,加入运动轨迹增强模块,利用连续帧之间光流息获取烟雾扩散向量场。运用卡尔曼滤波预测烟雾扩散趋势,加强对慢速扩散烟雾的敏感度。

3.2 动态误报过滤

采用级联过滤方式降低红色灯光、云朵等干扰物的误报率,在静态干扰过滤中,建立干扰物原型库 ( 含灯光、云朵、移动塑料布等 ),通过相似度度量网络计算检测框和原型库的余弦相似度。当相似度大于 Θ=0.7 时,则抑制此检测框;使用轻量化的 MobileNetV3 实现,计算开销仅增加约 0.8ms . 动态行为分析。由于烟雾不同于一般频率的固定频率移动物体(如风扇),故其具有一种扩散性的持续的增大的趋势。为了能够捕捉这样的变化,本文给出采用计算检出框的重心运动轨迹方案,用 LSTM 网络来进行检测框的方向性一致性判断。假如真实烟雾的话,它的垂直位移比高于 80% ,而干扰物则一般不会存在这种现象。通过设置连续 3 帧的确认阈值,即在连续 3 帧的目标均稳定检测到了目标时(即框坐标 IOU>0.6),才触发报警。这种方式可以将误报率由原来的 4.3% 降为 1.1% ,同时仅有 0.9% 的召回率低。

3.3 轻量化部署策略

对于边缘设备资源限制的问题,在此采用了三阶段优化策略。

(1)模型量化用的是混合精度量化方式 (FP16+INT8),把YOLOv12-S 的参数量压缩到了原来的 1/3.5 左右,从原来的 15.2MB 压缩到了现在的 4.3MB, 在 JetsonNX 上测得,精度下降只有 0.4% ,但是推理速度却提升了 2.1 倍。

(2)区域裁剪加速。以背景建模方式来构建动态感兴趣的区域(ROI)只需要检测变化部分,在系统中将背景图像与实时帧差分后获取运动前景,并将其送入检测网络中计算,可降低 3/5 的计算量。

(3)分布式架构,前端摄像头运行轻量级检测模型,产生可疑区域后上传至云端执行高精度模型 YOLOv12x 验证,该方案在森林防火中实现 100% 区域覆盖,召回率达 90% 。

4. 总结

本文着重介绍了 YOLOv12 算法的结构和它的突破性创新之处,并根据烟雾预警任务的特点和场所的要求,对 该算法进行了改进,在采用双路特征融合的基础上,利用频域能力分布与运动轨迹相结合的方式,解决了烟雾半透明造成的特征模糊的问题;设计了级联式的过滤流程,应用干扰物原型库和动态行为分析的方法,降低了红色灯光等干扰物造成误触发的概率;并对动态误报的过滤以及轻量化部署手段的运用提升了复杂环境下的检出率。为了让烟雾预警更加精准,将来还可以加入红外、热成像数据进行检测;开发出无监督域适应算法;加入 3D 扩散建模,集合物理仿真模型预测烟雾扩散路线,根据实际情况动态调整个别相机点监控位置,通过这种方式起到预警的目的是目前行业内较为领先的方式之一。

参考文献:

[1] Yunjie Tian, Qixiang Ye, and David Doermann. Yolov12:Attention-centric real-time object detectors, 2025.

[2] Mujadded Al Rabbani Alif* and Muhammad Hussain.YOLOV12: A BREAKDOWN OF THE KEY ARCHITECTURAL FEATURES,2025.

[3] 王国睿 . 基于 Transformer 改进 YOLO v4 的火灾检测方法 . 智能计算机与应用 . 2021, 11(7):5.

[4] A. Bochkovskiy, C. Y. Wang, H. Y. M. Liao, YOLOv4:Optimal Speed and Accuracy of Object Detection. arXivpreprint : 10934.2020, 2004.

[5] Li. W, Yu. Z. A Lightweight Convolutional Neural Network Flame Detection Algorithm. 2021 IEEE 11th International Conference on Electronics Information and Emergency Communication (ICEIEC). IEEE,2021, 8386 .

[6] 邹辉军 , 焦良葆 , 孟琳 , 张智坚 , 赵维科 . 基于 CG-yolo 的烟火检测 . 计算机与数字工程 . 2022, 50(01): 206~212.

[7]Wu. Z, Xue. R, Li. H. Real-Time Video Fire Detectionvia Modified YOLOv5 Network Model. Fire Technology, 2022:127 白亚忠,基于轻量化 YOLO 模型的火焰检测方法研究与应用 [M] 工程硕士学位论文, 延边大学电子信息(计算机技术领域).

作者简介:刘坤 (1979-), 女 , 汉 , 湖北黄陂人 , 苏州健雄职业技术学院人工智能学院,副教授 , 硕士研究生 , 研究方向:信息安全、网络安全。

基金项目:苏州健雄职业技术学院校级内涵建设项目《产教融合背景下工作手册式教材建设路径研究 - 以《信息安全技术与实施综合实训》课程为例》阶段性研究成果。苏州健雄职业技术学院 2024-2025学年第二学期教师下企业阶段性研究成果。

*本文暂不支持打印功能

monitor