• 收藏
  • 加入书签
添加成功
收藏成功
分享

基于改进YOLOv8 的复杂场景下小目标实时检测算法研究

李博傲
  
西部文化媒体号
2022年99期
唐山学院

摘要:针对复杂场景(如雾天、夜间、密集遮挡环境)中小目标检测精度低、实时性不足的问题,本文提出一种改进 YOLOv8 算法。通过引入动态注意力机制增强小目标特征权重,结合多尺度特征融合优化模块提升特征表达能力,并采用轻量化卷积结构平衡检测精度与速度。实验结果表明,改进算法在公开数据集及实际复杂场景测试中,小目标检测平均精度(mAP)较原 YOLOv8 提升 4.2% ,帧率保持在 30FPS 以上,满足实时检测需求,为复杂场景下小目标检测提供了有效解决方案。

关键词:小目标检测;YOLOv8;复杂场景;动态注意力;多尺度特征融合;实时检测

1. 引言

随着计算机视觉技术的发展,目标检测在智能监控、自动驾驶、无人机巡检等领域应用广泛。小目标(如远距离行人、低空无人机、小型零部件)因像素占比低、特征信息少,在复杂场景中易受光照变化、背景干扰及遮挡影响,检测难度显著增加。

YOLOv8 作为当前主流的单阶段检测算法,凭借高效的特征提取能力和实时性优势被广泛使用,但在小目标检测任务中仍存在不足:其一,主干网络对小目标弱特征的提取能力有限;其二,多尺度融合过程中,小目标特征易被大目标特征稀释;其三,复杂场景下的噪声干扰进一步降低检测稳定性。

为此,本文针对 YOLOv8 的网络结构和特征处理流程进行改进,重点强化小目标特征的提取与保留,同时保证算法实时性,最终实现复杂场景下小目标的精准、快速检测。

2. 相关技术与改进思路

2.1 YOLOv8 原理解析

YOLOv8 采用 CSPDarknet 作为主干特征提取网络,通过 Backbone层提取图像多尺度特征,经Neck 层(PAN-FPN 结构)进行特征融合,最终由 Head 层输出目标类别和位置信息。其核心优势在于通过“特征金字塔 + 路径聚合”实现多尺度目标覆盖,但针对小目标,仍存在低层级特征(小目标主要特征所在)权重不足、融合效率低的问题。

2.2 改进方向

针对复杂场景小目标检测痛点,本文从三方面改进:

1. 动态注意力机制嵌入:在 Backbone 输出的低层级特征图(小目标特征集中层)添加动态注意力模块,通过自适应计算特征图中每个像素的权重,增强小目标区域特征,抑制背景噪声。该模块通过轻量级卷积生成注意力掩码,仅增加约 2% 的计算量。

2. 多尺度特征融合优化:优化 Neck 层的 PAN-FPN 结构,在原有上下采样融合基础上,增加“小目标特征增强分支”——将低层级特征( 160×160 分辨率)与中层特征( 80×80 )进行二次融合,通过跳跃连接保留更多小目标细节,并采用可变形卷积适应目标形变。

3. 轻量化结构设计:在 Head 层检测分支中,将部分普通卷积替换为深度可分离卷积,减少参数数量;同时简化非小目标检测分支的计算复杂度,优先保障小目标检测的实时性。

3. 实验设计与结果分析

3.1 数据集与实验环境

实验采用公开数据集 VisDrone2021(含复杂场景小目标样本)及自制数据集(包含雾天、夜间、密集人群场景下的小目标图像,共5000 张,标注小目标类别为行人、车辆、无人机)。

实验环境:GPU 为 NVIDIA RTX 3090,CPU 为 Intel i7-12700K,框架为 PyTorch 1.13。评价指标为小目标检测 mAP( IoU=0.5 )和帧率(FPS)。

3.2 对比实验结果

将改进算法与原 YOLOv8、YOLOv5 及 Faster R-CNN 进行对比,结果如下:

· 检测精度:改进算法在 VisDrone2021 小目标子集上 mAP 为68.5% ,较原 YOLOv8( 64.3% )提升 4.2% ,较 YoLOv5(61.7% )提升 6.8% ,显著优于两阶段算法 Faster R-CNN( 59.2% )。

· 实时性:改进算法帧率为 32FPS,虽略低于原YOLOv8(35FPS),但高于 Faster R-CNN(18FPS),满足实时检测( ⩾25FPS )要求。

· 复杂场景适应性:在自制雾天 / 夜间数据集上,改进算法 mAP 达 65.3% ,较原 YOLOv8( 58.9% )提升 6.4% ,表明对低光照、噪声场景的抗干扰能力增强。

3.3 消融实验验证

为验证各改进模块的有效性,进行消融实验:

· 仅添加动态注意力机制: mAP 提升 2.1% ,证明注意力对小目标特征增强的作用;

· 仅优化多尺度融合: mAP 提升 1.8% ,说明特征融合优化可减少小目标特征丢失;

· 仅采用轻量化结构:帧率提升 3FPS,但 mAP 无明显变化,验证轻量化设计未牺牲精度。

4. 结论与展望

本文提出的改进 YOLOv8 算法通过动态注意力、优化特征融合和轻量化设计,有效提升了复杂场景下小目标检测的精度与实时性。实验表明,改进算法在多种复杂环境中表现稳定,可应用于智能监控、无人机巡检等实际场景。

未来研究可进一步优化小目标特征与背景分离的策略,结合语义信息提升遮挡场景下的检测鲁棒性,并探索算法在边缘设备上的部署方案,降低硬件依赖。

参考文献

[1] 雷德蒙·J、法哈迪·A. 《YOLOv3:一种增量改进》[J]. 预印本 arXiv:1804.02767, 2018.

[2] 王崇宇、博奇科夫斯基·A、廖弘源·M. 《YOLOv7:可训练免费赠品集刷新实时目标检测器最新水平》[J]. 预印本arXiv:2207.02696, 2022.

[3] Ultralytics( 公 司 ).《YOLOv8 官 方 文 档 》[EB/OL]. https://docs.ultralytics.com/, 2023.

[4] 刘松、齐磊、秦浩、等. 《用于实例分割的路径聚合网络》[C]//《IEEE 计算机视觉与模式识别会议论文集》. 2018: 8759-8768.

[5] 格什克·R.《Fast R-CNN》[C]//《IEEE 国际计算机视觉会议论文集》. 2015: 1440-1448.

*本文暂不支持打印功能

monitor