论文提出了一种基于跨尺度动态卷积的YOLO融合网络(CDC-YOLOFusion),用于可见光-红外目标检测。该方法通过跨模态数据交换(CDS)模块生成混合模态图像,增强模型对跨模态相关性的理解。核心创新是跨尺度动态卷积融合(CDCF)模块,该模块利用跨尺度特征增强和双动态卷积融合机制,自适应地提取与数据分布相关的双模态特征。CDCF在跨模态核交互损失(KI Loss)的监督下,使卷积核同时关注模态共同特征和独特特征。实验表明,CDC-YOLOFusion在VEDAI、FLIR和LLVIP三个数据集上均达到最先进性能,mAP最高提升3%,且参数量和推理时间平衡。消融实验验证了CDS和CDCF模块的有效性,其中CDS通过局部区域交换策略提升模型鲁棒性,而CDCF的多尺度特征聚合和动态卷积机制显著改善特征融合效果。
CDC-YOLOFusion是一种先进的跨模态目标检测网络,它整合了可见光和红外图像数据,提供了更全面的检测能力。该网络的核心创新是跨尺度动态卷积融合(CDCF)模块,它通过跨尺度特征增强和动态卷积机制自适应地提取特征,这些特征与数据分布密切相关,并能够同时关注模态间的共同特征和独特特征。CDCF模块在跨模态核交互损失(KI Loss)的指导下工作,有效监督卷积核的行为,使其在特征提取时更为精确。
在数据预处理阶段,CDC-YOLOFusion采用了跨模态数据交换(CDS)模块,该模块通过生成混合模态图像来增强模型对跨模态相关性的理解,进一步提升了模型的鲁棒性。通过局部区域交换策略,CDS模块提升了模型在不同模态下的性能。
在实际应用中,CDC-YOLOFusion在网络架构上实现了mAP的最高提升3%,在性能提升的同时,它还保持了参数量和推理时间的平衡。这一点在实际应用中尤为关键,因为它保证了实时目标检测的可行性。此外,网络的消融实验详细验证了CDS和CDCF模块的有效性,显示出这些模块对于改善特征融合和提高模型性能的重要性。
CDC-YOLOFusion网络的设计理念和性能提升,证明了在跨模态数据处理领域,动态卷积技术与融合网络相结合,可以显著提高目标检测的准确性和鲁棒性。这种模型设计为解决实际中的多模态目标检测问题提供了新的视角和方法论。
1