SPPF模块的depth-wise重设计
YOLOv11的SPPF模块虽然比SPP快,但我觉得还能继续优化。可以把传统的卷积替换成depth-wise separable convolution,再加上channel shuffle来保持信息流动。
更进一步,可以引入learnable pooling size,让模型自己决定最优的pooling kernel。这样既能减少参数量,又能保持多尺度特征提取的能力。
主要针对的是multi-scale detection在lightweight model上的性能损失问题。这个改进对small object detection特别有帮助。