2025年03月18日
在做图像分类任务时,我们先使用卷积神经网络提取图像特征,然后再用这些特征预测分类概率。注意这里是对整张图像提取特征,所以无法区分图像中的不同目标,也就没法分别标示出每个物体所在的位置。
2025年03月18日
在前面的文章中,已经介绍了基于SSD使用自己的数据训练目标检测模型(见文章:手把手教你训练自己的目标检测模型),本文将基于另一个目标检测模型YOLO,介绍如何使用自己的数据进行训练。
YOLO(You only look once)是目前流行的目标检测模型之一,目前最新已经发展到V3版本了,在业界的应用也很广泛。YOLO的基本原理是:首先对输入图像划分成7x7的网格,对每个网格预测2个边框,然后根据阈值去除可能性比较低的目标窗口,最后再使用边框合并的方式去除冗余窗口,得出检测结果,如下图:
2025年03月18日
在之前的文章中介绍了目标检测经典模型(R-CNN、Fast R-CNN、Faster R-CNN),目标检测一般是为了实现以下效果:
在R-CNN、Fast R-CNN、Faster R-CNN中,实现了对目标的识别和定位,如下图所示:
为了更加精确地识别目标,实现在像素级场景中识别不同目标,利用“图像分割”技术定位每个目标的精确像素,如下图所示(精确分割出人、汽车、红绿灯等):
Mask R-CNN便是这种“图像分割”的重要模型。