卷积神经网络(Convolutional Neural Network,缩写 CNN)是一种专门为处理具有网格结构数据(如图像、音频)而设计的深度学习模型。它在图像识别、目标检测、语义分割等诸多计算机视觉任务以及语音识别等领域取得了巨大的成功。
(1)卷积神经网络的主要组成:
- 卷积层(Convolution Layer)卷积操作原理:卷积层是 CNN 的核心组件。它通过卷积核(也称为滤波器)在输入数据(如图像)上滑动进行卷积操作。例如,对于一个二维图像,卷积核也是一个二维的小矩阵。假设输入图像是一个(高度为,宽度为)的矩阵,卷积核大小为,卷积操作就是将卷积核的中心与图像的每个像素点对齐,然后对应元素相乘再求和,得到一个新的像素值。这个过程在整个图像上滑动进行,每次滑动的步长(stride)可以控制。例如,步长为 1 时,卷积核每次移动一个像素。