2.图像卷积

2. 图像卷积

1. 卷积运算 → 互相关运算 (cross-correlation)

  • 二维互相关
    • 定义:将输入和核矩阵进行交叉相乘,加上偏移后得到输出。
    • 示例

2. 输入输出尺寸

  • 输入 X:大小为 nh×nw(超参数)。
  • 核 (kernel) W:大小为 kh×kw
  • 偏置 bR
  • 输出 Y:大小为 (nhkh+1)×(nwkw+1)
    • 原因:核滑动时,边缘位置无法完全覆盖输入,导致输出尺寸缩小。
    • 如图,扫到这里没了,所以不输出,导致丢掉一些数据,就是(kh+1)(kw+1) 就会导致一下结果,图片变模糊
  • 公式Y=XW+b,其中 Wb 是可学习参数。

3. 互相关 vs. 卷积

  • 互相关

    yi,j=a=1khb=1kwWa,bXi+a,j+b
  • 卷积

    yi,j=a=1khb=1kwWkha+1,kwb+1Xi+a,j+b
  • 区别:卷积需要对核做180°翻转。对于对称核(如高斯核),两者结果相同。深度学习中通常采用互相关实现。

4. 一维与三维互相关

  • 一维互相关(如文本/时间序列):

    yi=a=1kWaXi+a
  • 三维互相关(如视频、医学影像):

    yi,j,k=a=1khb=1kwc=1kdWa,b,cXi+a,j+b,k+c

5. 总结

  • 核心思想:通过滑动小尺寸核,对输入局部区域加权求和,实现特征提取与参数量压缩。
  • 关键参数:核大小、步长、填充(padding)。

参考资料


“觉得不错的话,给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信二维码

微信支付

支付宝二维码

支付宝支付

2.图像卷积
http://neurowave.tech/2025/04/18/8-2-CNN-图像卷积/
作者
Artin Tan
发布于
2025年4月18日
更新于
2025年6月29日