3.填充和步幅(padding & stride)

3. 填充和步幅(Padding & Stride)

1.填充(Padding)

  • 给定 32×32 的输入图像,应用 5×5 卷积核:
    • 第1层输出大小为 28×28
    • 第7层输出大小为 4×4
  • 更大的卷积核会让输出尺寸更快减小
    • 形状从 nh×nw 减少到 (nhkh+1)×(nwkw+1)
    • 其中 nh,nw 是输入的高和宽,kh,kw 是卷积核的高和宽。
  • 在输入周围添加格外的行/列,让输入变得更大
  • 引入填充:在输入图像四周补零,使输出形状减小得更慢。
    • 填充 ph 行和 pw 列,输出形状为:(nhkh+ph+1)×(nwkw+pw+1)
    • 通常取 ph=kh1, pw=kw1
      • kh 为奇数:上下两侧各填充 ph/2
      • kh 为偶数:上侧填充 ph/2,下侧填充 ph/2
      • 列同理

2.步幅(Stride)

  • 步幅(stride)是指每次滑动卷积核时,行/列方向的步长。
  • 步幅的引入可以让输出尺寸按比例减小,更快缩小特征图大小。
    • 例:步幅为(3,2)表示每次在高方向移动3格,宽方向移动2格。
  • 步幅公式
    • 设高度步幅为 sh,宽度步幅为 sw,则输出形状为:nhkh+ph+shsh×nwkw+pw+swsw
    • ph=kh1pw=kw1 时,输出形状为:nh+sh1sh×nw+sw1sw
    • 若输入尺寸能被步幅整除,输出为:(nh/sh)×(nw/sw)

3.总结

  • 填充步幅是卷积层控制输出形状的两个重要超参数。
  • 填充通过在输入四周补零,减缓输出形状的缩减。
  • 步幅决定每次卷积核移动的距离,可成倍压缩输出尺寸,加速下采样。
  • 合理设置二者,有助于灵活控制模型的空间结构和计算量。

参考资料


“觉得不错的话,给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信二维码

微信支付

支付宝二维码

支付宝支付

3.填充和步幅(padding & stride)
http://neurowave.tech/2025/04/18/8-3-CNN-填充和步幅/
作者
Artin Tan
发布于
2025年4月18日
更新于
2025年6月29日