4.多输入通道与多输出通道的卷积

4. 多输入通道与多输出通道的卷积

1. 多输入通道

  • 彩色图像一般有 RGB 三个输入通道,直接转成灰度会丢失信息。
  • 每个输入通道都有一个对应的卷积核,所有通道卷积后的结果相加,得到单通道的输出。
  • 数学形式:
    • 输入 Xci×nh×nw
    • 卷积核 Wci×kh×kw
    • 输出 Ymh×mw
    • 公式:Y=i=1ciXi,:,:Wi,:,:

2. 多输出通道

  • 卷积层的输出通道数是一个超参数。
  • 可以有多个三维卷积核,每个核生成一个输出通道。
  • 数学形式:
    • 输入 Xci×nh×nw
    • Wco×ci×kh×kw
    • 输出 Yco×mh×mw
    • 公式:Yi,:,:=XWi,:,:,:,for i=1,...,co

3. 多输入和多输出

  • 每个输出通道可以识别特定模式
  • 输入通道核识别并组合输入中的模式

4. 1x1 卷积层

  • kh=kw=1 的是一个受欢迎的选择,它不提识别空间模式,仅用于通道融合
  • 等价于输入为 nhnw×ci,权重为 co×ci 的全连接层。

5. 二维卷积层计算复杂度

  • 输入 Xci×nh×nw
  • Wco×ci×kh×kw
  • 偏置 Bco
  • 输出 Yco×mh×mw
  • 计算复杂度(浮点计算数FLOP):O(cicokhkwmhmw)
    • ci=co=100
    • kh=hw=50
    • mh=mw=64
  • ==> 1GFLOP
  • (CPU: 0.15. TF = 18h, GPU: 12 TF = 14min)

6. 总结

  • 输出通道数是卷积层的超参数,决定输出特征的"宽度"。
  • 每个输入通道有独立的卷积核,卷积结果相加后再送给每个输出通道。
  • 每个输出通道有独立的三维卷积核,分别负责识别特定模式或组合输入通道特征。
  • 1×1 卷积可用于通道混合,不提取空间特征。
  • 二维卷积层的计算复杂度与通道数、卷积核大小和输出尺寸成正比。

参考资料


“觉得不错的话,给点打赏吧 ୧(๑•̀⌄•́๑)૭”

微信二维码

微信支付

支付宝二维码

支付宝支付

4.多输入通道与多输出通道的卷积
http://neurowave.tech/2025/04/18/8-4-CNN-多输入通道/
作者
Artin Tan
发布于
2025年4月18日
更新于
2025年6月29日