上圖中,輸入的高度和寬度都為3,卷積核的高度和寬度都為2,生成的輸出表征的維度為 2 × 2 2\times2 2×2。從上圖可看出卷積的輸出形狀取決于輸入形狀和卷積核的形狀。
填充
以上面的圖為例,在應用多層卷積時,我們常常丟失邊緣像素。
解決這個問題的簡單方法即為填充(padding):在輸入圖像的邊界填充元素(通常填充元素是0)。
例如,在上圖中我們將 3 × 3 3\times3 3×3輸入填充到 5 × 5 5\times5 5×5,那么它的輸出就增加為 4 × 4 4\times4 4×4。變換如下圖所示:
步幅
在計算互相關時,卷積窗口從輸入張量的左上角開始,向下和向右滑動。在前面的例子中,我們默認每次滑動一個元素。但是,有時候為了高效計算或是縮減采樣次數,卷積窗口可以跳過中間位置,每次滑動多個元素。
我們將每次滑動元素的數量稱為步幅(stride)。下圖展現的是垂直步幅為3,水平步幅為2的二維互相關運算。
以上就是Python深度學習pytorch神經網絡填充和步幅的理解的詳細內容,更多關于pytorch神經網絡填充和步幅的資料請關注服務器之家其它相關文章!
原文鏈接:https://blog.csdn.net/weixin_43880225/article/details/120617560