๊น์ ๋ ์ด์ด๋ฅผ ์ฌ์ฉํ์ง ๋ชปํ๋ ์ด์ ๋ โ๊ณผ์ ํฉโ์ด ์๋๋ผ โํ์ตโ์ด ์ด๋ฃจ์ด์ง์ง ์์๊ธฐ ๋๋ฌธ์ด๋ค. ์ฆ, ์ต์ ํ๊ฐ ์ ๋์ง ์์๊ธฐ ๋๋ฌธ์ด๋ผ๋ ๊ฐ์ค์ด ๋ฑ์ฅํ๋ค.
โ residual connection ์์ด ๊น์ ๋ ์ด์ด๋ฅผ ๊ฐ๋ deep plain model๋ train error, test error ๋ชจ๋ ๋์์ผ๋ฏ๋ก ๊ณผ์ ํฉ์ด ๋ฌธ์ ๊ฐ ์๋์๋ค.
[kernel academy - CV Basic]
Plain block
[kernel academy - CV Basic]
Residual block
[kernel academy - CV Basic]
๋ง์ฐฌ๊ฐ์ง๋ก $F(x)+x = H(x)$ ๋ก ์ต์ ํ๋ฅผ ์งํํ๋ค.
์ด๋, ResNet์ ์๋๋ $x = H(x)$๊ฐ ์ค์ ํ์ต์ ๋ชฉํ์ด๊ณ $F(x)$๊ฐ ์์ฐจ์ด๋ค.
์ด๋ฅผ ํตํด, ์ ๋ ฅ๋ง์ผ๋ก๋ ์ต์ ํ ํจ์(์ ๋ต)์ ๊ฐ๊น๊ฒ ๋๋ฉด ํ์ตํ ํ์๊ฐ ์๊ณ , ๊ทธ๋ ์ง ์๋ค๋ฉด ์์ฐจ์ธ F(x)๋ฅผ ํตํด ์กฐ๊ธ์ ํ์ต์ ์งํํ๋ค.
๊ทธ๋์ Residual block์ ๋ชฉํ๋ F(x)=0์ด ๋์ด, x = H(X) ์ฆ ์ ๋ ฅ์ด ๊ณง ์ ๋ต์ด ๋๋ ๊ฒ.
โ $F(x)\rightarrow 0$ ์ผ๋ก ๊ทผ์ฌํ๋ ์ฌ์ด ๋ฌธ์ ๊ฐ ๋๋ค
Shortcut Connection : ์ถ๊ฐ์ ์ธ ํ๋ผ๋ฏธํฐ ์์ด, ๋ง์ ์ฐ์ฐ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์๊ธฐ ๋๋ฌธ์ ๋ณต์กํ ์์ ํ/์ญ์ ํ ์ฐ์ฐ์ด ์๋ค.
layer๊ฐ ๊น์ด์ง์๋ก ํ๋ผ๋ฏธํฐ ๊ฐ์๋ ๋์ด๋๋ค. โ ์ต์ ํ์ ์ด๋ ค์์ด ์๊ธธ ์ ์๋ค.
[kernel academy - CV Basic]
Bottleneck Layer : ์ฑ๋์ ํฌ๊ธฐ๋ฅผ ์ค์๋ค๊ฐ ๋ค์ ๋๋ฆฌ๋ ํํ์ ์ค๊ฐ layer
[์ข: deep-layer vs ์ฐ: bottleneck-layer]
1 x 1
Conv Layer๋ฅผ ์ด์ฉํด ์ค๊ฐ์ Bottleneck layer๋ฅผ ์ถ๊ฐํ๋ค๋ฉด ์ฑ๋์ ์๋ ์ ์งํ๋ฉด์ ํ๋ผ๋ฏธํฐ ์๋ ํฌ๊ฒ ์ค์ผ ์ ์๋ค.