๋ค์ด๊ฐ๊ธฐ์ ์์
-
๋ ผ๋ฌธ: Learning to Classify Images Without Labels
์ ๋ฒ์ 74ํ์ด์ง์ธ๊ฐ ํ๋ GPT-3๋ ผ๋ฌธ์ ์ฒ์๋ถํฐ ํ ์น์ ์ฉ ์ ๋ฆฌํ๋ ค๋๊น 2์ฅ๊น์ง ํ๋ ๋ฐ์๋ ๋๋ฌด ๋ง์ ์๊ฐ์ด ๊ฑธ๋ ธ๋ค. ์ด์ ๋ถํฐ๋ ๋ ผ๋ฌธ์ ํต์ฌ ์์ด๋์ด๋ง ๋น ๋ฅด๊ฒ skimํ๋ฉด์ ๋ธ๋ก๊ทธ์ ์ ๋ฆฌํ๊ณ , ์ข์ ๋ ผ๋ฌธ์์ด ํ๋จ๋๋ฉด ์์ธํ๊ฒ ์ดํด๋ณด๋ ค๊ณ ํ๋ค. ๋ฌผ๋ก ์ด์ ๊น์ง ๊ทธ๋์์ง๋ง ์ด๋ ๊ฒ ๋ธ๋ก๊ทธ์ ์ ๋ฆฌ๋ฅผ ํ๋ฉด์ ๋ ผ๋ฌธ์ ์ฝ์ผ๋ ๋ ์ค๋ ๊ฑธ๋ฆฐ๋ค ใ ใ
์ด๋ฒ์๋ ํด๋น ์ ํ๋ธ ์ฑ๋์์ ๋จผ์ ์ง์ด์ฃผ๋ ํฌ์ธํธ๋ค์ ์ดํด๋ณด๊ณ , ๊ทธ ๋ค์์ ๋์ ๊ด์ ์์ ๋ ผ๋ฌธ์ ๋ณด๋ ค๊ณ ํ๋ค.
- Yannic Kilcher: Learning To Classify Images Without Labels (Paper Explained)
0.Abstract
๊ณผ์ฐ annotation ์์ด(๋ ์ด๋ธ ์์ด) ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฅํ๋ ๊ฒ์ด ๊ฐ๋ฅํ ๊น? ํด๋น ๋ ผ๋ฌธ์์๋ ๋ค์์ ํต์ฌ ์์ด๋์ด๋ฅผ ํตํด ๊ฐ๋ฅํ๋ค๊ณ ํ๋ค.
- self-supervised learning
- clustering
- self-labeling
์ด๋ ํ NN์ ํตํด์์ด๋ ์ ํํ๋ ์๋ฒ ๋ฉ์ ๊ตฌํ๋ค.
์ฌ๋ฌ ๋ณํ์ ์ฃผ๊ณ ๊ฐ์ ๋ชจ๋ธ์ ์ ๋ ฅํ์์ ๋ ๊ฐ์ฅ ๋ง์ง๋ง์ ๋์ค๋ ์๋ฒ ๋ฉ ๊ฐ์ผ๋ก K๊ฐ์ ์ฃผ๋ณ ์๋ฒ ๋ฉ์ ์ดํด๋ณด๋ ์ด๋ฏธ ๊ทธ ์ด๋ฏธ์ง๊ฐ ๋น์ทํ๋ค.
๊ทธ๋ฌ๋ ์ด๊ฑธ๋ก๋ ๋ถ์กฑํ๊ณ self-labeling์ ํตํด ๋ค์ ํ์ตํ๋ค. ๋ด๊ฐ ๋์ ๋ฐ์ดํฐ์ ๋ ์ด๋ธ๋งํ๋ ๊ฒ์ด ์ด๋ค ์๋ฏธ๊ฐ ์์๊น? ๊ทธ๋ฌ๋ ์ ๊ตํ๊ฒ ํ๋ ๊ฒ์ ์๋ฏธ๊ฐ ์๋ค.
์ง๋ฌธ) ๊ทธ๋ฐ๋ฐ ๋ฌด์จ task๋ฅผ ํตํด์ ๋ง์ง๋ง ๊ฐ์ ์ฐพ์๊ฑฐ์ง?
๊ทธ๋ฐ๋ฐ ๊ฒฐ๊ตญ ์ฑ๋ฅ ์ธก์ ์ ground-truth์ ๋ํด ํ๋ ๊ฒ์ธ๋ฐ ์๋ฏธ๊ฐ ์๋..? ๋ ธ๋ ธ ๊ทธ๋๋ ๋ ์ด๋ธ ์์ด ์ฌ์ฉํ๋ ๊ฒ์ด ๋์ ์ ํ๋๋ฅผ ๋ณด์ด๋ ์์ผ๋ก๋ ์์ด ๊ทธ๋ฅ ๊ทธ ์๋ฒ ๋ฉ ๊ฐ์ ์ฌ์ฉํด๋ ๋๋ค.
๊ทธ๋ฌ๋ ๋ง์ hyperparameter ๊ฐ ๋ง์ด ์๋ค.. pretext model, threshold, .. ๋ฌธ์ ๋ ์ด๋ฌํ ํ๋ผ๋ฏธํฐ๋ค์ด ๊ฒฐ๊ตญ์ ๋ ์ด๋ธ์ ์๊ณ ์์ด์ผ ์ด๋ ์ ๋ ์ ํ ์ ์๋ค๋ ๋๋ ๋ง์ ๋น ์ง๊ฒ ๋๋ค.