728x90

<๋…ผ๋ฌธ ์›๋ณธ>

Adversarial examples for generative models - Jernej Kos, Ian Fischer, Dawn Song

 

Adversarial examples for generative models

We explore methods of producing adversarial examples on deep generative models such as the variational autoencoder (VAE) and the VAE-GAN. Deep learning architectures are known to be vulnerable to adversarial examples, but previous work has focused on the a

arxiv.org


<๋…ผ๋ฌธ ์š”์•ฝ>

VAE(Variational Auto Encoder)

  • ์˜คํ† ์ธ์ฝ”๋”(Autoencoder)
    • ์˜คํ† ์ธ์ฝ”๋”๋Š” ๋ฐ์ดํ„ฐ(์˜ˆ: ์‚ฌ์ง„, ๋ฌธ์„œ)๋ฅผ ์••์ถ•ํ•˜๋Š” ์ธ์ฝ”๋”์™€ ๋‹ค์‹œ ์›๋ž˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณต์›ํ•˜๋Š” ๋””์ฝ”๋”๋กœ ๊ตฌ์„ฑ๋œ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
    • ์˜ˆ๋ฅผ ๋“ค์–ด, ๋ณต์žกํ•œ ์‚ฌ์ง„์„ ์ž‘์€ ํฌ๊ธฐ์˜ ์ค‘์š”ํ•œ ์ •๋ณด๋กœ ์••์ถ•ํ–ˆ๋‹ค๊ฐ€, ๋‹ค์‹œ ์›๋ž˜ ์‚ฌ์ง„๊ณผ ๋น„์Šทํ•˜๊ฒŒ ๋ณต์›ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.
  • VAE(Variational Auto Encoder)
    • VAE๋Š” ์˜คํ† ์ธ์ฝ”๋”์˜ ๋ณ€ํ˜•๋œ ๋ฒ„์ „์œผ๋กœ, ๋‹จ์ˆœํžˆ ๋ฐ์ดํ„ฐ๋ฅผ ์••์ถ•ํ•˜๋Š” ๊ฒƒ๋ฟ ์•„๋‹ˆ๋ผ, ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ€์ง„๋‹ค.
    • ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ธฐ์กด์— ๋ณธ ์  ์—†๋Š” ์ƒˆ๋กœ์šด ์‚ฌ์ง„์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.

VAE ์ž‘๋™ ๋ฐฉ์‹

์ธ์ฝ”๋”(Encoder)

  • ์ธ์ฝ”๋”๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ›์•„ ์ž ์žฌ ๊ณต๊ฐ„(latent space)์ด๋ผ๋Š” ์ € ์ฐจ์› ๊ณต๊ฐ„์œผ๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค.
  • ์ด๋Š” ์›๋ž˜ ๋ฐ์ดํ„ฐ์˜ ์ค‘์š”ํ•œ ํŠน์ง•์„ ์žก์•„๋‚ธ ์š”์•ฝ๋ณธ ๊ฐ™์€ ๊ฒƒ์ด๋‹ค.

์ž ์žฌ ๋ณ€์ˆ˜(Latent Variables)

  • ์ž ์žฌ ๊ณต๊ฐ„์€ ๋ฐ์ดํ„ฐ์˜ ์••์ถ•๋œ ํ‘œํ˜„์œผ๋กœ, VAE๋Š” ์ด ๊ณต๊ฐ„์„ ์ •๊ทœ๋ถ„ํฌ์™€ ๊ฐ™์€ ํŠน์ • ๋ถ„ํฌ๋กœ ๋งž์ถ”๋ ค๊ณ  ํ•œ๋‹ค.
  • ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ด ๊ณต๊ฐ„ ์•ˆ์—์„œ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ํผ์ ธ์žˆ๋„๋ก ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

๋””์ฝ”๋”(Decoder)

  • ๋””์ฝ”๋”๋Š” ์ด ์ž ์žฌ ๊ณต๊ฐ„์˜ ์ ๋“ค์„ ๋ฐ›์•„ ์›๋ž˜ ๋ฐ์ดํ„ฐ์™€ ์œ ์‚ฌํ•œ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค.
  • ์ด๋Š” ์••์ถ•๋œ ์ •๋ณด๋ฅผ ๋‹ค์‹œ ํ’€์–ด ์›๋ž˜ ๋ฐ์ดํ„ฐ๋กœ ๋Œ๋ฆฌ๋Š” ๊ณผ์ •์ด๋‹ค.

 


๊ด€๋ จ ์—ฐ๊ตฌ ๋ฐ ๋ฐฐ๊ฒฝ

  • ์ƒ์„ฑ ๋ชจ๋ธ์˜ ์ทจ์•ฝ์ : 
    • ์ƒ์„ฑ ๋ชจ๋ธ์€ ๋‹ค์–‘ํ•œ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ๋ถ„ํฌ๋ฅผ ํ•™์Šตํ•˜๊ณ  ๊ทธ ๋ถ„ํฌ์—์„œ ์ƒˆ๋กœ์šด ์˜ˆ์ œ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.
    • ๊ทธ๋Ÿฌ๋‚˜ ์ด๋Ÿฌํ•œ ๋ชจ๋ธ๋„ ์ ๋Œ€์  ์˜ˆ์ œ์— ์ทจ์•ฝํ•˜๋‹ค.
  • ์ ๋Œ€์  ์˜ˆ์ œ: 
    • ์ ๋Œ€์  ์˜ˆ์ œ๋Š” ์›๋ž˜ ๋ฐ์ดํ„ฐ์— ์•„์ฃผ ์ž‘์€ ๋ณ€ํ™”๋ฅผ ์ฃผ์–ด, ์‚ฌ๋žŒ์—๊ฒŒ๋Š” ๊ฑฐ์˜ ๋™์ผํ•˜๊ฒŒ ๋ณด์ด์ง€๋งŒ,
    • ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์—๊ฒŒ๋Š” ์™„์ „ํžˆ ๋‹ค๋ฅธ ๊ฒƒ์œผ๋กœ ์ธ์‹๋˜๋„๋ก ๋งŒ๋“  ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์ด๋‹ค.
  • ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ณ ์–‘์ด ์‚ฌ์ง„์— ์ธ๊ฐ„์ด ๊ฑฐ์˜ ์•Œ์•„์ฐจ๋ฆด ์ˆ˜ ์—†๋Š” ์žก์Œ์„ ์ถ”๊ฐ€ํ•˜๋ฉด, ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ด ์ด๋ฅผ ๊ณ ์–‘์ด๊ฐ€ ์•„๋‹Œ ๊ฐœ๋‚˜ ๋‹ค๋ฅธ ๋™๋ฌผ๋กœ ์ž˜๋ชป ์ธ์‹ํ•˜๊ฒŒ ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฌธ์ œ ์ •์˜

์ ๋Œ€์  ์˜ˆ์ œ์˜ ์ƒ์„ฑ

  • ์ƒ์„ฑ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ ๋Œ€์  ์˜ˆ์ œ๋Š” ๊ณต๊ฒฉ์ž๊ฐ€ ์›ํ•˜๋Š” ๋ชฉํ‘œ ์ถœ๋ ฅ ํด๋ž˜์Šค๋ฅผ ์ƒ์„ฑํ•˜๋„๋ก ๋ชฉํ‘œ ์ถœ๋ ฅ ํด๋ž˜์Šค๋ฅผ ์ƒ์„ฑํ•˜๋„๋ก ์ž…๋ ฅ์„ ์กฐ์ž‘ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.
  • ์ด๋ฅผ ํ†ตํ•ด ๊ณต๊ฒฉ์ž๋Š” ์›๋ณธ ์ด๋ฏธ์ง€์˜ ์žฌ๊ตฌ์„ฑ๋œ ์ด๋ฏธ์ง€ ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ์ตœ์ ํ™”ํ•˜์—ฌ ์›ํ•˜๋Š” ์žฌ๊ตฌ์„ฑ์„ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ณต๊ฒฉ ๋ฐฉ๋ฒ•๋ก 

  • ๋ถ„๋ฅ˜ ๊ธฐ๋ฐ˜ ๊ณต๊ฒฉ: ๊ณต๊ฒฉ์ž๊ฐ€ ํ•™์Šต๋œ ์ธ์ฝ”๋”์— ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ๊ฐ„์ ‘์ ์œผ๋กœ ์ž ์žฌ ํ‘œํ˜„์„ ์กฐ์ž‘ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
  • VAE ์†์‹ค ํ•จ์ˆ˜ ์‚ฌ์šฉ: VAE ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์ง์ ‘ ์‚ฌ์šฉํ•˜์—ฌ ์ ๋Œ€์  ์˜ˆ์ œ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค.
  • ์ž ์žฌ ํ‘œํ˜„ ์ฐจ์ด ์ตœ์ ํ™”: ํ‘œ์ค€ ์†์‹ค์ด๋‚˜ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€์‹ , ์›๋ณธ๊ณผ ๋ชฉํ‘œ ์ž ์žฌ ํ‘œํ˜„ ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ์ง์ ‘ ์ตœ์ ํ™”ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

 

Experiment

  • ๊ฒฐ๊ณผ ์š”์•ฝ: ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์…‹(MNIST, SVHN, CelebA)์— ๋Œ€ํ•ด ์„ธ ๊ฐ€์ง€ ๊ณต๊ฒฉ ๋ฐฉ๋ฒ•์„ ํ…Œ์ŠคํŠธํ•œ ๊ฒฐ๊ณผ, ์ž ์žฌ ํ‘œํ˜„ ์ฐจ์ด ์ตœ์ ํ™”๊ฐ€ ๊ฐ€์žฅ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์˜€๊ณ , ๋ถ„๋ฅ˜ ๊ธฐ๋ฐ˜ ๊ณต๊ฒฉ์ด ๊ฐ€์žฅ ์„ฑ๋Šฅ์ด ๋‚ฎ์•˜์Šต๋‹ˆ๋‹ค.
  • VAE์™€ VAE-GAN ์ƒ์„ฑ ๋ชจ๋ธ์ด ์ ๋Œ€์  ์˜ˆ์ œ์— ์ทจ์•ฝํ•˜๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ฃผ์—ˆ๊ณ  ์ด๋Š” ํ˜„์žฌ์˜ ์‹ ๊ฒฝ๋ง ๊ตฌ์กฐ๊ฐ€ ์ผ๋ฐ˜์ ์œผ๋กœ ์ ๋Œ€์  ์˜ˆ์ œ์— ์ทจ์•ฝํ•จ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

 

+ Recent posts