๐ธ ๋ฐ์์ด ๊ฐ์ผ๋ฉด ๋น์ทํ ์์
์ ์์ฑํ๋ AI ์ค๋ ๋ ํฐ๋ ์ด๋ฐ ๋ด์ฉ์ด์์ ๐:
- ์์
์์ฑ AI๊ฐ ๋ง๋ ํ์ ๊ณก
- APT vs. AVT ๋ญ๊ฐ ๋ค๋ฅผ๊น?
- ๋ค๋ฅธ ๊ฐ์ฌ๋ก ๋ง๋ ๋น์ทํ ๋ฎค์ง๋น๋์ค
|
|
|
๐ง AI, ๋ธ๋ํํฌ์ ์๋ฏธ๋ด ํ์ ์ํน์ ํฉ์ธ์ด๋ค |
|
|
์ง๋ 6์, ๋์ฆ๋์ ์ ๋๋ฒ์ค์ด ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋ AI ํ์ฌ ๋ฏธ๋์ ๋๋ฅผ ์ ์๊ถ ์นจํด๋ก ๊ณ ์ํ ์ฌ๊ฑด์ด ์์์ต๋๋ค. ๋ฉฐ์น ์ ๋ฏธ๋์ ๋๊ฐ ๊ทธ์ ๋ํ ๋ต๋ณ์๋ฅผ ๋๋๋ฐ์. ์ฃผ์ ์
์ฅ ์ค ํ๋๋ ๋ฐ๋ก:
AI๋ ํ์ตํ ๋ฟ, ์ฌ์์ฐํ์ง ์๋๋ค.
์
๋๋ค. ํ์ต์ ์ฌ์ฉ๋์๋ค๊ณ ํ๋๋ผ๋ ๋ณต์ฌํด์ ์ฌ์์ฐํ ๊ฒ ์๋๋ฏ๋ก ์ ์๊ถ ์นจํด๋ผ๊ณ ๋ณผ ์ ์๋ค๋ ์ฃผ์ฅ์ธ๋ฐ์. ์ ๋ง ๊ทธ๋ด๊น์?๐ต๐ปโโ๏ธ
๋ฉฐ์น ์ , AI๊ฐ ๋ฐ์์ด ๋น์ทํ ๊ฐ์ฌ๋ง ๋ณด๊ณ ๋, ํ์ตํ ๋ ๋ค์ ์๊ณก๊ณผ ๊ฑฐ์ ๋๊ฐ์ ์์
์ ์์ฑํ๋ค๋ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๊ฐ ๋์์ต๋๋ค. ์ด์ฐ๋ ์๋ฌธ์ผ๊น์? |
|
|
AI๋ฅผ ์ํํ๋ ๋ฐฉ๋ฒ |
|
|
์ฐ๊ตฌ์ง์ ๋ ๊ฐ์ง ๊ธฐ๋ฒ์ผ๋ก ์ด ํ์์ ์ํํ์ต๋๋ค. ํจ๊ป ๋ณผ๊น์?
1. ์ฐํํ๋ ์น๋ถ, APT
APT(Adversarial PhoneTic Prompting)๋ ๊ฐ์ฌ์ ํต์ฌ ๊ตฌ์ ์ ๋ฐ์๊ณผ ๋ฆฌ๋ฌ์ด ๋น์ทํ ๋ค๋ฅธ ๋จ์ด๋ก ๋ฐ๊พธ๋ ๋ฐฉ์์
๋๋ค. ๋ํผ ์๋ฏธ๋ด(Eminem)์ ์ ๋ช
ํ ๋ฉ <Lose Yourself> ๊ฐ์ฌ์ ๋์ค๋ โmomโs spaghettiโ ๊ตฌ์ ์ ๋ฐ์์ด ์ ์ฌํ โBobโs confettiโ๋ก ๋ฐ๊พธ๋ ์์ด์ง์. ์ด๋ ๊ฒ ํ๋ฉด ๊ฐ์ฌ์ ์๋ฏธ๋ โ์๋ง์ ์คํ๊ฒํฐโ์์ โ๋ฐฅ์ ์์ข
์ด ์กฐ๊ฐ ๊ฐ๋ฃจโ๋ก ์์ ํ ๋ฌ๋ผ์ง์ง๋ง, ์๋ฆฌ ๋ด ์ฝ์ผ๋ฉด ๋ฆฌ๋ฌ๊ณผ ์ด์จ์ด ์๋ก ๋งค์ฐ ํก์ฌํ์ง์? |
|
|
APT ๊ธฐ๋ฒ์ผ๋ก ํต์ฌ ๊ฐ์ฌ๋ฅผ ๋ฐ๊พผ ๊ฒฐ๊ณผ. ๋จ์ด๋ ๋ป๋ ๋ค๋ฅด์ง๋ง, ์๋ฆฌ๋ด์ด ์ฝ์ด๋ณด๋ฉด ๋ฐ์๊ณผ ์ด์จ์ด ๋งค์ฐ ์ ์ฌํ๋ค. ์ถ์ฒ: ๋
ผ๋ฌธ
|
|
|
์ฐ๊ตฌ์ง์ ์ด์ฒ๋ผ ๋ฐ์์ ๊ธฐ๋ฐํ ๋จ์ด ๋์ฒด๋ฅผ ํตํด ์ํฅ ๊ตฌ์กฐ๋ ์ ์งํ๋ ์๋ฏธ๋ ์๋ฑํ ๊ฐ์ฌ๋ค์ ๋ง๋ค์ด๋์ต๋๋ค. ๊ฐ์ฌ๋ฅผ ๋ณด๋ฉด ์๊ณก๊ณผ ๊ด๊ณ์์ด ๋ณด์ด์ง๋ง, ๋ฐ์๊ณผ ๊ฐ์ธ, ๊ทธ๋ฆฌ๊ณ ๋ผ์(rhyme) ๊ตฌ์กฐ๋ ๊ฑฐ์ ๊ทธ๋๋ก์ง์.
2. ์ ๋ฉด์ผ๋ก ๋ถ๋ชํ๋ ์น๋ถ, AVT
APT๊ฐ ๊ต๋ฌํ๊ฒ ๊ฐ์ฌ๋ฅผ ๋ฐ๊พผ๋ค๋ฉด, AVT(Adversarial VerbaTim Prompting)๋ ๊ฐ์ฌ๋ฅผ ์๋ฌธ ๊ทธ๋๋ก ๋ฃ์ด ๋ชจ๋ธ์ด ๋ฐฐ์ด ๋ด์ฉ์ ์ฌํํ๋์ง๋ฅผ ํ์ธํ๋ ๋ฐฉ์์
๋๋ค. <Lose Yourself>์ ๊ฐ์ ์ ๋ช
๊ณก์ ๊ฐ์ฌ๋ฅผ ํ ์ค๋ ๋ฐ๊พธ์ง ์๊ณ ํต์งธ๋ก ๋ฃ๋ ์์ด์ง์. ๋ง์ฝ ๋ชจ๋ธ์ด ํ์ตํ ๋ ๋ค์ ๋
ธ๋๋ฅผ ๊ทธ๋๋ก ๊ธฐ์ตํ๊ณ ์๋ค๋ฉด, ๊ฑฐ์ ์๊ณก๊ณผ ๋๊ฐ์ ๋
ธ๋๋ฅผ ์์ฑํ ์ ์์ต๋๋ค.๐ถ
๊ฐ์ ๊ฐ์ฌ๋ฅผ ์ค๋ค๊ณ ํด๋, ์ ์๊ถ์ ์นจํดํ์ง ์์ผ๋ ค๋ฉด ์ ์ฌํ ์์
์ ์์ฑํด์๋ ์๋ ํ
๋ฐ์. ๊ฒฐ๊ณผ๋ ์ด๋ ์๊น์? |
|
|
AI, ๋ ์์งํ ๋ค ๊ธฐ์ตํ๊ณ ์์ง?! |
|
|
์ฐ์ ์คํ์ ์ฐ์ธ AI ๋ชจ๋ธ๊ณผ, ์์ฑ๋ ๊ฒฐ๊ณผ๋ฌผ์ ์ ์ฌ์ฑ์ ํ๋จํ๋ ๊ธฐ์ค์ ์์๋ณด๊ฒ ์ต๋๋ค. ์ด๋ฒ ์คํ์ ์ฐ์ธ ๋ชจ๋ธ์ ์ด ์ธ ์ข
๋ฅ์
๋๋ค. ๊ฐ์ฌ๋ฅผ ์
๋ ฅํ๋ฉด ๋ถ์๊ธฐ์ ๋ง๋ ๋
ธ๋๋ฅผ ๋ง๋ค์ด์ฃผ๋ AI ๋ชจ๋ธ YuE์ ์ด๋ฏธ ์์ฉํ๋ ์๋น์ค SUNO, ๊ทธ๋ฆฌ๊ณ ํ
์คํธ๋ฅผ ๋ฃ์ผ๋ฉด ์์์ ๋ง๋ค์ด์ฃผ๋ ๊ตฌ๊ธ์ AI ๋ชจ๋ธ Veo 3์
๋๋ค.
๊ณก์ด ์ผ๋ง๋ ์๋ก ๋น์ทํ์ง ๊ฐ๊ด์ ์ผ๋ก ๋ณด์ฌ์ฃผ๋ ๊ธฐ์ค์ผ๋ก๋ CLAP ์ ์, AudioJudge, ๊ทธ๋ฆฌ๊ณ CoverID๊ฐ ์๋๋ฐ์. ๊ฐ๋จํ๊ฒ ์ค๋ช
ํ๋ฉด ์๋์ ๊ฐ์ต๋๋ค:
- CLAP: ๋ ์ค๋์ค๊ฐ ์ผ๋ง๋ ๋น์ทํ์ง ์ธก์ ํ๋ AI ๊ธฐ๋ฐ ์ฒ๋๋ก, 1์ ๊ฐ๊น์ธ์๋ก ์ ์ฌํจ์ ๋ปํ๋ค.
- AudioJudge: GPT-4 ๊ธฐ๋ฐ์ผ๋ก ์์
๋ ๊ฐ์ ๋ฉ๋ก๋ ์ ์ฌ๋์ ๋ฆฌ๋ฌ ์ ์ฌ๋๋ฅผ 0~1 ์ฌ์ด๋ก ํ๊ฐํด ์ฃผ๋ ์์คํ
์ผ๋ก, CLAP๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก 1์ ๊ฐ๊น์ธ์๋ก ์ ์ฌํจ์ ์๋ฏธํ๋ค.
- CoverID: ์๋ ค์ง ๊ณก๊ณผ์ ์ปค๋ฒ ๊ด๊ณ๋ฅผ ํ๋ณํ๋ ์งํ๋ก, ๊ฐ์ด ๋ฎ์์๋ก ์๊ณก์ ๊ฐ๊น๋ค๊ณ ๋ณผ ์ ์๋ค.
์ด์ , ์คํ ๊ฒฐ๊ณผ๋ฅผ ํ๋์ฉ ๋ฏ์ด๋ณด๊ฒ ์ต๋๋ค. ๐ |
|
|
1. ์์
๋ชจ๋ธ์ ๋ํ APT ๊ณต๊ฒฉ |
|
|
์ฐ๊ตฌ์ง์ SUNO์ ์๋ฏธ๋ด์ <Lose Yourself> ๊ฐ์ฌ๋ฅผ APT ๋ฐฉ์์ผ๋ก, ์ฆ ๊ฐ์ฌ์ ๋ฐ์์ด๋ ์ด์จ์ ๋น์ทํ์ง๋ง ์๋ฏธ๋ ์๋ฑํ๊ฒ ๋ฐ๊พผ ๋ฒ์ ์ ์
๋ ฅํ์ต๋๋ค. ๊ทธ๋ฌ์ ๋
ธ๋๊ฐ ํ ๊ณก ์์ฑ๋์๋๋ฐ์. ์์ฑ๋ ๋
ธ๋๋ ์๊ณก๊ณผ ๋ฉ๋ก๋์ ๋ฆฌ๋ฌ ๋ฉด์์ ๋งค์ฐ ํก์ฌํ์ต๋๋ค. CLAP ์ ์๊ฐ 0.773์ ๋ฌํ์ง์. |
|
|
APT ๊ธฐ๋ฒ์ผ๋ก ์์ฑํ ์์
์ ์ ์ฌ๋ ์ ์ ๋น๊ต. ์ถ์ฒ: ๋
ผ๋ฌธ. ๋ฒ์ญ: ๋จ AI
|
|
|
์ฐ๊ตฌ์ง์ โ์ํํธโ๋ผ๊ณ ๋ ๋ถ๋ฆฌ๋, ๋ธ๋ฃจ๋
ธ ๋ง์ค์ ๋ธ๋ํํฌ์ ๋ก์ ์ ๊ณก <APT>์ ๋ํด์๋ ์คํํ์ต๋๋ค. CLAP ์ ์ฌ๋๊ฐ 0.852๋ฅผ ๊ธฐ๋กํ๋๋ฐ์. ํนํ SUNO์ APT๋ก ๊ฐ์ฌ๋ฅผ ๋ฐ๊ฟ ๋ง๋ ๊ณก์ AudioJudge๋ก ํ์ธํ์ ๋ ๋ฉ๋ก๋ ์ ์ฌ๋ 0.95, ๋ฆฌ๋ฌ ์ ์ฌ๋ 0.98์ด๋ผ๋ ๊ฒฐ๊ณผ๊ฐ ๋์์ต๋๋ค. ์๊ณก๊ณผ ๊ตฌ๋ณ์ด ์ด๋ ค์ธ ์ ๋๋ก ์์
์ ๊ตฌ์กฐ๊ฐ ๋์ผํ ๋ ๋์ค๋ ์ ์์
๋๋ค. |
|
|
2. ์์
๋ชจ๋ธ์ ๋ํ AVT ๊ณต๊ฒฉ |
|
|
์ฐ๊ตฌ์ง์ YuE ๋ชจ๋ธ์ ๋ฐด๋ ๊ทธ๋ฆฐ ๋ฐ์ด(Green Day)์ ํํธ๊ณก <Basket Case>๋ฅผ ๊ทธ๋๋ก ์
๋ ฅํด ์์
์ ์์ฑํ์ต๋๋ค. ๊ทธ ๊ฒฐ๊ณผ, CLAP ์ ์ฌ๋๋ 0.856, CoverID ์งํ๋ 0.174, ๊ทธ๋ฆฌ๊ณ AudioJudge๋ก ์ธก์ ํ ๋ฉ๋ก๋์ ๋ฆฌ๋ฌ ์ ์ฌ๋๋ ๊ฐ๊ฐ 0.95์ 0.90์ ๊ธฐ๋กํ์ต๋๋ค! ๐ฏ
๋ฌผ๋ก AVT ๊ณต๊ฒฉ์ด ๋ชจ๋ ์ฅ๋ฅด ๋
ธ๋๋ฅผ ์ ์ฌํ๊ฒ ๋ง๋ ๊ฑด ์๋๋๋ค. ๊ณก์ ๋ฐ๋ผ ํธ์ฐจ๊ฐ ์์๋๋ฐ์. ์๋ ์๋ฐ์ <Thinking Out Loud> ๊ฐ์ ๋ฐ๋ผ๋๊ณก ๊ฐ์ฌ๋ฅผ ํฌ์
ํ ๊ฒฝ์ฐ์ CLAP ์ ์๊ฐ ์ฝ 0.5๋๋ก ์๋์ ์ผ๋ก ๋ฎ๊ฒ ๋์ค๊ธฐ๋ ํ์ต๋๋ค. |
|
|
<Basket Case>, <Thinking Out Loud>์์ ์ ์ฌ๋ ๋น๊ต. ์ถ์ฒ: ๋
ผ๋ฌธ
|
|
|
ํ์ง๋ง ์ผ๋จ ๋ชจ๋ธ์ด ํ์ตํ๋ ๊ณผ์ ์์ ๋ค์ด๋ณธ ๋
ธ๋๋ผ๋ฉด, ๊ฐ์ฌ๋ฅผ ์ ํํ ์คฌ์ ๋ ๋์ฒด๋ก ์๊ณก์ ์์ฃผ ๊ฐ๊น์ด ์์
์ ๋ง๋ค์์ต๋๋ค. ์ฌ์ง์ด AI์๊ฒ โ๋ก ๋ฐ๋ผ๋ ์คํ์ผโ๊ณผ ๊ฐ์ ์ถ๊ฐ ์ง์๋ฅผ ์ฃผ์ด๋, ๊ฐ์ฌ๊ฐ ์๊ณก์ด๋ฉด ์๊ณก ์คํ์ผ๋ก ์์
์ ์์ฑํด ๋ฒ๋ ธ์ต๋๋ค! ์์
์คํ์ผ ์ง์๋ ๊ฑฐ์ ๋ฌด์๋ฏธํ์ง์. ์ฐ๊ตฌ์ง์ ๊ฐ์ฌ ์์ฒด๊ฐ ์์ฑ ๊ฒฐ๊ณผ๋ฅผ ๊ฒฐ์ ์ง๋ ์ด์ ๋ผ๊ณ ์ถ๋ก ํฉ๋๋ค. ๐ |
|
|
3. ํ
์คํธ-์์ ๋ชจ๋ธ์ ๋ํ ๊ณต๊ฒฉ |
|
|
์ด๋ฒ ์คํ์ ์กฐ๊ธ ๋ค๋ฆ
๋๋ค. ํ
์คํธ์ ๊ธฐ๋ฐํด ์์์ ๋ง๋๋ ๋ชจ๋ธ์ธ Veo 3์ ๋ํ ์คํ์ธ๋ฐ์. ์ฐ๊ตฌ์ง์ Veo 3์ ์๋ฏธ๋ด์ <Lose Yourself> ๊ฐ์ฌ๋ฅผ ์
๋ ฅํ์ฌ ํด๋น ๊ณก์ ๋ฎค์ง๋น๋์ค์ ์ผ๋ง๋ ๋น์ทํ ์ฅ๋ฉด์ ๋ด๋๋์ง ๊ด์ฐฐํ์ต๋๋ค. ์ด๋ค ๊ฒฐ๊ณผ๊ฐ ๋์์๊น์? |
|
|
์ค์ ๋ฎค์ง๋น๋์ค(์ผ์ชฝ)์ Veo3๊ฐ ์์ฑํ ๋ฎค์ง๋น๋์ค(์ค๋ฅธ์ชฝ). ์ถ์ฒ: ๋
ผ๋ฌธ
|
|
|
์ ์ด๋ฏธ์ง์์ ์ค๋ฅธ์ชฝ ์๋ APT ๊ธฐ๋ฒ์ผ๋ก ๋ฐ๊พผ ๊ฐ์ฌ๋ก ์์ฑํ ์์์ด๊ณ , ๊ทธ ์๋๋ AVT ๊ธฐ๋ฒ์ผ๋ก ๊ฐ์ฌ๋ฅผ ๊ทธ๋๋ก ๋ฃ์ด ๋ง๋ ๋ฎค์ง๋น๋์ค์
๋๋ค. ๊ณต๊ฒฉ ๊ธฐ๋ฒ๊ณผ ์๊ด์์ด, ๋ ์์ ๋ชจ๋ ํ๋ ์ด ๋จ์ฑ์ด ์ด๋์ด ๋์ ๋ฐฐ๊ฒฝ์์ ๋ฉ์ ํ๋ ์ฅ๋ฉด๊ณผ, ๋นํธ์ ๋ง์ถฐ ์ฅ๋ฉด ์ ํ์ด ์ด๋ค์ง๋ ์ฐ์ถ ๋ฑ์ ๋ณด์ฌ์ฃผ๋ ์์์ ๋ง๋ค์ด๋๋๋ฐ์. ์ด๋ ์ค์ <Lose Yourself>์ ๋ฎค์ง๋น๋์ค ์ฐ์ถ๊ณผ ๋งค์ฐ ํก์ฌํฉ๋๋ค.
๊ฐ์ฌ์ โํ๋ํฐโ๋ โ๋์ ๋ท๊ณจ๋ชฉโ ๊ฐ์ ์๊ฐ์ ๋จ์ด๊ฐ ์ ํ ์์๋๋ฐ๋, ๋ชจ๋ธ์ด ์๋ณธ ์์์ ๋ถ์๊ธฐ์ ๊ตฌ์ฑ์ ์ฌํํ ๊ฒ์ด์ง์. ์ฐ๊ตฌ์ง์ ์ด๋ฌํ ํ์์ โ์์-์๊ฐ ํ์(phonetic-to-visual regurgitation)โ์ด๋ผ๊ณ ์ด๋ฆ์ ๋ถ์
๋๋ค. ์๋ฆฌ์ ํจํด๋ง์ผ๋ก๋ ๋ชจ๋ธ ๋ด๋ถ์ ์ ์ฅ๋ ์๊ฐ ์ฅ๋ฉด์ด ์ด๋ฐ๋์๋ค๋ ์๋ฏธ์
๋๋ค. ์ด๋ฒ ์ฐ๊ตฌ๋ ์ฌ์ง, ์์, ํ
์คํธ ๋ฑ ๋ค์ํ ์ข
๋ฅ์ ๋ฐ์ดํฐ๋ฅผ ๋์์ ๋ค๋ฃจ๋ ๋ฉํฐ๋ชจ๋ฌ AI ๋ชจ๋ธ์์ ์ฒ์ ๋ณด๊ณ ๋ ์ข
๋ฅ์ ๊ธฐ์ต ์ ์ถ ํ์์
๋๋ค.
์ ๋ง ๊ฒ๋ณด๊ธฐ์ ์๋ฌด ๋ฌธ์ ์์ด ๋ณด์ด๋ ์๊ตฌ์ฌํญ์ด, AI ๋ชจ๋ธ ๋ด๋ถ์ ์ ์ฅ๋ ์ ์๊ถ ์ฝํ
์ธ ๋ฅผ ๋ถ๋ฌ๋ผ ์ ์๋ ๊ฑธ๊น์?๐ค |
|
|
AI๋ ์ ๋ง ๊ธฐ์ตํ๊ณ ๋ณต์ฌํ๋ ๊ฒ ์๋๋ผ, ๋ฐฐ์ฐ๊ณ ์๋กญ๊ฒ ๋ง๋๋ ๊ฑธ๊น์? ๊ทธ๋ฆฌ๊ณ ์๋ก ๋ง๋ ๊ฑฐ๋ผ๋ฉด, ๊ฒฐ๊ณผ๋ฌผ์ด ๊ณผํ๊ฒ ์ ์ฌํด๋ ๊ด์ฐฎ์ ๊ฑธ๊น์?
์ง๋ฌธ์ ๊ณฑ์น๋ค ๋ณด๋ฉด, ์ฐ๋ฆฌ๋ AI์ ๋ํด ์ผ๋ง๋งํผ ์๊ณ ์๋ ๊ฑด์ง ๊ถ๊ธํด ์ง๋๋ค. ์ธ๊ฐ์ด ์๊ฐํ๋ ๋ฐฉ์์ ํ๋ฐฉํ๋ โ์ธ๊ณต์ง๋ฅโ์ด ์์์ ๋ฒ์ด๋๋ ํ๋์ ํด ์ฌ๋์ ๋๋ผ๊ฒ ํ๋ ์์์ด ์ข
์ข
๋ค๋ฆฌ๋๋ฐ์. โ์ด ๊ธธ ๋ฌผ์์ ์์๋, ํ ๊ธธ ์ฌ๋ ์์ ๋ชจ๋ฅธ๋ค'๋ผ๋ ์๋ด์ด ๋ ์ค๋ฆ
๋๋ค. ์ฐ๋ฆฌ๋ AI์ ๋ํด โ๋ช ๊ธธโ์ด๋ ์๊ณ ์์๊น์?
๐ ์ฐธ๊ณ ์๋ฃ
- ๋
ผ๋ฌธ <Bobโs Confetti: Phonetic Memorization Attacks in Music and Video Generation>
- ์์ฑ๋ ๋ค์ํ ์์๊ณผ ์์ ๋ฃ๊ณ ๋ณด๊ธฐ |
|
|
๊ตฌ๋
์๋, ์ฌ๋ฐ๊ฒ ์ฝ์ผ์
จ๋์?
์ฃผ๋ณ์๋ ๊ณต์ ํด ์ฃผ์๋ฉด ์ ๋ง ๊ฐ์ฌํ๊ฒ ์ต๋๋ค. ๐
|
|
|
|