Umetna inteligenca je vsekakor postala že zdaj neločljiv del naših življenje, a skrbi glede njene uporabe še vedno niso bile odpravljene in tako kot vsako tehnologijo so tudi to začeli izrabljati za zle namene. Preko ZDA so se nedavno pojavile zaskrbljujoče novice glede lažnega klica, ki je oponašal glas predsednika Bidna, ta pa je volivce naprošal, naj se ne udeležijo lokalnih volitev.
A tisto je bil samo robotski klic, ki se ga da hitro prepoznati, veliko nevarnejši pa so lažni vizualni mediji, ki z vsakim dnevom preko umetne inteligence postajajo bolj realistični. Verjetno se marsikdo med vami spomni prvega pojava “deepfake” posnetkov, ki so se pojavili na YouTubu. Trik pri teh je bilo spajanje glasu z govorjeno mimiko nastopajočega, zaradi česar smo lahko pred kamero videli bivšega ameriškega predsednika Obamo govoriti besede, ki jih ta nikoli ne bi izrekel javno.
This is mind blowing.
— Min Choi (@minchoi) February 28, 2024
This AI can make single image sing, talk, and rap from any audio file expressively! 🤯
Introducing EMO: Emote Portrait Alive by Alibaba.
10 wild examples: 🧵👇
1. AI Lady from Sora singing Dua Lipa pic.twitter.com/CWFJF9vy1M
A za “deepfake” najprej potrebuješ originalni posnetek, novo orodje EMO: Emo Portrait Alive pa ne potrebuje niti tega. Kitajski Institute of Intelligent Computing za referenco ne potrebuje celega posnetka, ampak je za njegovo delovanje dovolj ena sama sličica, ki jo nato spremeni v prepričljivo gibanje preko naprednih umetnopametnih algoritmov, s tem pa lahko govoru vcepimo naključen zvočni posnetek.
Kako orodje deluje v praksi si lahko preberete na uradni strani, tam pa boste odkrili tudi celo paleto praktičnih primerov uporabe. Leonardo DiCaprio zna tako rappati pesem Godzilla, legendarna igralka Audrey Hepburn pa zna odpeti pesem izpod rok Eda Sheerana. EMO zna celo izrabiti iznajdbe drugih umetnih inteligenc: tista ženska, ki jo je impresivno izrisalo orodje SORA, zdaj spremeniti obrazne mimike iz govora Where We Go From Here, ki ga je originalno spočela Mira Murati – tehnološka direktorica podjetja OpenAI.
Potem so tu še druge bizarnosti, saj zna EMO denimo obuditi sliko Mone Lise, ki nam nato recitira Shakespearja, Joaquin Phoenix iz filma Joker pa poda slavni govor igralca Heatha Ledgerja iz filma The Dark Knight. Morda nam ravno ta zadnji primer nakaže, da EMO še ni čisto izpopolnjen, saj tako udarnemu govoru ne zna dostaviti dovolj izpopolnjenih mimik, napake pa se pokaže tudi pri nekaterih drugih primerih – če se nekdo na izvirni sliki smeje, potem je umetna pamet mnenja, da se mora smejati tudi skozi pesem, nakar dobimo naravnost psihopatsko petje.
EMO ni na voljo za splošno uporabo, vsebuje pa orodje svojo GitHub stran.