Umetna inteligenca VALL-E zna iz treh sekund posnetka prepričljivo oponašati glasove

O umetni inteligenci smo spisali že marsikaj, a tema pogovora se je v teh člankih vrtela okoli orodja ChatGPT, a to ni edina umetna inteligenca, ki te dni dviga obrvi in pri nekaterih tudi upravičeno zbuja skrbi. Microsoft je namreč nedavno predstavil svoj lastni projekt VALL-E, ta pa se ukvarja z nalogo prepričljivega oponašanja kateregakoli človeškega glasu.

VALL-E za svoje delovanje potrebuje samo zvočni posnetek človeškega “originala”, ta posnetek pa je lahko kratek samo 3 sekunde. To je dovolj za spočetje prepričljive imitacije, za katero bo res treba naprezati ušesa, da boste v njej prepoznali nekaj robotskega. Morda je najbolj impresivno dejstvo, da VALL-E za svojo nalogo ne potrebuje kakšnega res kvalitetnega zvočnega izvirnika, saj svojo nalogo dobro opravi tudi v situacijah, kjer je avdio zajet preko telefonskega razgovora. V takšnih primerih ne povzame samo govora človeka, ampak primerno poskrbi tudi za popačenje zvoka, kar na koncu izda prepričljivo zvočno sliko.

Avtorji te umetne inteligence pravijo, da je bil VALL-E svojih sposobnosti naučen preko študiranja zvočnih posnetkov, ki so skupno trajali 60.000 ur. To je za magnitude več od sorodnih izdelkov, ki so do sedaj poskušali oponašati človeški govor in ravno zaradi tega razloga je njegovo govorjenje tako prepričljivo in nerobotsko.

Tako kot pri ChatGPT-ju so se seveda takoj začele pojavljati skrbi, kako bo VALL-E vplival na sodobno družbo. VALL-E sicer ni na voljo za preizkus, saj si lahko na uradni strani Githuba samo ogledate razne primere zvočnih pretvorb. Vendar pa je že ChatGPT pokazal, da se da njegove sposobnosti uporabiti za veliko več kot za samo pogovore, saj zna zadeva pisati spise, članke in celo popravljati kodo. Nekdo je pred kratkim zadevo vpeljal celo v svet iger, kar je začelo risati temno prihodnost za vse avtorje in prevajalce, ki si s tem danes služijo kruh, kmalu pa zna biti njihovo delo samo še stvar umetnih algoritmov.

Tudi VALL-E zna izmakniti marsikakšen poklic – v nevarnosti znajo biti vsi tisti zvočni govorci, ki s svojimi glasilkami v reklamah, napovednikih, animiranih filmih in igrah sestavijo neločljiv del izkušnje. Sicer nekako dvomimo, da zna VALL-E dostaviti takšen mojstrski nastop, ki ga je pričaral Christopher Judge v igrah God of War, vendar pa je čar umetne inteligence nenehno učenje in kdo ve, kam lahko poseže VALL-E.

Je pa jasno eno: umetna inteligenca postaja neločljiv del naše realnosti in nanjo se bo treba prilagoditi. Zagotovo se že pišejo novi zakoni in kaj hitro znamo dobiti tudi takšnega, ki bo z avtorskimi pravicami preprečeval oponašanje preko umetne inteligence. Treba bo pa upoštevati tudi nevarnosti, saj kmalu nikomur ne bo preprečevalo, da vas pokliče po telefonu in vas s prepričljivim oponašanjem glasu vašega bližnjega pripraviti do tega, da mu izdate podatke glede vaše kreditne kartice.

Vaša reakcija na članek?

🔥Popularno

🛎️ Sveže objave

PUSTI ODGOVOR

Prosimo, vnesite vaš komentar!
Prosimo, vnesite vaše ime