Razvoj umetne inteligence gre nezadržno naprej in v njem ledino orje podjetje OpenAI, ki je vse lepote umetne pameti splošni javnosti predstavil preko svojega, zdaj že slavnega, bota ChatGPT. S tem smo do sedaj komunicirali zgolj tekstovno, a OpenAI zdaj zlagoma pripravlja posodobitev, ki bi botu dodala možnost glasovne komunikacije.
Uporaba bo preprosta, saj bomo samo zagnali aplikacijo, ki je na voljo preko Android in iOS operacijski sistem, nakar bomo stisnili gumb za govorjenje in zabava se lahko začne. OpenAI je pokazal kratki demo, ki pokaže novo funkcijo v praksi, v njem pa uporabnik bota zaprosi, da si izmisli pravljico o ježku, nakar ta skoraj takoj pripravi scenarij, uporabnik pa mu medtem med govorjenjem lahko zastavlja vprašanja, ki malce bolje razložijo nekatere dogodke znotraj avantur ježka.
Chatgpt can now see, hear and talk! Multimodality is finally here 🔥
byu/The_sky_is_bluish inChatGPT
ChatGPT zna že presneto dobro oponašati človeški glas, na voljo pa bomo imeli pet različnih glasov, med katerimi bomo lahko prosto izbirali. OpenAI pravi, da se je za glasovno igranje povezal s petimi profesionalnimi igralci, ki so umetni pameti posredovali vzorce svojega govora, nakar je ta iz tega bila zmožna prepričljivega oponašanja njihovih vzorcev. Ironično so ti igralci pljunili v svojo skledo, saj je ravno umetna inteligenca tista, ki ogroža njihov poklic.
Nova posodobitev bo s sabo prinesla tudi možnost prepoznavanja slik. Razvijalec je tudi za to funkcijo pokazal nekaj praktičnih primerov, saj je uporabnik najprej slikal svoje kolo in nato ChatGPT povprašal, kako bi na njem spustil sedež. Potem se je spustil še v podrobnosti kot je denimo slikanje dela kolesa, ki jih je ChatGPT znal razbrati, nakar smo prišli celo do točke, ko je uporabnik pred kamero postavil navodila in svoja orodja in bota povprašal za nasvet, če mu pri sestavi morda manjka kakšno dodatno orodje.
S tem smo popraskali samo po površju vse funkcionalnosti, ki jih prinaša nova posodobitev. ChatGPT bo denimo znal mlajšim povedati zgodbo za lahko noč, s kamero pa bomo lahko tudi slikali vsebino hladilnika in bota nato povprašali, da iz teh sestavin skupaj spravi nek okusen recept.
OpenAI se je še pohvalil, da se je povezal s Spotifyjem, ta pa je zdaj začel delati na samodejnem prevajanju podcastov v druge jezike. Stvar je še na začetkih, a nekatere epizode so že bile prevedene v španščino, rezultate pa si lahko ogledate na sledeči povezavi.
Nova posodobitev se razširja postopoma in bo najprej na voljo vsem tistim, ki plačujejo naročnini Plus in Enterprise, kasneje pa bo na voljo tudi za navadne uporabnike. Zanimivo bo videti, kako se bo stvar obnesla v slovenščini ali pa bo vsa ta funkcionalnost na voljo samo angleško govorečim uporabnikom.