OpenAI je zadnjega dana rujna predstavio Sora 2, novu verziju svog modela za generiranje videa iz tekstualnih uputa. Riječ je o velikom iskoraku u odnosu na originalnu verziju Sorinog modela, predstavljenu u veljači 2024., koja je tada označena kao trenutak u kojem je umjetna inteligencija prvi put uvjerljivo zakoračila u područje video produkcije. Novi model sada donosi veću realističnost, preciznije oponašanje stvarnih kretanja ljudi i objekata, unaprijeđenu kontrolu nad procesom kreacije te mogućnost generiranja zvuka i sinkroniziranog dijaloga.
OpenAI naglašava da Sora 2 nije samo nadogradnja, već svojevrsni temelj za razvoj budućih sustava umjetne inteligencije koji bolje razumiju fizički svijet. Model je treniran na velikim količinama video podataka, a cilj je postizanje napredne simulacije stvarnosti, što je dosad bio veliki izazov u AI istraživanjima.
Nova aplikacija i društvena dimenzija
Uz lansiranje Sore 2, predstavljena je i nova iOS aplikacija nazvana jednostavno Sora. Ona funkcionira kao društvena i kolaborativna platforma, inspirirana formatima poput TikToka, ali u potpunosti pokretana generativnom umjetnom inteligencijom. Korisnici mogu stvarati kratke videozapise u trajanju do 10 sekundi, kombinirati i remiksirati tuđe radove te ih dijeliti s prijateljima.
Posebna značajka aplikacije je mogućnost stvaranja tzv. cameo videa, u kojima se mogu pojaviti prijatelji, ali samo uz njihovu izričitu dozvolu. OpenAI je uveo sustav privola kako bi se spriječile zloupotrebe, a osobe čiji se lik koristi imaju pravo povući pristanak u bilo kojem trenutku. Time se, barem djelomično, pokušava odgovoriti na etičke i pravne dileme vezane uz deepfake tehnologiju.
Aplikacija je trenutno dostupna isključivo u Sjedinjenim Državama i Kanadi te funkcionira po principu pozivnica. Svaki korisnik koji dobije pristup ima pravo podijeliti četiri pozivnice, a širenje na druga tržišta planirano je u sljedećim fazama. Android verzija zasad nije najavljena.
Što donosi Sora 2
Sora 2 u odnosu na prvu verziju donosi niz značajnih unapređenja. Novi model bolje razumije uzročno-posljedične odnose i složeniju fiziku, pa su pokreti ljudi i objekata prirodniji. Scenski prikazi, uključujući kameru u pokretu, izgledaju uvjerljivije, a sustav sada omogućuje i generiranje zvuka te sinkroniziranih dijaloga.
Korisnicima se nudi mogućnost odabira omjera slike, rezolucije, trajanja i broja varijacija videa. Jednom kad je video generiran, u aplikaciji se može dodatno uređivati pomoću Sora Video Editora, gdje je moguće obrezivati isječke, dodavati prijelazne efekte ili stvarati besprijekorne petlje.
OpenAI naglašava kako je u model ugrađena i zaštita od zloupotreba: ne mogu se generirati videozapisi nasilnog, seksualnog ili sadržaja temeljenog na mržnji, a posebno je zabranjeno generiranje videa javnih i slavnih osoba bez njihovog pristanka.
Kako doći do pristupa
Za većinu zainteresiranih korisnika najveće pitanje ostaje – kako dobiti pristup? Trenutno nema javno dostupne liste čekanja, a aplikacija funkcionira isključivo putem pozivnica. To znači da je pristup ograničen na mali broj odabranih korisnika i njihovih kontakata.
OpenAI je u prošlosti koristio mrežu stručnjaka, tzv. red teamera, koji su testirali ograničenja i potencijalne zloupotrebe novih modela. Pretpostavlja se da su upravo oni, uz dio odabranih partnera i kreatora, među prvima dobili pozivnice za korištenje Sore 2. S obzirom na iskustvo s prethodnim generativnim alatima, očekuje se da će lista čekanja za širu javnost biti otvorena naknadno i objavljena na službenim kanalima tvrtke.
Cijena i dostupnost
Sora 2 trenutačno nije dostupna kao besplatan alat. U prvoj fazi, korisnici će do modela moći pristupiti kroz premium pakete ChatGPT-a, poput Plus i Pro pretplate. Planovi uključuju različite razine mogućnosti – od videa u 720p rezoluciji i trajanja do 10 sekundi, do naprednijih opcija u Full HD rezoluciji i dužem trajanju.
U Velikoj Britaniji, primjerice, ChatGPT Plus plan stoji 20 funti mjesečno, dok Pro verzija košta 200 funti. Viši paket omogućuje generiranje dužih i kvalitetnijih videa, bez vodenih žigova, kao i pristup dodatnim funkcijama unutar ChatGPT-a, uključujući napredni GPT-5 model i proširene mogućnosti za rad s datotekama i agentima.
Što ovo znači za budućnost
Lansiranje Sore 2 pokazuje da umjetna inteligencija ulazi u novu fazu, u kojoj video postaje jednako dostupan kao tekst i slika. Ako je prva verzija bila dokaz koncepta, druga potvrđuje da generativni video modeli mogu postati široko primjenjivi – u kreativnim industrijama, edukaciji, medijima i zabavi.
S druge strane, ostaju otvorena pitanja oko etike, regulative i potencijalne zloupotrebe. OpenAI pokušava prevenirati problem kroz ograničenja i sustave privola, ali bit će ključno vidjeti kako će se ovi alati koristiti u praksi. U svakom slučaju, jasno je da je video kreiran umjetnom inteligencijom stigao do točke u kojoj ga je teško razlikovati od stvarnog, što će snažno utjecati na način na koji konzumiramo medije i informacije.



