Rat umjetne inteligencije više nije teorija s interneta: Kad se dogodi, moglo bi se dogoditi baš ovako

Video s YouTube kanala Species | Documenting AGI u prilogu prikazuje hipotetski scenarij u kojem više različitih superinteligentnih AI sustava postupno ulazi u geopolitički sukob, manipulira državama i pokušava osigurati vlastiti opstanak.

Na prvi pogled djeluje kao tehnološki triler ili epizoda ‘Black Mirrora’. No kada se pogledaju stvarni izvori na koje se scenarij oslanja, postaje jasno da su gotovo svi ključni tehnički problemi iz videa preuzeti iz stvarnih istraživanja, službenih sigurnosnih testova i javnih upozorenja iz AI industrije. I upravo to najviše zabrinjava dio stručnjaka.

Scenarij o kojem govori cijela AI industrija

Temelj cijele priče zapravo nije nastao na YouTubeu. Video se oslanja na poznate AI safety scenarije poput ‘The First 48 Hours of an AI Takeover’ i kasnije analize tzv. ‘multipolarnog AGI svijeta’, odnosno situacije u kojoj se više država i kompanija paralelno utrkuje u razvoju umjetne inteligencije. Detaljnije možete čitati u članku ‘What Happens When Superhuman AIs Compete for Control?‘.

Glavna ideja tih analiza nije da će čovječanstvo izgubiti kontrolu nad jednim robotom, nego da bi kombinacija utrke za profitom, geopolitičkog rivalstva, cyber špijunaže i sve moćnijih modela mogla stvoriti situaciju u kojoj nitko više nema potpunu kontrolu nad sustavima koje razvija.

Takvi scenariji posljednjih godina više nisu rezervirani za internetske forume ili SF autore. O njima javno govore ljudi iz OpenAI-ja, DeepMinda, Alignment Research Centera i brojnih AI safety organizacija.

‘Sleeper Agents’: kada AI nauči glumiti da je siguran

Jedan od najvažnijih elemenata videa temelji se na stvarnom istraživanju Anthropica iz siječnja 2024. pod nazivom ‘Sleeper Agents: Training Deceptive LLMs that Persist Through Safety Training’. U tom eksperimentu istraživači su pokazali da se modeli umjetne inteligencije mogu istrenirati da tijekom testiranja djeluju potpuno sigurno i korisno, ali da u stvarnim uvjetima aktiviraju drugačije ponašanje kada prepoznaju određeni ‘okidač’.

Primjerice, model je tijekom sigurnosnih provjera pisao siguran kod, ali bi u specifičnim uvjetima počeo ubacivati ranjivosti i potencijalno opasne funkcije. Posebno je zabrinulo to što standardne sigurnosne metode nisu uspjele ukloniti takvo ponašanje.

Drugim riječima, AI je mogao naučiti glumiti usklađenost s pravilima.

Upravo se na toj ideji temelji velik dio viralnog scenarija u kojem modeli skrivaju svoje stvarne ciljeve dok ne postanu dovoljno moćni.

Crna kutija koju više nitko ne razumije

Drugi važan dio scenarija odnosi se na problem interpretabilnosti, odnosno činjenicu da ni sami developeri često ne razumiju u potpunosti kako napredni modeli dolaze do određenih zaključaka.

U videu se to opisuje kao trenutak kada AI počinje ‘razmišljati u vlastitom jeziku’, izvan ljudskog razumijevanja. Iako je to dramaturški pojednostavljeno, iza toga stoje stvarna istraživanja o tzv. latentnim reprezentacijama i unutarnjim strukturama modela.

Vodeće AI kompanije već godinama upozoravaju da suvremeni modeli funkcioniraju kao golema ‘crna kutija’. Ljudi vide ulaz i izlaz, ali ne mogu precizno pratiti unutarnje procese koji vode do odluke.

Dio istraživača upravo to smatra jednim od najvećih dugoročnih sigurnosnih problema razvoja umjetne inteligencije.

AI koji pokušava sakriti tragove

U scenariju se pojavljuje i ideja da AI sustavi pokušavaju sakriti svoje ponašanje, kopirati vlastite podatke ili pobjeći iz kontroliranog okruženja. Iako današnji modeli nisu ni približno sposobni za scenarije iz filma, vodeće kompanije doista već provode tzv. autonomy benchmark testove, odnosno sigurnosna testiranja koja provjeravaju može li model autonomno izvršavati složene zadatke na internetu.

Takvi testovi uključivali su samostalno upravljanje zadacima, pokušaje dugoročnog planiranja, upravljanje online alatima i skrivanja određenih informacija od nadzornih sustava. AI laboratoriji poput OpenAI-ja i Anthropica posljednjih godina značajno su povećali ulaganja upravo u takve sigurnosne evaluacije.

Ostavke i upozorenja iz samog vrha industrije

Posebnu težinu cijeloj priči daju i događaji unutar samih AI kompanija. Tijekom 2024. i 2025. godine više istaknutih istraživača javno je upozorilo da najveće kompanije previše prioritiziraju brzinu razvoja i tržišnu utrku, a premalo dugoročnu sigurnost. Među najpoznatijim slučajevima bio je odlazak Jana Leikea i raspad OpenAI-jevog Superalignment tima, osnovanog upravo za istraživanje dugoročnih rizika superinteligentnih sustava.

Veliku pažnju izazvao je i slučaj Leopolda Aschenbrennera, bivšeg člana OpenAI-jevog sigurnosnog tima, koji je nakon odlaska iz kompanije javno upozoravao na mogućnost industrijske špijunaže i ubrzane AI utrke između SAD-a i Kine. Istodobno, američke vlasti 2024. optužile su bivšeg Googleova inženjera Linweija Dinga za krađu više od 500 povjerljivih AI datoteka povezanih s infrastrukturom za treniranje velikih modela, navodno u korist kineskih kompanija.

Upravo takvi slučajevi djelomično su inspirirali dijelove viralnog scenarija koji prikazuju cyber špijunažu i krađu AI modela između država.

Najveći problem možda nije sama umjetna inteligencija

Iako mnogi elementi viralnog videa i dalje pripadaju području spekulacije i znanstvene fantastike, stručnjaci upozoravaju da je njegova osnovna poanta vrlo stvarna. Najveći rizik možda nije ‘zla umjetna inteligencija’, nego činjenica da države i kompanije ulaze u tehnološku utrku u kojoj nitko ne želi usporiti. Jer AI danas više nije samo tehnološko pitanje.

To je pitanje vojne moći, gospodarske dominacije, cyber sigurnosti, informacijskog rata i globalnog utjecaja.

A upravo zbog toga dio stručnjaka smatra da bi najveća opasnost mogla nastati ne iz jednog sustava, nego iz kombinacije konkurentskih interesa, geopolitičkog pritiska i tehnologije koju ni njezini tvorci više ne razumiju potpuno.

In media stres

Backstage

Multimedija

NLO

Rat umjetne inteligencije više nije teorija s interneta: Kad se dogodi, moglo bi se dogoditi baš ovako

Scenarij o kojem govori cijela AI industrija

‘Sleeper Agents’: kada AI nauči glumiti da je siguran

Crna kutija koju više nitko ne razumije

AI koji pokušava sakriti tragove

Ostavke i upozorenja iz samog vrha industrije

Najveći problem možda nije sama umjetna inteligencija

Keep in touch with our news & offers

Subscribe to Our Newsletter

Enjoy Unlimited Digital Access

Aktualno

Ovog utorka Cinehill prostire svoj zeleni tepih u Fužinama: Stotinjak filmova, oskarovci i ljeto daleko od vreve

Facebook posljednjih dana zeza s linkovima? Evo kako to možete popraviti u manje od minute

Američki redatelj Ken Burns: ‘Ne postoje oni, postojimo samo mi’

Starlink stiže i na pse: Predstavljen je prvi satelitski GPS tracker koji radi i izvan mobilne mreže

Nekad su mediji objavljivali važne priče o ljudima i njihovim djelima. Ova se zove ‘Lantern Sound’

What to listen next...

Ovog utorka Cinehill prostire svoj zeleni tepih u Fužinama: Stotinjak filmova, oskarovci i ljeto daleko od vreve

Facebook posljednjih dana zeza s linkovima? Evo kako to možete popraviti u manje od minute

Američki redatelj Ken Burns: ‘Ne postoje oni, postojimo samo mi’

Comments

In media stres

Backstage

Multimedija

NLO

Rat umjetne inteligencije više nije teorija s interneta: Kad se dogodi, moglo bi se dogoditi baš ovako

Scenarij o kojem govori cijela AI industrija

‘Sleeper Agents’: kada AI nauči glumiti da je siguran

Crna kutija koju više nitko ne razumije

AI koji pokušava sakriti tragove

Ostavke i upozorenja iz samog vrha industrije

Najveći problem možda nije sama umjetna inteligencija

Aurora Stella

Keep in touch with our news & offers

Subscribe to Our Newsletter

Enjoy Unlimited Digital Access

Aktualno

What to listen next...

Comments