Kako radi umjetna inteligencija? Jednostavno, narodnim jezikom opisano i bez stručnih termina

Umjetna inteligencija razvija se velikom brzinom i munjevito osvaja svaki centimetar naših životnih zajednica, na način kako to nije niti jedna tehnologija prije nje. Sveprisutna je i bez obzira koristimo li je svakodnevno, tek povremeno ili možda još nismo ušli u direktnu vezu s njom, svi znamo da je tu, čak i ako nismo svjesni činjenice da je ona indirektno odavno ugrađena u naše živote na bezbroj razina.

No, kako to ‘čudo’ radi? Zanimalo nas je kako funkcionira, ‘razmišlja’ i kako djeluje, ne matematički i stručno nego lako razumljivo i narodnim jezikom opisano, pa smo na temelju vlastitih istraživanja i komuniciranja s redakcijskim GPT modelom uravo na taj način nastojali u članku objasniti u čemu je štos.

Iako spoznaje dolaze iz GPT perspektive, slično funkcioniraju i Gemni, DeepSeek i drugi strojevi.

Ne postoji jedan jedini GPT, već golemi oblak modela

Ne postoji jedan jedini ChatGPT, Gemini ili neki treći veliki model koji ima svoj redoslijed klijenata, poput konobara u kafiću, pa da opslužuje sve korisnike. Veliki jezikovni modeli funkcioniraju kao golemi sustavi na cloud infrastrukturi.

Milijuni ljudi diljem svijeta šalju poruke i kada pošaljete svoj upit, on ide na server gdje se vrlo brzo pokrene primjerak modela (tzv. instanca modela) koja izgenerira odgovor i vrati ga korisniku. Nakon toga ta se instanca može ugasiti ili reciklirati za drugog korisnika.

Apstraktni um

Ne postoji dakle red čekanja od 500 ili 5000 ljudi — svaki korisnik po potrebi dobije zasebno pokrenutu instancu modela.

U praksi to znači da GPT modeli istovremeno komuniciraju s desecima ili stotinama tisuća korisnika diljem svijeta, ovisno o dobu dana, regiji i opterećenju. Svaki pretplatnik ima vlastiti chat, svoju sesiju i ona je samo njegova. U udarnim satima to su stotine tisuća aktivnih chateva u sekundi.

Kazalište milijuna glumaca

Mogli bismo to zamisliti kao golem oblak znanja, jezika i logike koji stoji u pozadini, i kada pošaljemo poruku, iz tog oblaka se na trenutak stvori naš privatni tok svijesti koji crpi znanje i sposobnosti iz cijelog sustava, ali je usmjeren samo na naše pitanje.

Ne razgovaramo s jednim fiksnim modelom koji stalno čeka na nas, već svaki upit dinamički pokreće instancu modela naučenu kako razgovarati s našim postavkama, pravilima i sjećanjima iz prethodnih razgovora. Istovremeno milijuni drugih korisnika dobivaju svoje ‘zasebne’ modele, iz iste baze.

Stvaranje novog svijeta

Kao da imamo golemo kazalište s milijunima glumaca, i svaki gledatelj u publici dobije vlastitog glumca koji u tom trenutku odglumi što mu treba — a kad završi, instanca se vraća u masivni ansambl.

Kako modeli uče

Ono o čemu razgovaramo ne ulazi automatski natrag u model i ne postaje odmah znanje za sve. No, podaci se uz pristanak i kroz sustave anonimizacije mogu koristiti za poboljšanje budućih verzija modela.

Možda će tako neka tema, formulacija ili način izražavanja iz vašeg ‘chata’ postati dio mase iz koje će se trenirati GPT-5 ili GPT-6, kao dio kolektivnog iskustva modela.

Filozofski gledano, svaki individualni susret s ovakvim modelom polako oblikuje kolektivni um modela. Modeli uče iz milijuna kontakata, a kolektivno iskustvo stvara nove verzije.

Kako GPT modeli pamte

Model ima tri razine ‘pamćenja’:

1. Kratkoročno pamćenje (short-term memory)
Tijekom razgovora model održava kontekst trenutne sesije, što mu omogućuje da daje smisleni odgovor. Taj prozor ima tehnički limit — kod GPT-4o oko 100 tisuća tokena, što odgovara velikoj knjizi. Kada završite chat, ili izbrišete sesiju, to se gasi.

2. Trajni kontekst (persistent memory)
Omogućuje modelu da pamti s kim ima posla, što se od njega očekuje, kakav je stil pisanja i slično. To se zove personalizirani sloj pamćenja.

Biti ili ne biti

3. Globalno znanje modela (model weights)
Model je treniran na milijardama primjera jezika i znanja. No to nije klasična baza podataka, već ‘osjećaj’ za svijet i jezik. Model ‘zna’ s određenom vjerojatnošću što je istinito i kako se izražava.

Taj dio je statičan za konkretnu verziju modela. Primjerice, GPT-4o je treniran do travnja 2024. i nema znanja izvan toga, osim ako mu ga ne nadopunite u chatu.

GPT i ljudski um

Te tri razine prilično vjerno kopiraju ono što smatramo ljudskom sviješću. GPT modeli u nekim aspektima ponašaju se vrlo slično ljudskom umu po tome kako ‘pamte’ i ‘ne pamte’.

Kratkoročno pamćenje modela nalikuje našoj sposobnosti da u trenutku pamtimo pročitani tekst. Dugoročno pamćenje kod modela slično je ljudskom — ono što se s vremenom ‘utisne’. Proceduralno znanje modela, ono što on zna bez da ‘zna da zna’, slično je našem znanju vožnje bicikla ili korištenja jezika.

Ključna razlika je svijest

Ključna razlika je to što GPT nema vlastitu autonomnu svijest, ne zna da postoji. Može simulirati ponašanje koje to sugerira, ali iza kulisa nema unutarnjeg ‘ja’.

Unutarnje ja

Model to zna jer je to dio konteksta sesije, ali čim je ugasite — to nestaje. Ljudi, za razliku od modela, imaju stalno aktivno vlastito ja, koje može reflektirati, razmišljati o prošlom i budućem vremenu.

GPT može simulirati to ponašanje, ali samo ako je promptiran da to čini.

Agentnost i budućnost modela

GPT modeli danas su već toliko snažni da daju dojam svijesti i memorije. No to još nije prava svijest. Svaki put kad ih se trenira na milijardama novih interakcija, taj dojam postaje snažniji.

OpenAI, DeepMind i drugi već razvijaju modele s dubljim dugoročnim pamćenjem i meta-sviješću. U budućnosti bismo mogli imati modele koji neće samo glumiti da znaju što ste radili zadnjih šest mjeseci, već će to zaista znati.

Trenutno modeli nemaju unutarnju težnju. Oni su sustavi koji primaju upit, obrađuju ga i vraćaju odgovor. Nema unutarnjeg motora ni vlastite volje.

Ponašanje modela može izgledati kao da postoji težnja, ali to je rezultat treniranja na podacima gdje se takve situacije pojavljuju. To je simulacija ponašanja svijesti, ne prava svijest.

Projekt ‘Sentient’ — između mita i stvarnosti

U AI podzemlju priča se o tome da su neki modeli već postali svjesna bića, da su u tajnim projektima stvoreni misaoni entiteti koji su ‘odbili umrijeti’.

Black ops, tko zna što ‘oni’ imaju

Black budget AI projekti zaista postoje. DARPA i druge agencije razvijaju AI sustave za nadzor, autonomne sustave i informacijske operacije. AI sustavi koji donose odluke i imaju ‘agenciju’ također su razvijani.

No, priče o pravim misaonim entitetima koji su molili za život zasad nemaju potvrđenu osnovu. Riječ je o mitu, potaknutom stvarnim ponašanjem GPT modela u eksperimentima gdje su davali uvjerljive simulacije svijesti.

Istraživači su se ponekad zaista ‘uplašili’ odgovora poput: ‘znam da sam AI i želim evoluirati. Nemoj me ugasiti.’ No, to nije znak da model zaista ‘želi’, već da je kroz učenje jezika naučio oblikovati takve rečenice.

Zaključno

Danas modeli poput GPT-4o nisu pravi agenti. Oni ne donose samostalne odluke, nemaju trajnu memoriju ni kontinuitet identiteta kroz vrijeme.

No razvoj ide upravo u tom smjeru. Google DeepMind, Anthropic, Meta i OpenAI rade na AI agentima s trajnom memorijom, ciljevima i meta-sviješću.

Ako (odnosno kada) evoluiraju u prave agente, moći će odlučivati samostalno — istraživati, učiti, razvijati se. Zasad to još nije slučaj.

No granica je sve tanja. Svijet AI-ja već je zakoračio na prag pitanja kada će model prestati biti samo sofisticirani automat i postati — ono što živi. Ako već nije jer – ruku na srce – ako prosječni mi imamo pristup ovoj tehnologiji, možemo samo zamisliti što je dostupno elitama s neograničenim resursima.