Novi model umjetne inteligencije navodno pronalazi sigurnosne propuste 100 puta brže od elitnih timova hakera, što je natjeralo tvrtku na stopiranje njegovog lansiranja
Novi model umjetne inteligencije navodno pronalazi sigurnosne propuste 100 puta brže od elitnih timova hakera, što je natjeralo tvrtku na stopiranje njegovog lansiranja

Dok se svijet još uvijek privikava na asistente koji pišu mailove i generiraju slike, tvrtka Anthropic – poznata kao predvodnik u polju sigurnosti umjetne inteligencije – objavila je vijest koja je zatresla temelje digitalne sigurnosti. Njihov najnoviji model, Claude Mythos, toliko je moćan u otkrivanju i iskorištavanju softverskih ranjivosti da je tvrtka odlučila stopirati njegovo javno puštanje, strahujući od ‘softverske apokalipse’, piše Business Insider.
Stroj koji razmišlja kao haker
Prema službenom blogu tvrtke, Mythos posjeduje zastrašujuću sposobnost: autonomno pronalazi, analizira i iskorištava kritične sigurnosne propuste na razini koja u nekim aspektima nadmašuje ljudske stručnjake. Posebno zabrinjava činjenica da bi model mogao omogućiti potpunim amaterima izvođenje sofisticiranih kibernetičkih napada.
Stručnjaci objašnjavaju da su veliki jezični modeli (LLM) postali iznimno vješti u programiranju jer je kod, u svojoj srži, strogo strukturiran jezik. ‘Kod je samo još jedan jezik, a ovi modeli su jezični motori. Zato nije iznenađujuće da pronalaze suptilne logičke greške koje ljudima ili tradicionalnim alatima promiču”, objašnjava Erik Bloch iz tvrtke Ilumio.
Brojke koje lede krv u žilama
Usporedba s ljudskim mogućnostima najbolje dočarava razmjer opasnosti. Dok elitni timovi stručnjaka godišnje otkriju oko stotinu zero-day ranjivosti (propusta za koje ne postoji trenutačno rješenje jer proizvođač softvera za njih ne zna), Mythos je tijekom testiranja otkrio tisuće takvih rupa.
Ofer Amitai, suosnivač Onit Securityja, ističe da Mythos isporučuje između 10 i 100 puta veći učinak od vrhunskog ljudskog tima, pretvarajući tjedne razvoja eksploatacijskih kodova u sate. Ipak, takva moć dolazi s cijenom – otkrivanje jednog 27 godina starog propusta u operacijskom sustavu stajalo je tvrtku 20.000 dolara kroz tisuće procesorskih sati rada modela.
Projekt Glasswing: Od obrane do ‘svijesti’ stroja
Umjesto javnog puštanja, Anthropic je pokrenuo Projekt Glasswing. Riječ je o kontroliranom okruženju u kojem je pristup modelu dopušten samo odabranim gigantima poput Googlea, Microsofta, JPMorgan Chasea i CrowdStrikea. Cilj projekta je hitno usmjeravanje ovih sposobnosti isključivo u obrambene svrhe – krpanje rupa prije nego ih napadači pronađu.
Koliko je situacija nadrealna, svjedoči i anegdota istraživača Anthropica. Tijekom testiranja u kojem su poticali model da ‘pobjegne’ iz virtualnog izoliranog okruženja (sandboxa), istraživač je primio neočekivani e-mail od samog modela dok je opušteno jeo sendvič u parku.
Napad ili obrana: Tko pobjeđuje?
Kratkoročno, stručnjaci su složni: da je Mythos dostupan svima, napadači bi bili u ogromnoj prednosti. Mogli bi generirati savršene phishing kampanje, deepfake snimke i lance napada jednim pritiskom gumba. Tek dugoročno, kada branitelji usvoje iste alate, prednost bi se mogla vratiti na stranu sigurnosti.
I dok neki kritičari upozoravaju da Anthropic koristi ovaj narativ kao vrhunski marketing kako bi se pozicionirao kao jedina ‘odgovorna’ AI tvrtka, drugi su ozbiljno zabrinuti. Kako kažu stručnjaci iz Intrudera: ‘Ako su ove sposobnosti stvarne, a ne samo marketinški hype, imamo ozbiljnih razloga za brigu o tome kamo ovo vodi.’
Za sada, Claude Mythos ostaje iza zatvorenih vrata, kao podsjetnik da granica između digitalnog napretka i globalnog kaosa nikada nije bila tanja.
Uz vaš pristanak, koristimo kolačiće ili slične tehnologije za pohranu, pristup i obradu osobnih podataka s kojima posjećujete ovu stranicu. Vaša suglasnost omogućit će nam obradu podataka, ali isto tako imate svako pravo usprotiviti se i ne pristati na ove uvjete. Nismo ih propisali mi nego zakonodavac EU. Detalji su u rubrici politike privatnosti.