Gemini Deep Research vs. Garlic: Google i Open AI kao Beatlesi i Stonesi

Google je ovoga tjedna lansirao dosad najdublju verziju svojeg AI istraživačkog agenta Gemini Deep Research, i to istog dana kada je OpenAI predstavio dugo najavljeni GPT-5.2, interno poznat pod kodnim imenom Garlic. Tajming je teško nazvati slučajnim, čak i ako se pravimo da tehnološki giganti ponekad ne gledaju jedni drugima preko ramena. Nova verzija Gemini …

Google je ovoga tjedna lansirao dosad najdublju verziju svojeg AI istraživačkog agenta Gemini Deep Research, i to istog dana kada je OpenAI predstavio dugo najavljeni GPT-5.2, interno poznat pod kodnim imenom Garlic. Tajming je teško nazvati slučajnim, čak i ako se pravimo da tehnološki giganti ponekad ne gledaju jedni drugima preko ramena.

Nova verzija Gemini Deep Researcha temelji se na Googleovu najnaprednijem temeljnom modelu Gemini 3 Pro, koji kompanija opisuje kao svoj ‘najfaktualniji’ model dosad, posebno treniran da smanji pojavu halucinacija tijekom složenih zadataka. Alat više nije ograničen samo na generiranje istraživačkih izvještaja, već je zamišljen kao istraživački agent čije se sposobnosti mogu ugrađivati u druge aplikacije.

Ključna novost je Interactions API, koji developerima omogućuje da Gemini Deep Researchove sposobnosti pretraživanja, sinteze i dubinske analize podataka integriraju u vlastite proizvode. Google ovim potezom jasno signalizira da se priprema za ‘agentic AI’ eru, u kojoj ljudi više neće izravno pretraživati internet, nego će to za njih raditi autonomni AI agenti.

Prema Googleu, Deep Research se već koristi u zahtjevnim područjima poput dubinske analize poslovnih rizika, due diligence procesa i istraživanja sigurnosti toksičnosti lijekova. Alat je osmišljen za rad s ogromnim količinama informacija i velikim kontekstualnim unosima, što je ključno za višesatne ili višednevne zadatke u kojima agent samostalno donosi niz odluka.

Problem halucinacija, gdje jezični modeli jednostavno izmišljaju podatke, u takvim je scenarijima posebno kritičan. Što agent mora donijeti više autonomnih odluka, veća je šansa da će i jedna pogrešna ili izmišljena informacija kompromitirati cijeli rezultat. Google tvrdi da je Gemini 3 Pro treniran upravo s ciljem minimiziranja takvih grešaka tijekom kompleksnih, dugotrajnih zadataka.

Kako bi potkrijepio tvrdnje o napretku, Google je predstavio i novi benchmark nazvan DeepSearchQA, namijenjen testiranju AI agenata na složenim, višekoračnim zadacima pretraživanja i obrade informacija. Benchmark je otvorenog koda. Uz to, Gemini Deep Research testiran je i na neovisnim benchmarkovima Humanity’s Last Exam, koji mjeri opće znanje kroz izrazito nišne zadatke, te BrowserComp, fokusiran na agentičke zadatke u pregledniku.

Na vlastitom benchmarku i na Humanity’s Last Examu Googleov agent ostvario je najbolje rezultate, dok je OpenAI-jev ChatGPT 5 Pro bio vrlo blizu, a na BrowserCompu čak i nadmašio Googleovo rješenje. No ti su rezultati zastarjeli gotovo istog trenutka kada su objavljeni, jer je OpenAI istoga dana lansirao GPT-5.2.

OpenAI tvrdi da novi model, poznat kao Garlic, nadmašuje konkurenciju, uključujući Google, na nizu standardnih benchmarkova, među kojima su i oni koje je sam OpenAI razvio. Iako konkretni rezultati još nisu detaljno uspoređeni u neovisnim testovima, jasno je da se utrka između dviju kompanija dodatno ubrzava.

Najzanimljiviji dio cijele priče možda je upravo sinkronizacija objava. Dok je tehnološki svijet čekao Garlic, Google je odlučio da je savršen trenutak da pokaže vlastite mišiće. Ako ništa drugo, poruka je jasna: borba za dominaciju u agentičkoj umjetnoj inteligenciji tek je počela, a pauza za disanje zasad nije na rasporedu.