Kineski DeepSeek tiho lansirao novu verziju moćnog AI modela

Kineski AI startup DeepSeek objavio je novu verziju svog modela za rezoniranje, pod nazivom DeepSeek R1-0528, bez prethodne najave i pompe. Riječ je o modelu otvorenog koda koji je već u prethodnim verzijama privukao pažnju svojom sposobnošću za matematičko zaključivanje, kodiranje i rješavanje zadataka koji zahtijevaju logički slijed. Nova verzija R1-a donosi konkretna poboljšanja – …

Kineski DeepSeek tiho lansirao novu verziju moćnog AI modela
DeepSeek Ilustracija: RatCat
Kineski DeepSeek tiho lansirao novu verziju moćnog AI modela

Kineski AI startup DeepSeek objavio je novu verziju svog modela za rezoniranje, pod nazivom DeepSeek R1-0528, bez prethodne najave i pompe. Riječ je o modelu otvorenog koda koji je već u prethodnim verzijama privukao pažnju svojom sposobnošću za matematičko zaključivanje, kodiranje i rješavanje zadataka koji zahtijevaju logički slijed.

Nova verzija R1-a donosi konkretna poboljšanja – točnost na AIME testu povećana je na 87,5%, dok je učinkovitost na benchmarku LiveCodeBench skočila s 63,5% na 73,3%. DeepSeek tvrdi kako model sada bolje razumije složene probleme i strukturira odgovore kroz tzv. ‘step-by-step reasoning’.

Za razliku od američkih modela koji dolaze s raznim ograničenjima i komercijalnim licencama, DeepSeek R1-0528 objavljen je pod MIT licencom, što znači da je slobodan za korištenje i prilagodbu. Model je već dostupan na Hugging Faceu, platformi za dijeljenje AI modela.

Lansiranje dolazi u trenutku kad su kineske tehnološke tvrtke pod sve jačim pritiskom zbog američkih ograničenja u izvozu čipova i AI tehnologije. DeepSeek ovim potezom pokazuje da razvoj moćnih AI sustava nije rezerviran samo za OpenAI, Google ili Anthropic.

Model R2 je najavljen, ali zasad bez detalja.

Aurora Stella

Aurora Stella

Keep in touch with our news & offers

Subscribe to Our Newsletter

Comments