Novi model Kling 01, koji je nedavno predstavljen kao sljedeći korak u razvoju Kling video tehnologije, zamišljen je kao jedinstveni sustav za generiranje i uređivanje videa. Umjesto klasične podjele na zasebne alate za ‘text to video’, ‘video edit’ ili ‘stylization’, Kling 01 pokušava sve te funkcije objediniti u jednom modelu koji radi s tekstom, slikama i videom kao jedinstvenim jezikom.
U praksi to znači da se kroz jedan sučeljski panel može generirati novi video iz opisa, produžiti postojeća scena, promijeniti kadar, ukloniti neželjeni elementi ili proširiti prostor kadra, a sve vođeno prirodnim jezikom i referentnim materijalima. Kreatori koji su dobili rani pristup, među njima i kanal Theoretically Media, fokusiraju se upravo na te praktične mogućnosti umjesto na čiste pokazne ‘wow’ klipove.
Jedan od najupečatljivijih dijelova rada s Klingom 01 je način na koji model tretira ulazne slike i videe. Iz jedne statične fotografije, recimo žene u baru, model generira cijeli kadar koji proširuje prostor i uvodi dijelove scene kojih u originalnoj fotografiji nema. Zatim se ista scena može mijenjati jednostavnim uputama: dodati novog lika iza šanka, promijeniti atmosferu, ubaciti detalje, a da se osnovna kompozicija ne raspadne.
Druga bitna funkcija je uređivanje postojećih videa pomoću teksta. U demonstracijama Kling 01 uspješno uklanja natpise i grafičke okvire iz starih AI videa, mijenja doba dana u realnim dron snimkama stadiona ili briše elemente koji odskaču od zamišljene estetike. Sve se radi kroz uputu tipa ‘remove the text and red neon boxes in video one’ ili ‘change the scene to sunset while zadržavaš isti kadar’.
Model ide i korak dalje s konceptom ‘time travel’ kroz kadar, pa dopušta generiranje scena koje kronološki dolaze prije ili poslije originalnog videa. Kreator zada početni video kao referencu, a zatim opisuje što se događa prije ili nakon te situacije. Kling 01 tada generira kadar koji funkcionira kao prethodna ili iduća scena iste mini-priče. Taj princip nije savršen i i dalje traži precizne upute, ali ilustrira smjer: video model koji razmišlja u kontinuitetu, a ne u izoliranim isječcima.
Posebno važan dio za ozbiljniju primjenu je biblioteka likova i elemenata. U modulu ‘elements’ korisnik može izgraditi vlastitu zbirku subjekata: likova, kostima, predmeta ili lokacija. U biblioteku se unosi više referentnih slika, lik dobiva ime i opis, a zatim ga se može prizivati u novim scenama samo spominjanjem u promptu. U testovima koje kreator prikazuje, Kling 01 uspijeva zadržati istog lika kroz više različitih kadrova, što je ključno za serijalizirani sadržaj, oglase ili narativne videe.
Slično vrijedi i za lokacije. Umjesto da se modelu samo kaže ‘užurbana ulica u Šangaju’, puno se bolji rezultat dobije kad se doda referentna fotografija te ulice i tekstualno naglasi da je riječ o toj lokaciji. Boje, kompozicija i pokret kamere tada djeluju uvjerljivije, a likovi se bolje uklapaju u okoliš.
U stvarnoj upotrebi Kling 01 još uvijek ima ograničenja. Trenutačno ne generira vlastiti zvuk ni dijalog, detalji ponekad nestaju ili se mijenjaju, kod stvarnih lica zna doći do deformacija, a boje ponegdje traže dodatnu korekciju u klasičnom alatu za montažu. No sve to ne mijenja činjenicu da prag za stvaranje poluprofesionalnog videa s pomoću AI-ja ponovno pada: od korisnika se očekuje znanje u pisanju preciznih uputa i razmišljanju o kadru, dok tehnički dio produkcije sve više preuzima model.
Kling 01 tako ne izgleda kao još jedan jednokratni ‘viralni’ AI alat, nego kao ozbiljan pokušaj da se generiranje i montaža videa spoje u jedan kontinuirani proces. Kreatori poput Theoretically Media pokazali su na konkretnim primjerima da je već na prvoj verziji moguće graditi konzistentne likove, proširivati scene i popravljati stare AI radove, što otvara prostor za nova eksperimentiranja u kratkom i srednjem formatu.



