Pár éve, amikor az AI még igen korlátozottan volt képes képet – pláne videót – előállítani, sokan azt gondolták, hogy csak egy vicces agymenés, ami valószínűleg pár éven belül eltűnik, hiszen a valóságtól teljesen elrugaszkodva ábrázolja az embert. Akkoriban nem voltak megfelelően ábrázolva a kezek, arcok, kézfogást ábrázolni pedig egyszerűen lehetetlennek tűnt. Azonban néhányan már akkor is látták, hogy ez a technológiai újítás a következő pár évben rengeteget fejlődhet – megfelelő fejlesztéssel és persze kellő mennyiségű pénzzel. Mára pedig egyre valósághűbb képeket és videókat lehet generálni, néha még a szakavatott szemnek is kell pár másodperc, hogy megállapítsa, hogy az adott videó valódi, vagy esetleg AI által készült.
VICCES VIDEÓKTÓL A FILMFESZTIVÁLIG
A mesterséges intelligencia ma már egyre több mindenre jó, na de vajon hogy ábrázolja a híres hollywoodi színészt, Will Smith-t, miközben spagettit eszik? – gondolta valaki, mára pedig meghatározó lett, hogy egy AI modell hogyan mutatja be a jelenetet.
A mémeken túl pedig a kreatív szakma is egyre több területen használja az AI-t, elég csak arra gondolni, hogy a fotósok és grafikusok körében gyakran használt Photoshop is már évek óta tud AI segítséggel képeket manipulálni. Persze a filmesek és a videójáték készítők is előszeretettel használják, van aki posztert generáltat vele, van aki pedig forgatókönyvet irat. Éppen ezért már a filmfesztiváloknak is ideje állást foglalniuk az AI eszközök használata kapcsán, hogyan a díjazások során egyértelmű szabályokat kövessenek. Több szakmai szervezet még a 2023-as hollywoodi sztrájk során fogalmazta meg a mesterséges intelligenciával kapcsolatosa aggályait, éppen ezért a szervezetek szabályokba foglalták, hogy mi a megengedett, és mi nem egy sorozat vagy film elkészítése során.
Már olyan cégek és kiadók használják a technológiát, mint a Washington Post, ahol AI segítséggel jelennek meg véleménycikkek, vagy a Google, ami a keresőmotor mellett már az emailkhez is Gemini mesterséges intelligenciát ad, vagy a Meta, ahol már 2026-ra mesterséges intelligencia által készült reklámokat vizionálnak. Mégis, a kreatív szakmák esetében sokan szkeptikusak, hiszen az AI modellek sokszor jogtalanul lettek tanítva, írók munkái, filmek, vagy a közösségi médiába feltöltött adatok alapján.
Azért, hogy megmutassák a benne rejlő potenciált, a Tribeca Studios által megrendezett Tribeca Festival filmfesztivál bejelentette, hogy jövőre az OpenAI céggel együttműködve hoznak létre két olyan rövidfilmet, amihez AI-t használnak – miközben betartják a szakma által meghatározott szabályokat. Így az egyik első olyan filmfesztivál lesz, egy pályázat részeként lehet AI segítséggel készült filmet készíteni.
A Tribeca és az OpenAI számára nem csak az a fontos, hogy egy év alatt létrehozzanak egy olyan rövidfilmet, ami felülmúlja a legújabb Will Smith spagetti evős videót, hanem közben eredeti is kell legyen a kész mű, hiszen bármilyen egyezés korábbi anyagokkal egy újabb szakma haragját válthatja ki. Ráadásul a pályázat kapcsán kikötött minden szabályt –, ami az írók (Writers Guild), színészek (SAG-AFTRA) és rendezők (Directors Guild) szövetségének szabályzatába foglaltak az AI használatát illetően – kötelezően be kell tartani.
A filmfesztivál már tavaly is kísérletezett a mesterséges intelligencia bevonásával, amikor létrehozták a Sora Shorts nevű kezdeményezést. Akkor a cél még csak az volt, hogy az OpenAI Sora modelljével , – ami szövegből tudott képi anyagot generálni – öt rövid jelenetet alkossanak.
Az OpenAI és a Tribeca Studios által meghirdetett egyéves program során két alkotó finanszírozást, képzést és mentorálást kap, feladatuk pedig az lesz, hogy a 2026-os premierig élőszereplős rövidfilmet csináljanak. A filmfesztiválos premier mellett pedig lesz egy pódiumbeszélgetés is, ami az AI és a filmek kapcsolatáról szól majd – itt valószínűleg a tapasztalatokról és a lehetőségekről beszélnek majd a szakemberek. A két alkotó kiléte még nem ismert, ugyanis egy pályázat során dől majd el, hogy ki az a két rendező, aki a támogatást elnyeri.
A Tribeca esetében a történetmesélés áll minden tevékenységünk középpontjában – az innováció pedig kulcsfontosságú a jövőnk szempontjából. Az OpenAI-val való partnerség lehetővé teszi számunkra, hogy egy új, kreatív terület élvonalába lépjünk, ahol a mesterséges intelligencia nem helyettesíti a meglévőket, hanem egy újabb hatékony eszköz a filmesek eszköztárában. Ez az együttműködés tükrözi a Tribeca elkötelezettségét a művészek támogatása iránt, akik hajlandóak felfedezni, kísérletezni és feszegetni szakmájuk határait
– mondta Jane Rosenthal, a Tribeca Enterprises társalapítója és vezérigazgatója egy nyilatkozatban.
Az AI bevonásával készült film megmutathatja, hogy ténylegesen mennyit fejlődött a generatív mesterséges intellingecia, hiszen míg a hobbiból alkotók csak a korlátozott eszközöket használhatják, addig az OpenAI a filmfesztiválhoz biztosítja a legjobb és legújabb modellt.
A The Cleaner című, AI által készült rövidfilmet a Google Veo modellje alkotta meg teljes egészében és bár sok múlik a vágásokon, az látszik, hogy több filmből képes átvenni ismert elemeket, valamint alkalmazni azokat, ráadásul a megvalósítás is messze jobban sikerült, mint az bármely korai Will Smith videó.
Aki lemarad, kimarad
Míg másfél éve szórakoztató volt mindenféle képet generálni különböző AI modellekkel, addig ma már jól látható – a fentiek alapján is –, hogy a videó az új sztár. A mesterséges intelligencia által készült tartalmak hajnalán mindenki ismerte a Midjourney képalkotóját – éppúgy, mint ahogy most a ChatGPT is közismert – mostanra azonban kicsit háttérbe szorult, mivel mozgóképet nem volt képes generálni.
A Midjourney is érzékelhette ezt a jelenséget, valószínűleg épp ezért jelentette be a cég az első lépést a real-time (valós idejű) 3D AI videók felé, vagyis a V1 videómodellt. A cég hossztútávú célja, hogy valós időben, AI által generált, térben lehessen mozogni – mondjuk AR vagy VR szemüveggel –, miközben tárgyakkal is interakcióba lehet lépni.
Ehhez a hosszútávú célhoz képest szerény előrelépésnek tűnhet a mostani V1 modell, ami lényegesen drágábban állítható elő a felhasználóknak – nyolcszor annyiba kerül egy videó, mint egy kép előállítása – azonban a korábbiakhoz hasonlóan itt is egyből 4 verziót generál nekünk a gép, ráadásul egyenként nagyjából 4-5 másodperces mozgóképet. Ha ez nem lenne elég, akkor a legjobb videót még négyszer tovább lehet bővíteni, minden alkalommal 4-5 másodperccel. A Midjourney ráadásul nem egy text-to-video, vagyis szövegből videót generáló rendszert mutatott be, hanem akár az általa generált, akár egy általunk megadott képet képes mozgásra bírni.
Mindeközben a YouTube is bejelentkezett az AI fejlesztések terén, ugyanis az idei Cannes Lions alatt jelentették be, hogy a Shorts – vagyis ahol a rövidformátumű videókat lehet önfeledten görgetni – megkapja legújabb frissítését. Ez azt jelenti, hogy idén nyáron a Shorts felületén használható Veo 2 AI-modell új változata, a Veo 3 debütál, ami már a háttérfelületek és kisebb generálások mellett már jobb minőséget és hang generálást is ígér. Fontos azonban megjegyezni, hogy a Midjourney-hez hasonlóan ez is egy fizetős szolgáltatás lesz.