Az úgynevezett gig AI-trainer olyan felhasználót takar, aki adatokat szolgáltat AI-modellek tanításához. Ez lehet az utcai zaj rögzítése, saját hangunk, mozgásunk felvétele, videók bizonyos tevékenységekről vagy helyekről, valamilyen munkavégzés. Eddig is tudtuk, hogy az AI-cégek számára értékes adat a szöveges vagy képi tartalom, de azt nem sejtettük, hogy ezzel egyszer majd az átlagember is pénzt kereshet, méghozzá elég komoly összegeket. Egy mesterséges világban tehát monetizálható érték a természetes ember. Vajon a Black Mirror című sorozat valamelyik nyomasztó részébe fog kifutni ez a jelenség?
Van, aki rendszeres mellékesként havi száz dollárt, mások alkalmanként több száz dollárt keresnek az online adatpiactereken közzétett beszámolók szerint: például egy privát hanganyag percenként fél dollárt ér. Máshol egy maximum 90 perces feladatért lehet 45 dollárt kapni: ehhez bizonyos tevékenységek közben kell magunkat rögzíteni, mint a futás, sétálás, ugrálás. Számos országban, például Indiában ez már a megélhetés egy jó részét is finanszírozni képes, nem beszélve arról, hogy fodrászok, autószerelők számára tökéletes kiegészítés pusztán dokumentálni a munkavégzésüket. Az más kérdés, hogy hosszú távon ez nyilvánvalóan annak elvesztéséhez vezet.
Az adat-aranyláz
A gig AI-tréner megnevezése a gig economy kifejezésből származik, ami a platformalapú alkalmi munkák világát jelenti. A keresletet az hajtja, hogy a nyílt interneten elérhető adatokat már kimerítették a tech cégek, és ahogy a klónok klónozása sem működik hosszú távon, az AI által generált adatok felhasználása az AI tanítására természetesen kontraproduktív. Maga az internet ráadásul hígul is, hiszen mind a szöveges, mind a videós tartalmakban használunk mesterséges intelligenciát.
Így virágzó adatpiacterek alakultak ki, mint például a Kled AI, a TaskVerse vagy a Silencio, ahol bárki pénzzé teheti az identitását. Ezek gyakorlatilag hídként funkcionálnak a „digitális napszámosok” és a technológiai cégek között.
Rengeteg munka van
Van olyan, gig munkákat szervező platform, amelyik komolyan ráállt erre a lehetőségre. Az Instawork arról híres, hogy órabéres dolgozókat közvetít hotelek, raktárak számára, de most
a gig munkásokat adatgenerátorokká képzi, hogy kielégítse az AI-cégek hatalmas igényét a robotok betanítására.
A Business Insider riportja szerint vannak műszakok, ahol az embereknek csak robotokat kell ide-oda mozgatniuk vagy távolról irányítaniuk, máskor pedig saját magukat kell rögzíteniük például mosogatás vagy takarítás közben. A cég elindította az Instawork Robotics Lab nevű műhelyét, ahol a tevékenységhez megfelelő eszközöket fejlesztenek, valamint két irányú képzést robotika és AI-adatgyűjtés területén. Gyakorlatilag olyan alacsony képzettséget igénylő munkaerőről van szó, amely a robotok betanításában segít vagy a már telepített gépek működését támogatja.
Májusban a cég tervezi az Instacore bevezetését, egy saját fejlesztésű hordozható kamerarendszert, amelynek része a fejkamerán kívül többek között két csuklókamera, valamint mozgást, orientációt, gyorsulást felmérő szenzorok. A cég szerint az adatgyűjtés önkéntes és anonimizált lesz, és inkább munkafolyamatokat rögzít, nem identitásokat.
A rendszer könnyű és egész nap viselhető, úgy tervezték, hogy ne zavarja a munkát.
Az adatokat robotikai cégeknek és kutatóknak fogják értékesíteni, a cég előnye, hogy egyszerre fér hozzá nagy mennyiségű feladathoz és felhasználóhoz, így biztosítani tudja a robotikai ipar által vágyott adatminőséget és változatosságot.
A Goldman Sachs előrejelzése szerint a humanoid robotok piaca 2035-re elérheti a 38 milliárd dollárt, míg a globális adatgyűjtési és címkézési piac 2030-ra 17 milliárd dollárra nőhet. Tavalyi becslések szerint az akkori adatgyűjtési tempó mellett egy általános célú robot csak 100 ezer év múlva válhatott volna elérhetővé. Egy év alatt ez sokat változott, az Instawork szerint az iparág 2024-ben körülbelül 100 ezer óra robotikai tréningadatot gyűjtött, tavaly 1 millió órát, 2026-ra pedig 20 millió órát várnak. De ez még mindig csak töredéke a szükséges mennyiségnek, így szépen mutatja, milyen iparág kezdi magát kinőni.
Az Instawork maga is emberi munkák kiszervezéséből él, tehát azt feltételezhetnék, hogy hosszú távon végülis a saját megélhetését veszélyezteti. Ők nem így gondolják; a cég víziója a hibrid munkaerő közvetítése: emberek és robotok együtt.
Hova vezet?
A felhasználók sok esetben a biometrikus adataikat adják el: a hangjukat és az arcukat, illetve személyes, privát információkat is megosztanak magukról. Milyen következményekkel járhat ez?
Ez lehetőség a deepfake-tartalmak létrehozását, személyazonosság-lopást, digitális kizsákmányolást vagy olyan veszélyeket eredményezhet, amelyekről egyelőre nem is tudunk, csak sejtéseink lehetnek a sci-fi irodalomból.
Szintén nem elhanyagolható körülmény, hogy a közzétett történetek szerint jellemzően a fejlődő országok lakosai osztják meg az adataikat, így hosszú távon könnyen átalakulhat ez a helyzet egyfajta kizsákmányolássá, ráadásul az árak már most elindultak lefelé a kereslet-kínálat alakulása mentén.
Másrészt még mindig nem értjük igazán, hogy mekkora értéket is jelentenek az adataink. Ez nem olyan kézzelfogható, mint az egészségünk, de még azt is sokan pénzzé teszik: például a vérplazmájukat rendszeresen eladva. De hosszú távon kialakulhat egy olyan helyzet, amikor az elvesztésével ébredünk rá, mekkora értékről is volt szó.
Például egy most olcsón eladott hangot még évekig használat egy cég AI-ügyfélszolgálatosként. Ugyanígy egy arc is akárhol végezheti, ugyanis a szerződő felek korlátlan felhasználási jogokat írnak alá, amelyek világszerte érvényes, visszavonhatatlan, átruházható és jogdíjmentes lehetőséget jelentenek a cégek számára, így eladhatják, használhatják, nyilvánosan megjeleníthetik és akármeddig tárolhatják a tartalmakat, illetve származékos műveket is létrehozhatnak belőlük. Tehát a holnap filmjeiben a ma eladott arcok köszönhetnek vissza, és az még a jobbik eset. A hozzájárulók számára pedig gyakorlatilag nincs reális lehetőség a beleegyezés visszavonására vagy újratárgyalására.
A The Guardian megkérdezte a témában Jennifer Kinget, a Stanford Egyetem Emberközpontú Mesterséges Intelligencia Intézetének adatvédelmi kutatóját, aki szerint az AI-piactereken nem egyértelmű, hogyan és hol használják fel a megvásárolt adatokat. Szerinte
a fogyasztók anélkül, hogy tárgyalnának vagy tisztában lennének a jogaikkal, azt kockáztatják, hogy adataikat olyan módon használják fel újra, amit nem szeretnének, nem értenek, vagy nem láttak előre – és kevés lehetőségük lesz jogorvoslatra.
A lap megkereste a Kled AI alapítóját, Avi Patelt, aki szerint cégük adatmegállapodásai az AI-tréningre és kutatásra korlátozzák a felhasználást. Csakhogy egy esetben már biztosan történt adatszivárgás az egyik platformról, a Neon Mobile-ról: ha ma egy egyetemista eladja a hangját, az arcát, és később vezető beosztásba kerül, vajon mekkora értéket jelentenek a biometrikus adatai? Mi történik, ha netán politikai pályára lép? Vagy színészként az arca, énekesként a hangja sokkal nagyobb értéket kezd képviselni, mint egyébként?
Bár az adatpiacterek azt állítják, hogy eltávolítják az azonosító adatokat (például nevet és helyet), ez semmit nem jelent a biometrikus minták tekintetében. Hosszú távon ezek egyre fontosabb szerepet kapnak az azonosítás terén is, tehát általában véve is kockázatot jelenthet az eladásuk.
Az Európai Unióban egy ilyen adatgyűjtés a GDPR miatt nehézségekbe ütközne, viszont az unió polgárait semmi nem akadályozza abban, hogy leszerződjenek egy amerikai piactéren.
A médiának bezzeg nem fizetnek
Ebben az a felháborító, hogy a nyílt internetről leszedett adatokért pedig nem fizetnek a cégek, végeláthatatlan a perek sora, amelyek arról szólnak, hogy jogsértő módon használták fel a kiadók és szerzők tartalmait AI-modellek betanítására. Igaz, van már rá példa, hogy le is szerződtek velük – ennek oka pusztán az, hogy további anyagra van szükségük.
Elgondolkodtató körülmény, hogy amíg a tengernyi értékes szöveg és professzionális tartalom alig ért valamit és értéke vitatott a bíróságokon, addig a nyers emberi mivoltunk monetizálható. Ez alapjaiban változtatja meg, mi számít értéknek a mesterséges intelligencia korszakában, és aggasztó, hogy vannak olyan országok és helyzetek, amelyekben saját emberi identitásunk eladása racionális pénzügyi döntéssé változik. És egyelőre még nem látjuk, mekkorára nőhet ez az iparág: elég csak arra gondolni, hogy a nagy nyelvi modellek betanítása az egész internetet felszippantotta. Egy igazán jól működő robot inas, mindannyiunk álma, ami főz, mos és takarít, mibe fog kerülni?
Az AI-videók gyártásáról kérdeztünk néhány olyan szakembert, akik már régóta a mozgóképek területén dolgoznak, és AI használatára váltottak.