Létkérdések

A deepfake világa

2024. július 02.

A mesterséges intelligencia terjedésével egyre nagyobb népszerűségre tesz szert az ún. deepfake – ma már bárki hozzáférhet olyan alkalmazásokhoz, amelyek lehetővé teszik, hogy a használó saját maga is készítsen ezzel a technológiával módosított hang- és/vagy képanyagot. Ezt a technológiát – mint a világon szinte bármit – építő módon és káros célok megvalósítására egyaránt fel lehet használni. Most induló háromrészes cikksorozatunkkal szeretnénk betekintést nyújtani a deepfake világába. A sorozat első részéből megtudhatják, mi a deepfake, és azt is, milyen pozitív felhasználási lehetőségei vannak.

A deepfake fogalma

Először is nézzük meg, mi áll a deepfake kifejezés mögött. A fogalomnak sokféle meghatározása létezik, ezek általános közös tartalma, hogy a deepfake mesterséges intelligencia segítségével létrehozott tartalmak (képek, videók és hangok), amelyek olyasmit ábrázolnak, ami a valóságban nem létezik, vagy olyan eseményeket mutatnak be, amelyek soha nem történtek meg.

A deepfake elnevezés a deep learning (mesterségesintelligencia-alapú mélytanulás) technológia és a fake (hamisítvány) kifejezés kombinációjából származik, ami azt jelenti, hogy a tartalom nem valós.

A kifejezés 2017-ben vált használatossá a mesterséges intelligenciával létrehozott tartalmakra, amikor egy Reddit-moderátor létrehozta a „deepfakes” nevű alredditet, és olyan videókat kezdett el közzétenni, amelyekben arccserélő technológiát használtak hírességek képmásának beillesztésére már meglévő pornográf videókba. (A Reddit egy közösségi weboldal, amelyen a felhasználók megoszthatják híreiket, képeiket és cikkeiket az ún. alredditeken.)

„Mezriczky Marcell (2021) hat különböző deepfake-definíció összehasonlítása révén alkotta meg saját fogalommagyarázatát, miszerint a deepfake-videó olyan „a mesterséges intelligencia által létrehozott […] mozgóképes tartalom, amelyben a tartalom eredeti szereplőjének képmását és/vagy hangját egy tőle idegen személy képmásával és/vagy hangjával helyettesítik, valamely kívánt hatás elérése érdekében”.[1]

A deepfake típusai

Működési elvük alapján a deepfake alábbi fő típusaival találkozhatunk:

Arccsere – Ez olyan tevékenységet jelent, amelynek során egy személy arcát egy másik személy vagy állat arcával cserélik fel, leggyakrabban egy erre a célra kifejlesztett alkalmazás vagy alkalmazásszűrő segítségével.

Az arc újraanimálása – Ennek során mélytanulási algoritmusokat és mesterséges intelligenciát használnak a videókban megjelenő arckifejezések elemzésére és manipulálására. Az arcmozgások és arckifejezések feltérképezésével a szoftver képes az alany arcát úgy módosítani vagy animálni, hogy az valósághűnek tűnjön. Ez a technológia olyan alkalmazások kifejlesztéséhez vezetett, amelyek valós időben képesek megváltoztatni az arckifejezéseket, új lehetőségeket teremtve a videótartalmak létrehozására és manipulálására.

Tárgyak (bizonyos részletek) eltávolítása – A nem kívánt elemeket nyom nélkül eltávolítják egy képről. Ez lehetővé teszi a vizuális kompozíció javítását és az olyan zavaró tényezők eltávolítását, amelyek negatívan befolyásolhatják egy fénykép vagy digitális műalkotás általános esztétikai megjelenését.

A deepfake felhasználása

Az alábbiakban – a teljesség igénye nélkül – bemutatjuk a deepfake felhasználásának néhány típusát, és néhányat a legérdekesebb példák közül.

Videó- és filmipar

A deepfake pozitív felhasználásának kiváló példája a Malaria Must Die kampány által készített videó.[2] Ebben a legendás focista, David Beckham kilenc különböző nyelven beszél: a hang változik, mégis úgy tűnik, hogy Beckham szája tökéletesen szinkronban van a szavakkal. A mesterséges intelligencia segítségével, deepfake technológiával manipulálták az arcmozdulatait, azt a vizuális illúziót keltve, hogy az egyes nyelveken mondja a szavakat. Ez a videó jól szemlélteti a deepfake technológia alkalmazásának lehetőségét a filmek szinkronizálásában.

A hagyományos videókészítés gyakran fizikai díszletek építésével vagy helyszínek felderítésével jár, ami anyag-, munka- és engedélyezési költségeket jelent, de a vizuális effektek (VFX) deepfake technológiájának használatával a filmkészítők virtuális díszleteket és háttereket hozhatnak létre, így nincs szükség fizikai építésre. Ez a technológia nagyobb rugalmasságot biztosít a jelenetek beállításában is, lehetővé téve a filmkészítők számára, hogy könnyen változtassák a háttereket, és alkalmazkodjanak a különböző narratív követelményekhez.

A deepfake technológia azt is lehetővé teszi a filmkészítők számára, hogy olyan színészek jeleneteit gyártsák újra, akik valamilyen okból már nem tudnak részt venni a hagyományos folyamatokban, vagy karakterük fiatalabb korú változatát kell újrateremteni. Például „Bruce Willis lett az első színész, aki eladta jogait egy Deepfake-cégnek, hogy létrehozzon egy »digitális ikertestvért«. A színész a technológiát »nagyszerű lehetőségnek nevezi abban, hogy visszamenjünk az időben«.”[3]

Ismeretterjesztés, oktatás

1963-ban John F. Kennedy elnök éppen beszédet akart tartani Dallasban, mielőtt meggyilkolták. A szeretett politikusnak aznap nem adatott meg, hogy szavait a világ elé tárja, de a modern technológiáknak és az innovatív technikáknak köszönhetően ma már meghallgathatjuk az akkor el nem mondott beszédét.[4]

Az Illinoisi Holokausztmúzeum és Oktatási Központban[5] egy olyan bemutatót tartottak, ahol tizenöt holokauszt-túlélő holografikus képét mutatták be rotációs rendszerben. A látogatók feltehették kérdéseiket ezeknek a holografikus képeknek. A túlélőkkel készített interjúkat egy gömbkamera rögzítette.[6]

A deepfake technológiával ugyanez nagyobb léptékben is megvalósítható. Történelmi személyiségeket lehet életre kelteni, ahogyan a Magyar Telekom 2021-es reklámjában látható[7], és interaktívabb történelem órákat lehet létrehozni az iskolák számára.

Amikor a művész találkozik a mesterséges intelligenciával

A floridai St. Petersburgban található Salvador Dalí Múzeum a mesterséges intelligencia technikája segítségével „keltette életre” a szürrealizmus mesterét.[8]

A művészeti múzeum a San Franciscó-i Goodby, Silverstein & Partners reklámügynökséggel dolgozott együtt a Dalí Lives videóinstalláción, amely úgy néz ki, mintha az igazi Salvador Dalí lenne a főszereplője. A videók az arccsere-technológia egy fejlett formáját használják. Dalí a képernyőn keresztül üdvözli a látogatókat, és rövid interakcióba lép velük; a beszélgetés befejezéseként megfordul, elővesz egy okostelefont, és csoportos szelfit készít a közönségével.[9]

A Dalí Lives egy deepfake-hez képest szokatlanul interaktív. Az installáción belül 125 különböző videó található, és ezek a felhasználó reakcióitól függően 190 512 lehetséges kombinációban játszódnak le.

„A deepfake egyre nagyobb figyelmet kap, ezzel együtt pedig befolyást gyakorol a mindennapokra. Ellentmondásosságát az adja, hogy ugyanaz a technológia képes humoros és szórakoztató, valamint szándékosan félrevezető és destruktív hatásokat elérni, a tartalom előállítójának céljától függően.”[10]

(Cikksorozatunk következő részében a deepfake-kel megvalósított visszaélések és csalások kerülnek reflektorfénybe.)

SZERZŐ???

[1] Veszelszki Ágnes: Deepfake: kételkedés a kételyben. In Aczél Petra, Veszelszki Ágnes (szerk.): Deepfake: a valótlan valóság. Gondolat, Bp., 2023, 15. o.

[2] https://www.youtube.com/watch?v=QiiSAvKJIHo

[3] https://collider.com/ 2022. 09. 29.

[4] https://www.youtube.com/watch?v=fOiDO8BWzfk

[5] https://www.ilholocaustmuseum.org/exhibitions/survivor-stories-experience

[6] https://www.youtube.com/watch?v=uG4Z5TbMrFs

[7] https://www.youtube.com/watch?v=YxXbiLAhY0U

[8] https://thedali.org/exhibit/dali-lives

[9] https://www.youtube.com/watch?v=64UN-cUmQMs

[10] Mezriczky Marcell: „Ne higgy a szemének” in Aczél Petra, Veszelszki Ágnes (szerk.): Deepfake: a valótlan valóság Gondolat Kiadó, Budapest 2023. p.54.