Először is nézzük meg, mi áll a deepfake kifejezés mögött. A fogalomnak sokféle meghatározása létezik, ezek általános közös tartalma, hogy a deepfake mesterséges intelligencia segítségével létrehozott tartalmak (képek, videók és hangok), amelyek olyasmit ábrázolnak, ami a valóságban nem létezik, vagy olyan eseményeket mutatnak be, amelyek soha nem történtek meg.
A deepfake elnevezés a deep learning (mesterségesintelligencia-alapú mélytanulás) technológia és a fake (hamisítvány) kifejezés kombinációjából származik, ami azt jelenti, hogy a tartalom nem valós.
A kifejezés 2017-ben vált használatossá a mesterséges intelligenciával létrehozott tartalmakra, amikor egy Reddit-moderátor létrehozta a „deepfakes” nevű alredditet, és olyan videókat kezdett el közzétenni, amelyekben arccserélő technológiát használtak hírességek képmásának beillesztésére már meglévő pornográf videókba. (A Reddit egy közösségi weboldal, amelyen a felhasználók megoszthatják híreiket, képeiket és cikkeiket az ún. alredditeken.)
„Mezriczky Marcell (2021) hat különböző deepfake-definíció összehasonlítása révén alkotta meg saját fogalommagyarázatát, miszerint a deepfake-videó olyan „a mesterséges intelligencia által létrehozott […] mozgóképes tartalom, amelyben a tartalom eredeti szereplőjének képmását és/vagy hangját egy tőle idegen személy képmásával és/vagy hangjával helyettesítik, valamely kívánt hatás elérése érdekében”.[1]
A deepfake típusai
Működési elvük alapján a deepfake alábbi fő típusaival találkozhatunk:
Arccsere – Ez olyan tevékenységet jelent, amelynek során egy személy arcát egy másik személy vagy állat arcával cserélik fel, leggyakrabban egy erre a célra kifejlesztett alkalmazás vagy alkalmazásszűrő segítségével.
Az arc újraanimálása – Ennek során mélytanulási algoritmusokat és mesterséges intelligenciát használnak a videókban megjelenő arckifejezések elemzésére és manipulálására. Az arcmozgások és arckifejezések feltérképezésével a szoftver képes az alany arcát úgy módosítani vagy animálni, hogy az valósághűnek tűnjön. Ez a technológia olyan alkalmazások kifejlesztéséhez vezetett, amelyek valós időben képesek megváltoztatni az arckifejezéseket, új lehetőségeket teremtve a videótartalmak létrehozására és manipulálására.
Tárgyak (bizonyos részletek) eltávolítása – A nem kívánt elemeket nyom nélkül eltávolítják egy képről. Ez lehetővé teszi a vizuális kompozíció javítását és az olyan zavaró tényezők eltávolítását, amelyek negatívan befolyásolhatják egy fénykép vagy digitális műalkotás általános esztétikai megjelenését.
A deepfake felhasználása
Az alábbiakban – a teljesség igénye nélkül – bemutatjuk a deepfake felhasználásának néhány típusát, és néhányat a legérdekesebb példák közül.
Videó- és filmipar
A deepfake pozitív felhasználásának kiváló példája a Malaria Must Die kampány által készített videó.[2] Ebben a legendás focista, David Beckham kilenc különböző nyelven beszél: a hang változik, mégis úgy tűnik, hogy Beckham szája tökéletesen szinkronban van a szavakkal. A mesterséges intelligencia segítségével, deepfake technológiával manipulálták az arcmozdulatait, azt a vizuális illúziót keltve, hogy az egyes nyelveken mondja a szavakat. Ez a videó jól szemlélteti a deepfake technológia alkalmazásának lehetőségét a filmek szinkronizálásában.
A hagyományos videókészítés gyakran fizikai díszletek építésével vagy helyszínek felderítésével jár, ami anyag-, munka- és engedélyezési költségeket jelent, de a vizuális effektek (VFX) deepfake technológiájának használatával a filmkészítők virtuális díszleteket és háttereket hozhatnak létre, így nincs szükség fizikai építésre. Ez a technológia nagyobb rugalmasságot biztosít a jelenetek beállításában is, lehetővé téve a filmkészítők számára, hogy könnyen változtassák a háttereket, és alkalmazkodjanak a különböző narratív követelményekhez.
A deepfake technológia azt is lehetővé teszi a filmkészítők számára, hogy olyan színészek jeleneteit gyártsák újra, akik valamilyen okból már nem tudnak részt venni a hagyományos folyamatokban, vagy karakterük fiatalabb korú változatát kell újrateremteni. Például „Bruce Willis lett az első színész, aki eladta jogait egy Deepfake-cégnek, hogy létrehozzon egy »digitális ikertestvért«. A színész a technológiát »nagyszerű lehetőségnek nevezi abban, hogy visszamenjünk az időben«.”[3]
Ismeretterjesztés, oktatás
1963-ban John F. Kennedy elnök éppen beszédet akart tartani Dallasban, mielőtt meggyilkolták. A szeretett politikusnak aznap nem adatott meg, hogy szavait a világ elé tárja, de a modern technológiáknak és az innovatív technikáknak köszönhetően ma már meghallgathatjuk az akkor el nem mondott beszédét.[4]
Az Illinoisi Holokausztmúzeum és Oktatási Központban[5] egy olyan bemutatót tartottak, ahol tizenöt holokauszt-túlélő holografikus képét mutatták be rotációs rendszerben. A látogatók feltehették kérdéseiket ezeknek a holografikus képeknek. A túlélőkkel készített interjúkat egy gömbkamera rögzítette.[6]
A deepfake technológiával ugyanez nagyobb léptékben is megvalósítható. Történelmi személyiségeket lehet életre kelteni, ahogyan a Magyar Telekom 2021-es reklámjában látható[7], és interaktívabb történelem órákat lehet létrehozni az iskolák számára.
Amikor a művész találkozik a mesterséges intelligenciával
A floridai St. Petersburgban található Salvador Dalí Múzeum a mesterséges intelligencia technikája segítségével „keltette életre” a szürrealizmus mesterét.[8]
A művészeti múzeum a San Franciscó-i Goodby, Silverstein & Partners reklámügynökséggel dolgozott együtt a Dalí Lives videóinstalláción, amely úgy néz ki, mintha az igazi Salvador Dalí lenne a főszereplője. A videók az arccsere-technológia egy fejlett formáját használják. Dalí a képernyőn keresztül üdvözli a látogatókat, és rövid interakcióba lép velük; a beszélgetés befejezéseként megfordul, elővesz egy okostelefont, és csoportos szelfit készít a közönségével.[9]
A Dalí Lives egy deepfake-hez képest szokatlanul interaktív. Az installáción belül 125 különböző videó található, és ezek a felhasználó reakcióitól függően 190 512 lehetséges kombinációban játszódnak le.
„A deepfake egyre nagyobb figyelmet kap, ezzel együtt pedig befolyást gyakorol a mindennapokra. Ellentmondásosságát az adja, hogy ugyanaz a technológia képes humoros és szórakoztató, valamint szándékosan félrevezető és destruktív hatásokat elérni, a tartalom előállítójának céljától függően.”[10]
(Cikksorozatunk következő részében a deepfake-kel megvalósított visszaélések és csalások kerülnek reflektorfénybe.)
SZERZŐ???
[1] Veszelszki Ágnes: Deepfake: kételkedés a kételyben. In Aczél Petra, Veszelszki Ágnes (szerk.): Deepfake: a valótlan valóság. Gondolat, Bp., 2023, 15. o.
[2] https://www.youtube.com/watch?v=QiiSAvKJIHo
[3] https://collider.com/ 2022. 09. 29.
[4] https://www.youtube.com/watch?v=fOiDO8BWzfk
[6] https://www.youtube.com/watch?v=uG4Z5TbMrFs
[7] https://www.youtube.com/watch?v=YxXbiLAhY0U
[9] https://www.youtube.com/watch?v=64UN-cUmQMs
[10] Mezriczky Marcell: „Ne higgy a szemének” in Aczél Petra, Veszelszki Ágnes (szerk.): Deepfake: a valótlan valóság Gondolat Kiadó, Budapest 2023. p.54.
Megjelent június 14-én.
Ízelítő a tartalombólFizessen elő magazinunkra!
12 hónapra
6500 Ft
(postaköltséggel együtt)
Szeretnék előfizetni