Preskočiť na obsah Preskočiť na pätu (NCP VaT)
VEDA NA DOSAH – váš zdroj informácií o slovenskej vede

VIDEO: Deepfake – Ako odlíšiť ilúziu a realitu?

VEDA NA DOSAH

Nestihli ste prednášku výskumníka Michala Gregora a novinára Maroša Žofčina? Pozrite si prednášku.

V júlovej Vede v CENTRE boli našimi hosťami výskumník doc. Ing. Michal Gregor, PhD., z Kempelenovho inštitútu inteligentných technológií a redaktor a novinár Mgr. Maroš Žofčin z portálu Živé.sk. Termín deepfake označuje techniku generovania presvedčivého audiovizuálneho obsahu využitím umelej inteligencie. Ako vzniká? A čo znamená pre našu spoločnosť?

Začiatky deepfake

To, že sa vytvára falošný obsah počítačovou formou, nie je úplne nový koncept. Je rozdiel, či ho však nakreslíme my na počítači alebo ho vytvorí umelá inteligencia. Prvýkrát sa pojem deepfake objavil v roku 2017 na platforme Reddit. Názov deepfake bolo meno používateľa uverejňujúceho videá, v ktorých vymieňal tváre osôb za iné.

V prvej verzii sa využívali hlboké neurónové siete. Tie majú dve časti: kódovaciu a dekódovaciu. Kódovacia časť sa učí extrahovať z tvarí podobné veci: otočenie, nasvietenie, výraz a iné. Dekódery vedia z typu reprezentácie nakresliť tvár. Tieto dve časti využívajú používatelia, aby dostali želaný obsah deepfake. Siete museli byť natrénované na veľkom množstve obrázkov, ktoré museli ľudia nazhromaždiť, čo bolo nepraktické. V dnešnej dobe sme sa posunuli, neurónové siete sú už natrénované a stačí im už len jedna fotka.

Umelá inteligencia. Zdroj: iStockphoto.com

Umelá inteligencia. Zdroj: iStockphoto.com

Spôsoby a tvorba deepfake 

Deepfake môže byť obrázkový, audio alebo vizuálny obsah. Nie je to skutočný obraz, ale umelý, takže nás môže pomýliť. Môže, ale nemusí byť vytvorený so zlým úmyslom. Medzi najznámejšie systémy tvorby obsahu deepfake patria DALL-E, Midjourney a Stable Diffusion. Fungujú na procese šumu. Obrázok postupne prechádza takzvaným zašumovacím procesom, potom sa šum odstraňuje a vytiahne sa nový obrázok. Modely sa vedia naučiť aj zákonitosti tohto sveta, napríklad to, že strom sa má na hladine vody odrážať.

Model Stable Diffusion je výnimočný, pretože sa dá stiahnuť a dá sa na ňom robiť napríklad aj výskum. Je to zároveň i nebezpečné, lebo ho vieme naprogramovať a zmeniť mu nastavenia, vďaka čomu bude generovať aj obsah, ktorý by nemal.

Obsah vieme určiť napríklad tiež novým chatovým modelom GPT-4. Dokážeme ho týmto spôsobom navádzať a poskytnúť mu dodatočné informácie, prípadne doplniť obrázok.

Modelmi sa dá generovať aj audio. Existuje takzvaný speech to speech spôsob, keď nahráme želaný text človekom (hercom) a potom ho prevedieme do reči napríklad zosnulého človeka. Ďalším je few-shot spôsob, ktorému stačí na naučenie len minúta dát, s čím je spojených mnoho rizík. Generovať audio do želanej podoby sa dá už aj z textovej formy.

Viac o tom, ako vplýva deepfake na našu spoločnosť, sa dozviete vo videu.

Čo je vedecká kaviareň?

Vedecké kaviarne pod názvom Veda v CENTRE organizuje pre širokú verejnosť pravidelne, každý posledný štvrtok v mesiaci o 17.00 hod., Národné centrum pre popularizáciu vedy a techniky v spoločnosti (NCP VaT) pri Centre vedecko-technických informácií SR (CVTI SR) v Bratislave. Prvá kaviareň sa uskutočnila 21. mája 2008.

(JM)

CENTRUM VEDECKO-TECHNICKÝCH INFORMÁCIÍ SR Ministerstvo školstva, výskumu, vývoja a mládeže Slovenskej republiky