Preskočiť na obsah Preskočiť na pätu (NCP VaT)
VEDA NA DOSAH – váš zdroj informácií o slovenskej vede

Generatívny model umelej inteligencie využíva svetlo a šetrí energiu

VEDA NA DOSAH

Nový model optickej generatívnej AI je úsporný a efektívny a predznamenáva éru udržateľnej generatívnej umelej inteligencie.

Obrázky generované umelou inteligenciou.

Numerické a experimentálne výsledky viacfarebného optického generatívneho modelu na generovanie farebných umeleckých diel v štýle Vincenta van Gogha v porovnaní s digitálnym difúznym modelom s 1 000 krokmi. Zdroj: Nature DOI: 10.1038/s41586-025-09446-5 (2025)

Výskumníci z Kalifornskej univerzity v Los Angeles (UCLA) dosiahli významný pokrok v oblasti umelej inteligencie (AI) a fotoniky. Vyvinuli optické generatívne modely, ktoré dokážu vytvárať nový obsah aj využitím svetla namiesto len bežných elektronických výpočtov.

Práca, uverejnená v časopise Nature, prezentuje nové modely v oblasti generatívnej AI, ktoré by umožnili tvorbu škálovateľného obsahu pri výrazne nižšej spotrebe energie.

Generatívne modely vrátane tých, ktoré sú založené na difúznych procesoch, ako aj veľkých jazykových modelov sú súčasťou revolúcie v oblasti umelej inteligencie a generovania obsahu včítane obrazov, zvukov a videí. Rozmach, ktorý v súčasnosti zaznamenávajú, má však svoju daň. Je ňou obrovská spotreba energie a čoraz vyššie nároky na hardvér. Prevádzka takýchto generatívnych modelov vyžaduje rozsiahlu výpočtovú infraštruktúru, čo vyvoláva obavy o ich dlhodobú udržateľnosť.

Tím z Katedry elektrotechniky a počítačového inžinierstva UCLA pod vedením profesora Aydogana Ozcana preto hľadá možnosti, ako znížiť spotrebu energie. Prichádza s konceptom, ktorý sa nespolieha iba na digitálne výpočty, ale využíva prirodzenú paralelnosť a rýchlosť svetla na vytváranie obsahu v jednom kroku.

Generatívne optické modely

Difúzne generatívne modely fungujú na princípe postupného pridávania šumu do datasetov a následného učenia sa tento proces zvrátiť. Profesor Ozcan a jeho kolegovia vyvinuli modely, ktoré pracujú čiastočne na báze svetla. Kým proces kódovania je v prípade modelov vyvinutých vedcami z UCLA digitálny a vyžaduje určité množstvo energie, proces dekódovania je založený na svetle a nevyžaduje žiadny výpočtový výkon.

Na rozdiel od digitálnych difúznych modelov, ktoré vyžadujú stovky až tisíce opakujúcich sa krokov, dokážu generovať obraz okamžite (v „jednej snímke“) – okrem úvodného zakódovania prostredníctvom jednoduchej digitálnej siete a samotného osvetlenia svetlom bez ďalších výpočtov.

Difúzia

Pri generovaní obsahu z textu používajú modely AI proces označovaný ako difúzia. Na trénovanie modelu sa používa veľký dataset, do ktorého sa pridáva štatistický šum. Model potom zakóduje vzory do súboru pravidiel. Keď dostane nový obrázok so šumom, môže tieto pravidlá využiť na to, aby urobil to isté v opačnom poradí, čiže postupne pracuje na vytvorení koherentného obrazu, ktorý zodpovedá textovej požiadavke. Celý postup pozostáva z veľkého počtu krokov vyžadujúcich obrovské množstvo energie, ale aj vody, ktorá sa používa na chladenie výkonných počítačov.

Modely spájajú jednoduchý digitálny kodér s difrakčným optickým dekodérom vo voľnom priestore, ktoré sú spoločne trénované ako jeden systém. AI sa natrénuje tak, aby vytvorila fázový vzor, teda maticu čísel, ktoré určujú, ako má byť svetlo na každom bode „posunuté“. Tento vzor sa potom zobrazí na zariadení, ktoré riadi fázu dopadajúceho laserového svetla, takzvanom Spatial Light Modulator (SLM). Keď laser prejde týmto fázovým vzorom, svetlo sa ohýba a interferuje tak, že vytvorí požadovaný obraz alebo signál. „Na rozdiel od digitálnych difúznych modelov, ktoré vyžadujú stovky až tisíce iteratívnych krokov, tento proces dosahuje generovanie obrazu v okamihu a nevyžaduje žiadne dodatočné výpočty okrem počiatočného kódovania,“ uvádza tlačová správa UCLA.

Vygenerovali aj diela od Vincenta van Gogha

Na overenie svojho prístupu tím demonštroval numerické i experimentálne výsledky na rôznych súboroch dát. Modely generovali nové obrazy ručne písaných číslic, módnych predmetov, motýľov, ľudských tvárí a dokonca aj umeleckých diel inšpirovaných Vincentom van Goghom. Opticky generované výstupy mali podobnú kvalitu ako výstupy získané pokročilými difúznymi modelmi. Vytvorili tiež viacfarebné obrázky a umelecké diela vo vysokom rozlíšení v štýle Vincenta van Gogha, čím podčiarkli kreatívny rozsah optického generatívneho prístupu umelej inteligencie.

Optické generatívne modely by mohli v budúcnosti vo veľkom znížiť energetickú stopu AI, čím by umožnili jej udržateľné používanie. Modely by našli potenciálne uplatnenie v biomedicínskom zobrazovaní, diagnostike, imerzných médiách a spracovaní dát na okraji siete (tzv. edge computing), kde je distribuovaná AI s nízkou spotrebou energie čoraz potrebnejšia.

Zdroj: UCLA Samueli School of Engineering, NewScientist

Procházka, P.: Efektivita difúznych modelov v multimediálnej tvorbe, Fakulta hospodárskej informatiky Ekonomickej univerzity v Bratislave

(zh)

CENTRUM VEDECKO-TECHNICKÝCH INFORMÁCIÍ SR Ministerstvo školstva, výskumu, vývoja a mládeže Slovenskej republiky

Mediálni partneri

ÁMOS vision FonTech Startitup