Preskočiť na obsah Preskočiť na pätu (NCP VaT)
VEDA NA DOSAH – váš zdroj informácií o slovenskej vede

Ochrnutá žena prehovorila prostredníctvom digitálneho avatara

VEDA NA DOSAH

Ide o prvú syntézu reči alebo mimiky priamo z mozgových signálov.

Výskumnému tímu sa podarila prvá syntéza reči alebo mimiky priamo z mozgových signálov. Zdroj: Neuroscience News

Výskumnému tímu sa podarila prvá syntéza reči alebo mimiky priamo z mozgových signálov. Zdroj: Neuroscience News

Ochrnutá žena má vďaka vedcom z univerzít v San Franciscu a Berkeley nádej na skvalitnenie života.

Výskumnému tímu pod vedením doktora Edwarda Changa sa podarila prvá syntéza reči alebo mimiky priamo z mozgových signálov. Vedci vytvorili jedinečné rozhranie mozog – počítač (brain-computer interface – BCI).

Systém, na ktorom Chang pracoval viac ako desať rokov, dokáže konvertovať tieto signály na text pôsobivou rýchlosťou takmer 80 slov za minútu, a tým prekonáva existujúce technológie. Rozhranie dekóduje mozgové signály do syntetizovanej reči a výrazov tváre, čo umožňuje ochrnutým jedincom prirodzenejšiu komunikáciu.

O krok ďalej

Changovmu tímu sa už v minulosti podarilo previesť mozgové vlny muža, ktorý prekonal mozgovú porážku, do písaného textu. V aktuálnej štúdii, publikovanej v odbornom časopise Nature, sa výskumníci posúvajú ešte o krok ďalej: pokúsili sa previesť mozgové signály do reči s pohybmi tváre.

Chang implantoval na povrch mozgu ženy nad oblasti kritické pre reč obdĺžnik tenký ako papier s 253 elektródami. Elektródy dokázali zachytiť signály, ktoré by u zdravého človeka, ktorý neutrpel mozgovú príhodu, smerovali do svalov jazyka, čeľuste, hrtana a tváre. Kábel zapojený do portu, pevne pripevneného na ženinej hlave, spájal elektródy s počítačovou zostavou.

Účastníčka výskumu spolupracovala s tímom na tréningu algoritmov umelej inteligencie systému, aby dokázala rozpoznať jej jedinečné mozgové signály pre reč. Znova a znova opakovala frázy z konverzačného slovníka s 1024 slovami, kým počítač nerozpoznal vzorce mozgovej aktivity spojené s predmetnými zvukmi.

Stačilo ho naučiť 39 foném

Systém nerozlišuje celé slová, ale identifikuje fonémy, čiastkové jednotky reči. Aby počítač rozlúštil akékoľvek anglické slovo, stačilo ho naučiť 39 foném. Nový systém je tak presnejší a rýchlejší než ten predchádzajúci.

Hlas avatara vedci zároveň prispôsobili tak, aby sa podobal hlasu pacientky pred zranením a špeciálny softvér im umožnil interpretovať signály pre rôzne výrazy tváre, zosieťovať ich a previesť na pohyby na tvári avatara. Vďaka tomu avatar dokázal otvárať a zatvárať ústa, špúliť pery a pohybovať jazykom a vyjadrovať emócie ako šťastie, smútok či prekvapenie.

Za animáciou avatara stojí spoločnosť Speech Graphics, ktorá vyrába animácie tvárí riadené umelou inteligenciou.

Zdroje: NeuroscienceNews.com, Nextech

(af)

CENTRUM VEDECKO-TECHNICKÝCH INFORMÁCIÍ SR Ministerstvo školstva, výskumu, vývoja a mládeže Slovenskej republiky