Preskočiť na obsah Preskočiť na pätu (NCP VaT)
VEDA NA DOSAH – váš zdroj informácií o slovenskej vede

Umelá inteligencia nepredstiera, že je hlúpejšia, dokáže však znížiť svoje schopnosti na úroveň dieťaťa

VEDA NA DOSAH

Český výskum, na ktorom sa podieľal aj Slovák, ukázal, že jazykové modely prispôsobili svoje odpovede deťom vo veku od 1 do 6 rokov.

Malý robot, umelá inteligencia.

Ilustračný obrázok. Zdroj: iStockphoto.com

Tím jazykovedcov a študentov pod vedením Jiřího Milička z Karlovej univerzity v Prahe a Anny Marklovej z berlínskej Humboldtovej univerzity zistil, že umelá inteligencie dokáže znížiť vlastné schopnosti, aby lepšie zodpovedala úlohe, v ktorej má vystupovať. O výskume informujú na svojich stránkach portál ČT24 a PsyPost.

Odborníci z Česka spolu so slovenským kolegom uverejnili štúdiu k výskumu v časopise PLOS One. V zahraničných médiách vyvolala značný ohlas. Za výskumom stála myšlienka zistiť, čo dokážu veľké jazykové modely a čo nie.

Psycholingvistické experimenty na virtuálnych deťoch

Namiesto hľadania maximálneho potenciálu umelej inteligencie sa výskumníci v tomto prípade vydali opačným smerom. Chceli zistiť, či pokročilé systémy dokážu vystupovať na nižšej jazykovej úrovni a s nižším stupňom chápania. Vedci na účely výskumu simulovali reakcie detí vo veku od 1 do 6 rokov.

„Vďaka psycholingvistike máme pomerne komplexné poznatky o tom, čo deti v rôznych vekových kategóriách dokážu,“ vysvetlila autorka štúdie Anna Marklová z Humboldtovej univerzity v Berlíne.

Vo výskume pracovali hlavne s úlohami určenými na testovanie v oblasti teórie mysle. „Významnú rolu zohráva najmä teória mysle, ktorá skúma vnútorný svet dieťaťa a ktorú nie je ľahké napodobniť pozorovaním jednoduchých štatistických vzorcov.“

Teória mysle je schopnosť uvažovať v mentálnych obrazoch toho druhého. U človeka sa rozvíja približne v 4 rokoch. Deti v tomto veku už začínajú správne odpovedať na otázku, kde bude Anna hľadať ceruzku, ak si ju odložila do hornej zásuvky, ale počas jej neprítomnosti ju Silvia preložila do spodnej. Predpokladá sa, no nepanuje zhoda, že aj antropoidné opice disponujú touto schopnosťou.

Použili GPT-3.5-turbo a GPT-4

Vedci uskutočnili 1 296 nezávislých pokusov, pričom na generovanie odpovedí, ktoré sa analyzovali z hľadiska jazykovej zložitosti a presnosti pri riešení testov falošného či chybného presvedčenia, použili GPT-3.5-turbo a GPT-4.

Hlavným cieľom bolo posúdiť, či tieto veľké jazykové modely dokážu svoje odpovede prispôsobiť tak, aby odrážali vývojové štádiá jazykovej zložitosti a kognitívnych schopností typické pre deti vo veku od 1 do 6 rokov.

Vedci zistili, že so zvyšujúcim sa simulovaným vekom dieťaťa sa zvyšovala aj zložitosť jazyka, ktorý modely používali. Tento trend bol konzistentný v GPT-3.5-turbo i v GPT-4. To naznačuje, že veľké jazykové modely dokážu reflektovať úroveň jazyka, čo im umožňuje priblížiť sa jazykovým schopnostiam detí rôzneho veku.

Zníži svoje schopnosti, ale nepredstiera, že je hlúpejšia

Celý rad spravodajských portálov o výsledkoch štúdie napísal, že umelá inteligencie dokáže predstierať, že je hlúpejšia, než aká v skutočnosti je. To však podľa Marklovej nie je presné.

„Veľké jazykové modely dokážu predstierať nižšiu inteligenciu,“ uviedla Marklová pre PsyPost. „Znamená to, že pri vývoji umelej superinteligencie (ASI) musíme byť opatrní a že od nej nemôžeme požadovať, aby napodobňovala ľudskú inteligenciu, ktorá má svoje limity. Navyše to naznačuje, že môžeme jej schopnosti dlhšiu dobu podceňovať, čo nie je bezpečná situácia.“

Kľúčový je zadaný príkaz

Veľké jazykové modely, ako je napríklad ChatGPT, môžu vystupovať v rôznych úlohách, ktoré sa označujú ako persony. To, ako budú tieto persony vystupovať, je závislé od zadaných príkazov a inštrukcií, ktorým odborníci hovoria prompty.

Podoba promptov je pre fungovanie jazykových modelov kľúčová, lebo ich zlá alebo nepresná formulácia môže obmedziť potenciál umelej inteligencie.

„Niekedy niektorá štúdia uvedie, že sa niečo s modelmi nedá urobiť. Potom však príde niekto, kto sa pohrá s promptmi a zistí, že to možné je,“ upozornila Marklová. Podľa Marklovej to teda nemusí byť tak, že model niečo nevie, možno ideme len na vec nesprávne.

„Je veľmi zaujímavé sa tomu venovať a skúmať limity,“ uviedla. To, že sa experti rozhodli pre psycholingvistické experimenty na virtuálnych deťoch, označila za pioniersky počin.

Prínos pre ďalší výskum

Výsledky štúdie majú podľa Marklovej veľký prínos pre ďalší lingvistický výskum, lebo vedci si budú môcť pomocou umelej inteligencie vyskúšať technické riešenia a metódy práce najskôr na virtuálnych osobách.

V začatom výskume plánujú odborníci pokračovať. Jedna z kľúčových oblastí, ktorej sa chcú podrobnejšie venovať, zahŕňa ďalšie skúmanie limitov veľkých jazykových modelov (LLM) pri simulácii kognitívnych a jazykových vývojových štádií v širšom spektre úloh a kontextov. Jednou z možných ďalších oblastí výskumu by mohlo byť uplatnenie týchto simulácií v praxi, napríklad na terapeutické účely v podobe terapeutickej umelej inteligencie, ktorá sa dokáže prispôsobiť kognitívnym a mentálnym schopnostiam používateľov.

Zdroj: ČT24, PsyPost

(zh)

CENTRUM VEDECKO-TECHNICKÝCH INFORMÁCIÍ SR Ministerstvo školstva, výskumu, vývoja a mládeže Slovenskej republiky