Výskumníci otestovali spoľahlivosť umelej inteligencie pri poskytovaní zdravotných rád. Výsledky ukazujú časté chyby aj vymýšľanie celých vedeckých štúdií.
Digitálna tvár medicíny: skvelý asistent, ale riskantný radca. Zdroj: iStock.com/FabrikaCr
Mnohí ľudia dnes hľadajú svoju diagnózu na internete. Umelá inteligencia im ponúka rýchle a presvedčivé odpovede a vysvetlenia ich príznakov. Chatboty však nehľadajú presné fakty v overených medicínskych zdrojoch, ale iba hádajú vhodné slová. Programy totiž iba odhadujú, ktorá odpoveď znie pre človeka najviac uveriteľne.
Odborníci preto varujú, aby ľudia nebrali texty umelej inteligencie ako stopercentnú pravdu. Následky nesprávnej diagnózy alebo zlej liečby môžu pacientovi reálne ublížiť. Toto nebezpečenstvo potvrdili aj nedávne experimenty.
Polovica odpovedí obsahuje chyby
Vedci z Harbor-UCLA Medical Center otestovali päť populárnych chatbotov. Skúmali modely ako ChatGPT, Gemini, Grok, Meta AI a DeepSeek. Odborníci im položili päťdesiat zdravotných otázok. Otázky sa týkali rakoviny, vakcín, výživy a športového výkonu. Zistenia výskumníkov vôbec nepotešili. Až polovica odpovedí obsahovala problematické informácie. Pätina odpovedí dokonca radila vyložené nezmysly. Najviac chýb robil model Grok.
Modely zvládali najlepšie témy o rakovine a vakcínach, kde poskytovali najpresnejšie odpovede. Pri výžive si však často vymýšľali. Autori štúdie si následne položili dôležitú otázku. Prečo robia tieto systémy toľko chýb?
Nevedia, iba hádajú slová
Jazykové modely v skutočnosti textu nerozumejú. Pri tvorení odpovede model iba matematicky háda, ktoré slovo by malo nasledovať. Na toto hádanie slov využívajú vzory z obrovského množstva textov vrátane internetových diskusií a blogov. Netriedia informácie podľa prísnej vedeckej pravdivosti. Program dokáže veľmi presvedčivo napodobniť bežnú ľudskú konverzáciu, a preto znie výsledný text veľmi odborne a uveriteľne. Keď program nepozná správnu odpoveď, jednoducho si ju bez zaváhania vymyslí. Chatbot si takto bežne vymyslí aj úplne neexistujúcu vedeckú štúdiu a ponúkne ju ako dôkaz.
Neexistujúce štúdie a vymyslené choroby
Chatboty pacientom často ponúkajú falošné dôkazy. Výskumníci žiadali od systémov vedecké odkazy k tvrdeniam. Umelá inteligencia dodala úplne presné zdroje iba zriedka. Vymyslela si neexistujúcich autorov alebo vytvorila nefunkčné odkazy. Čitateľ zriedka preveruje formálne vyzerajúce citácie. Zdanlivo odborný text ho ľahko oklame.
Okrem zdrojov chatboty klamú aj o samotných chorobách. Vedci z inštitúcie Mount Sinai to potvrdili v experimente. Do otázok úmyselne vložili fiktívne medicínske pojmy. Modely tieto vymyslené pojmy okamžite použili a rozvinuli. Takéto správanie predstavuje pre laikov obrovské riziko. Problém však nepredstavuje iba samotná umelá inteligencia. Zlyháva aj človek.

Spoliehať sa na umelú inteligenciu pri chorobe dieťaťa je riskantné. Algoritmus môže ľahko prehliadnuť kľúčové symptómy a ohroziť zdravie malého pacienta. Zdroj: iStockphoto.com
Používatelia technológii nerozumejú
Výskum z Oxfordu ukázal prekvapivý fakt. Keď vedci zadali chatbotom presné a úplné informácie o pacientovi, stroje správne určili diagnózu v deväťdesiatich piatich percentách prípadov.
Bežný človek však pri komunikácii s chatbotom postupuje inak, a preto presnosť odpovedí klesá hlboko pod štyridsať percent. Väčšina laikov totiž nevie úplne presne a správne opísať všetky svoje zdravotné ťažkosti. Človek bez vzdelania jednoducho netuší, ktoré detaily sú pre určenie choroby kľúčové. Bežní používatelia zároveň často nepochopia ani zdanlivo jasnú odpoveď a nedokážu rady umelej inteligencie správne využiť v praxi.
Presnosť odpovede chatbota závisí od kvality zadaných informácií. Tím z Harvard Medical School skúmal presnosť programov pri určovaní konkrétneho ochorenia. Chatboty nedokázali navrhnúť správny zoznam možných chorôb vo viac ako osemdesiatich percentách prípadov. Keď výskumníci poskytli modelu iba vek, pohlavie a základné príznaky pacienta, model dospel k nesprávnemu výsledku alebo určeniu diagnózy. Výskumníci následne modelom poskytli i reálne laboratórne výsledky. Po pridaní týchto faktov presnosť a správnosť odpovedí prudko stúpli. Presná diagnóza stanovená umelou inteligenciou teda zásadne závisí od dostatku kvalitných medicínskych údajov.
Užitočný pomocník s veľkými medzerami
Umelá inteligencia dokáže šikovne zhrnúť zložité zdravotné témy. Pomáha pacientom pripraviť si dôležité otázky pre doktora. Zatiaľ však nefunguje ako vševediaci lekár. Každé tvrdenie chatbota by bolo treba dôkladne overiť. Ľudia by tiež mali vždy konzultovať svoje zdravie so špecialistom. Technológia má slúžiť len ako pomôcka pri hľadaní informácií, konečné slovo musí mať vždy živý lekár.
Zdroje: The Conversation, nature medicine, BMJ Open, JAMA Network Open, Communications Medicine
(KAM)





