Vedci sa pokúšajú odhadnúť vývoj vírusov v dlhodobom horizonte. Pomôcť môže umelá inteligencia.
Najdôležitejším bodom pripravenosti na pandémiu je schopnosť len pri pohľade na genetickú sekvenciu vírusu predpovedať, ako sa bude vyvíjať. Čoraz väčší počet výskumných skupín využíva umelú inteligenciu (AI) na predpovedanie vývoja SARS-CoV-2, chrípky a iných vírusov.
Vakcíny v predstihu
Vírusy – najmä RNA vírusy, ako je SARS-CoV-2 – sa neustále vyvíjajú hromadením nových mutácií. Niektoré z týchto zmien sú pre vírus výhodné, pretože umožňujú variantom vyhnúť sa imunite hostiteľa a rýchlo sa šíriť. Predpovedaním vývoja vírusu by mohli vedci teoreticky vopred navrhnúť vakcíny a antivírusovú liečbu.
Ako píše portál Nature, nástroje umelej inteligencie zatiaľ dokážu predpovedať, ktoré jednotlivé mutácie vo víruse budú najúspešnejšie a ktoré varianty v krátkodobom horizonte „vyhrajú“. Stále však ani zďaleka nie sú schopné predpovedať kombinácie mutácií alebo variantov, ktoré sa vyskytnú v budúcnosti.
„Je to skutočne vzrušujúca a veľmi užitočná oblasť výskumu,“ hovorí Brian Hie, výpočtový biológ na Stanfordovej univerzite v Kalifornii a jeden z prvých výskumníkov, ktorí aplikovali veľké jazykové modely na štúdium vírusových mutácií. Predpovedanie vývoja vírusu je však podľa jeho slov stále mimoriadne náročné.
Nástroje umelej inteligencie
V minulosti vykonávali vedci laboratórne experimenty na identifikáciu variantov s rozšírenými vlastnosťami. Je to však namáhavé a časovo náročné. Niektoré skupiny, ako napríklad laboratórium vedené Yunlongom Caom, imunológom z Pekinskej univerzity v Pekingu, vyvinuli experimenty skúmajúce, ako jednotlivé mutácie ovplyvňujú schopnosť vírusu uniknúť detekcii panelom protilátok. Tieto experimenty môžu vysvetliť veľkú časť týkajúcu sa evolúcie vírusov, nie však všetko.
Príchod nástrojov na predpovedanie proteínovej štruktúry, ktoré sú založené na umelej inteligencii – napríklad AlphaFold z dielne londýnskej spoločnosti DeepMind, ako aj ESM-2 a ESMFold vytvorené spoločnosťou Meta (predtým Facebook) –, priniesol do tejto oblasti nový vietor, hovorí David Robertson, virológ z Glasgowskej univerzity vo Veľkej Británii.
Modely AI si vyžadujú obrovské množstvo údajov, aby mohli predpovedať vývoj vírusu. Umožnilo to hromadné sekvenovanie vírusu SARS-CoV-2, ktorý spôsobuje ochorenie COVID-19, hovorí Jumpei Ito, bioinformatik z Tokijskej univerzity. Vedci majú teraz takmer 17 miliónov sekvencií, ktoré môžu použiť na trénovanie svojich modelov.
Jeden model s názvom EVEscape, ktorý vyvinuli Debora Marksová z Harvard Medical School v Bostone v štáte Massachusetts a jej tím, bol použitý na vytvorenie 83 možných verzií spike proteínu SARS-CoV-2, ktorý vírus používa na infikovanie buniek. Tieto spike avatary sa môžu vyhnúť protilátkam produkovaným ľuďmi, ktorí boli očkovaní alebo infikovaní v súčasnosti cirkulujúcimi variantmi, a mohli by sa použiť na testovanie účinnosti budúcich vakcín proti covidu.
Úspešné predpovede
Itova skupina sa zameriava na širšiu charakteristiku vírusovej zdatnosti – schopnosť variantov rýchlo sa šíriť v populácii a nakoniec dominovať. Vedci použili ESM-2 na vytvorenie modelu s názvom CoVFit, ktorý dokáže predpovedať relatívnu vhodnosť variantov SARS-CoV-2. CoVFit je trénovaný na 13 643 variantoch spike proteínu SARS-CoV-2 a tiež využíva experimentálne údaje z Caovej skupiny o tom, ako ovplyvňujú jednotlivé mutácie schopnosť vírusu vyhýbať sa protilátkam.
Itov tím vytvoril obmedzený model trénovaný pomocou údajov o variantoch do augusta 2022 a zistil, že úspešne predpovedal zlepšenie kondície určitých variantov po tomto obmedzení vrátane XBB5, čiže nového variantu, ktorý sa uchytil neskôr v tom istom roku.
Päť rokov údajov
Do marca 2024 bol celosvetovo dominantným variantom SARS-CoV-2 variant s názvom JN.1. Itova skupina identifikovala pomocou CoVFit tri zmeny jednotlivých aminokyselín, ktoré by pomohli JN.1 získať kondíciu. Tieto mutácie sa odvtedy objavili vo variantoch, ktoré sa globálne rýchlo rozširujú.
Na zlepšenie presnosti modelov AI budú výskumníci potrebovať viac ako päť rokov údajov o vývoji vírusov, hovorí Cao. Kombinácia údajov o sekvenovaní dohľadu s experimentálnymi údajmi pomáha prekonať niektoré problémy s údajmi, konštatuje Cao.
Úprava očkovania
Niekoľko ďalších skupín tiež vyvíja modely využívajúce kombinované údaje. Jeden z nich vedie Itov kolega z Tokijskej univerzity, evolučný virológ Shusuke Kawakubo. V práci, ktorá ešte nebola publikovaná, sa Kawakubo zaoberá schopnosťou vírusu chrípky vyvolať imunitnú odpoveď u svojho hostiteľa.
Ak sa hemaglutinínový proteín chrípky (jeho ekvivalent spike proteínu) dostatočne zmení, imunitná odpoveď tela ho nemusí rozpoznať. V tomto bode musia svetoví výrobcovia vakcín upraviť zodpovedajúcim spôsobom očkovanie proti chrípke v budúcej sezóne.
Väčšina z týchto modelov je obmedzená na pochopenie účinkov malých zmien, ale teoreticky majú vírusy takmer nekonečný priestor na vývoj, hovorí Ito. Napríklad variant omikron prišiel na scénu s viac ako 50 mutáciami, ktoré sa nepodobali na nič, čo videli vedci dovtedy.
Rýchlosť šírenia vírusu
Tieto náhle evolučné skoky je ťažké predvídať. Robertson a jeho kolegovia sa snažia nájsť spôsoby, ako využiť modely AI na lepšie pochopenie týchto rozsiahlych evolučných trajektórií a určenie ich limitov.
Vedci zistili, že ak by dali ESM-2 samostatnú spike sekvenciu, mohli by identifikovať oblasti, kde môže dôjsť k zmenám. Tiež by mohli určiť, ako by mohli tieto zmeny ovplyvniť iné oblasti proteínu. „Je to trochu ako čierna mágia,“ hovorí Robertson. Cieľom je podľa neho zistiť, ako rýchlo a akými spôsobmi sa môže vírus vyvíjať po tom, ako sa vyskytne v populácii.
Zdroj: Nature
(LDS)