Martin Takáč o súčasných trendoch v Big Data a umelej inteligencii

11. júl. 2019 • Matematické vedy

Martin Takáč o súčasných trendoch v Big Data a umelej inteligencii

Martin Takáč, PhD., je úspešný mladý slovenský výskumník, ktorý pôsobí na rozhraní matematiky a informatiky na súkromnej výskumnej univerzite Lehigh v Bethleheme, Pennsylvania, v Spojených štátoch. Vo vedeckovýskumnej práci sa zameriava najmä na umelú inteligenciu a jej aplikácie v logistike, inžinierskych stavbách, kvantovej chémii a robotike. V roku 2019 získal cenu Richarda P. Vinciho za excelentnosť v oblasti vzdelávania.

Martin Takáč (1986) pochádza z malej obce Čechy na juhu Slovenska. V rokoch 2005 – 2010 študoval ekonomickú a finančnú matematiku na Fakulte matematiky, fyziky a informatiky Univerzity Komenského v Bratislave. Popri štúdiu pracoval part-time ako programátor na zaujímavých projektoch. Pre Martina bol asi najviac zarážajúci fakt, že na jednom z projektov zákazníci vygenerovali milióny transakcií denne, avšak v tom čase sa z nich nedalo nič hlbšie zistiť (a pritom je známe, že dáta = vedomosti = money). Po skončení magisterského štúdia sa rozhodol ísť na doktorandské štúdium, ktoré absolvoval na Univerzite v Edinburghu vo Veľkej Británii u prof. Petra Richtárika (už tam nepracuje, v súčasnosti je na Univerzite KAUST). Štúdium ukončil v roku 2014 získaním titulu Ph.D. V medzinárodnej súťaži The OR Society Doctoral Prize 2014 bola jeho dizertačná práca na tému „Randomized coordinate descent methods for big data optimization" ocenená ako najlepšia v oblasti Operačná analýza vo Veľkej Británii.

Martin Takáč, PhD.Martin Takáč, PhD., pôsobí od roku 2014 na Univerzite Lehigh v Bethleheme (Pennsylvania, USA). Jeho vedeckovýskumná práca je široko interdisciplinárna. Zameriava sa najmä na umelú inteligenciu a jej aplikácie v logistike, inžinierskych stavbách, kvantovej chémii a robotike. Venuje sa tiež navrhovaniu nových optimalizačných algoritmov, ktoré sú určené hlavne pre vysoko výkonné superpočítače. Martin je tímovým hráčom. Spolupracoval s vyše 75 výskumníkmi z rôznych kútov sveta. Na svojom konte má viac ako 70 odborných publikácií. Absolvoval viacero dlhodobých stáží (University of Chicago/Toyota Technological Institute, Simons Institute in Berkeley, SUTD in Singapore a ETH Zürich). V roku 2019 získal cenu Richarda P. Vinciho za excelentnosť v oblasti vzdelávania.

M. BARTOŠOVIČOVÁ: Ako hodnotíte svoje pôsobenie v zahraničí?

M. TAKÁČ: Veľmi pozitívne. Robiť výskum v zahraničí je obrovská príležitosť, ktorá dá človeku veľmi veľa vedomostí, zručností a skúseností. Dovoľte mi spomenúť zopár dôležitých faktorov, ktoré ma výrazne ovplyvnili pri výbere môjho súčasného miesta pôsobenia. Naše oddelenie (department) je v top 20 v USA. Moji kolegovia sú významní a veľmi šikovní výskumníci, napríklad o prof. Tamásovi Terlakym (z Maďarska), som vedel asi už od môjho bakalárskeho štúdia a teraz je mojím kolegom. V podstate, keď nad tým rozmýšľam, skôr ako som začal pracovať na Lehigh University, tak som tam poznal už asi troch ľudí. Takže, keď som videl, že tam majú voľnú pozíciu, bolo pre mňa veľkým lákadlom uchádzať sa o ňu.

M. B.: Aké sú možnosti interdisciplinárnej spolupráce na Lehigh Univerzite?

M. TAKÁČ: Jedným slovom by som to charakterizoval ako „fantastické”. Momentálne spolupracujem s kolegami z viacerých oblastí – od aplikácie umelej inteligencie v monitorovaní stavu („zdravia”) mostov a budov, cez riadenie výroby a logistiky, riadenia dronov až po aplikácie v objavovaní nových materiálov a v kvantovej chémii. Okrem toho, Lehigh má vynikajúcu polohu aj na spoluprácu s inými univerzitami a výskumnými inštitúciami. Za 1 a pol hodiny môžem byť na Manhattane v New Yorku, Philadelphii alebo v Princeton University a asi 3 hodiny mi to trvá dostať sa do Washingtonu D.C., kde sídlia, okrem iného, aj mnohé naše grantové agentúry, ako napríklad National Science Foundation (NSF).

M. B.: Čo je umelá inteligencia a ako funguje?

M. TAKÁČ: Umelá inteligencia je vlastne algoritmus, ktorý sa dokáže učiť z dát sám, bez toho, aby sa explicitne programoval. Príklad: Ak by ste chceli naučiť počítač rozoznať leva od stromu, ako by ste to spravili? Možno by ste napísali nejaký algoritmus, ktorý by sa snažil nájsť dve oči, a ak ich nájde, tak povie, že je tam lev, inak na fotke bude strom. Je to v poriadku, ale ten algoritmus by možno fungoval len na fotky, kde je lev fotený spredu, ale už na fotkách zboku by to nefungovalo. A programátor by musel daný algoritmus prerobiť. Takže očividne treba spraviť niečo lepšie. Ja rád prirovnávam umelú inteligenciu k dieťaťu. Ako naučíte dieťa rozoznávať leva od stromu? Najprv dieťa netuší, čo je to lev a čo je to strom. Tak mu ukážete fotku leva a spýtate sa ho, čo to je. Ak povie „lev”, tak ho pochválite a on sa cíti istejšie pri podobných fotkách. Ak povedalo „strom”, tak očividne spravilo chybu a posnaží sa identifikovať niečo, čo implikuje leva.

M. B.: Kde sa využíva umelá inteligencia? Môžete uviesť niekoľko príkladov?

M. TAKÁČ: Dovolím si povedať, že už teraz sa využíva umelá inteligencia aj na takých miestach, že by ste mi ani neuverili. Začnem možno od najjednoduchších. Napríklad mnoho ľudí, keď otvorí Google, tak vidí možnosť iba niečo vyhľadávať. V skutočnosti je to však oveľa komplikovanejšie. Najprv Google musí zistiť, ktoré stránky sú relevantné k tomu, čo ste zadali. Chcem podotknúť, že ten text na vyhľadávanie nie je jediný vstup do algoritmu. Potom sa snaží zistiť, či ste nechceli zadať niečo iné, napr. či tam nemáte preklep a podobne. Okrem toho sa ešte snaží zistiť, aké reklamy by vám mohol zobraziť – snaží sa predpovedať, aká je šanca, že dané reklamy kliknete, kde a v akom poradí ich zobraziť a tak ďalej.

Trochu zaujímavejšie je napríklad používanie umelej inteligencie na spracovanie žiadostí o zamestnanie. Na pozície vo veľkých spoločnostiach sa môžu hlásiť aj tisíce žiadateľov a spracovať ich žiadosti ručne by bolo nemožné. Takisto by bolo super, keby ste vedeli aj nejako predpovedať, ako ten či onen uchádzač bude úspešný. A práve tu sa dá umelá inteligencia použiť, aby zanalyzovala produktivitu tisícov súčasných a minulých zamestnancov a na základe týchto poznatkov vybrala top kandidátov na danú pozíciu.

Ďalšia veľmi zaujímavá aplikácia je v medicíne. Keď navštívite svojho obvodného lekára, tak s vami strávi možno päť minút a stanoví vám jednu z najčastejších diagnóz, ktoré spĺňajú vaše symptómy, o ktorých ste ho informovali. No v skutočnosti môžete mať jednu zo stoviek iných ochorení, na ktoré dané symptómy tiež sedia, ale sú možno zriedkavé. Umelá inteligencia vám môže položiť zopár otázok navyše a lepšie identifikuje vaše ochorenie. Umelá inteligencia sa takisto môže použiť na vyhodnotenie rôznych údajov z rôznych medicínskych a diagnostických zariadení, ako napr. EKG, MRI či CT. V jednej štúdii napríklad umelá inteligencia lepšie lokalizovala rakovinu z meraní ako rádiológovia.

Členovia výskumnej skupiny (časť tímu). Vľavo Martin Takáč, PhD.

Členovia výskumnej skupiny (časť tímu) na Univerzite Lehigh v Bethleheme, Pennsylvania, USA. Vľavo Martin Takáč, PhD. Zoznam všetkých členov tímu

M. B.: Mohli by ste nás bližšie oboznámiť s obsahom Vašej výskumnej práce?

M. TAKÁČ: Toho je dosť veľa, skúsim vybrať možno tri najzaujímavejšie z nich. S kolegom prof. Snyderom spolupracujeme s firmou Siemens a snažíme sa vniesť umelú inteligenciu (AI) do výrobného procesu a logistiky radiofarmaceutík, ktoré sa využívajú napr. v PET sceneroch. Ide o to, že keď má pacient rakovinu a plánuje sa napríklad ožarovanie, je dôležité vedieť, kde sa nádor presne nachádza. Keďže rakovinové bunky rýchlejšie rastú, tak aj spotrebujú viac energie, teda cukru. No a tu je ten trik. Spraví sa radioaktívny cukor fludeoxyglucose (FDG) a ten emituje radioaktivitu, ktorá sa následne detekuje pomocou PET a krásne sa zachytí zdroj odkiaľ sa najviac emituje – tým sa dajú lokalizovať rakovinové nádory. Samozrejme, že keď sa dáva do pacienta radioaktívna látka, tak človek by ideálne chcel, aby sa čo najrýchlejšie dostala z tela von, resp. aby sa rýchlo rozpadla.

Čo sa týka FDG, tak ten má polčas rozpadu 110 minút, čo znamená, že za 110 minút sa zníži radioaktivita na polovicu. A v tomto benefite pre človeka vzniká problém pri výrobe a logistike. Ak vám zostane auto s FDG zaseknuté v cestnej zápche na dve hodiny, tak polovica radioaktivity je už preč. Samozrejme, človek by teoreticky mohol vyprodukovať toho viac (do zálohy), ale to nie je lacná záležitosť. Takže my sa snažíme definovať tzv. AI agentov, ktorí sa snažia analyzovať historické údaje o doprave, počasí, udalostiach v meste atď. a navrhnúť koľko FDG vyrobiť (a ako) a ako to celé distribuovať do centier, kde sa to podá pacientom. Výhodou nášho prístupu je to, že my sa nesnažíme predpovedať aká bude dopravná situácia na danej ceste, ale skôr sa snažíme zobrať do úvahy rôzne faktory, ktoré ovplyvňujú dopravu a automaticky riadiť logistiku v reálnom čase.

Ďalšia zaujímavá aplikácia je v robotike. Konkrétne s prof. Motee z Mechanical Engineering & Mechanics Department vyvíjame autonómne drony. Predstavte si, že v lese sa stratí dieťa a chceme ho rýchlo nájsť. Namiesto toho, aby sme poslali napríklad jedného robota, môžeme ich poslať možno stovku a tým zvýšiť šancu, že danú osobu nájdeme v čo najkratšom čase. Samozrejme, keď máme stovku lietajúcich dronov, tak ich nedokážeme ovládať manuálne a musia lietať „samé”, teda musia byť autonómne. Navyše, musia sa naučiť spolupracovať na danej úlohe, teda aj keď máme jedného AI agenta, ktorý by dokázal daný problém vyriešiť sám, dosiahnuť to, aby skupina AI agentov vedela spolupracovať a vyvinúť spôsob ako efektívne komunikovať medzi sebou, je to dosť ťažký oriešok.

Ďalší problém je ten, že ak máte dron čo letí cez les, dajme tomu rýchlosťou 100km/hod, tak tie AI algoritmy musia byt veľmi efektívne, aby vedeli veľmi rýchlo reagovať na rôzne podnety. A tu je ďalší zádrheľ. Trénovať umelú inteligenciu s takým obmedzením je omnoho náročnejšie a musíme vyvinúť lepšie optimalizačné algoritmy, aby sme to docielili. Možno posledná aplikácia je s kolegom prof. Rangarajanom z Chemical and Biomolecular Engineering department. Snažíme sa o využitie umelej inteligencie v kvantovej chémii. Predstavte si, že človek chce potenciálne navrhnúť katalyzátor na chemickú reakciu alebo vyvinúť nejaký nový kryštál s určitými vlastnosťami. Sú v podstate dve možnosti: človek bude skúšať rôzne veci v laboratóriu, na čo potrebujete veľmi veľa peňazí a ľudí, alebo výskumník sa bude snažiť použiť rôzne teórie a výpočtovú silu superpočítačov na predikciu ako dané reakcie môžu prebiehať, respektíve, aké vlastnosti bude mať ten či onen materiál. No a keďže tieto výpočty sú komplikované a dlho trvajú, snažíme sa použiť umelú inteligenciu, aby sme dostali tieto výsledky rýchlejšie. V podstate umelá inteligencia sa snaží nájsť spoločné vzory a využiť ich na robenie predikcií.

Martin Takáč a jeho bývalý PhD študent Dr. Xi He

Martin Takáč a jeho bývalý PhD študent Dr. Xi He

M. B.: Ako by ste popísali Big Data a ich využitie v praxi?

M. TAKÁČ: Asi začnem zosumarizovaním prvej hodiny k predmetu “Mining of Massive Dataset”, ktorá je veľmi vyhľadávaná študentmi. Big Data je mega trend a zahŕňa v sebe veľmi veľa disciplín, databáz, cez strojové učenie, algoritmy, ekonómiu, sociálne vedy, a mnoho ďalších. Ale v podstate ide o nájdenie nejakých vzorov v dátach, ktoré sú platné, užitočné, neočakávané a dajú sa pochopiť. Príklad. Zoberiem všetky transakcie z nejakej siete predajní. A budem analyzovať, čo ľudia často kupujú spolu. Asi nikoho neprekvapím, ak by som zistil, že ľudia veľmi často kupujú napr. mlieko a pečivo. Ako zaujímavý príklad sa uvádza, že dosť často sa kupujú plienky a pivo spolu. Je to možno prekvapujúce, ale keď sa nad tým zamyslíme, možno to dáva aj zmysel. Oteckovia s malými deťmi asi nemôžu ísť tak často na pivo s kamarátmi, a tak si ho kúpia sami. Takže toto sa dá vysvetliť. A ako to môže byt užitočné? Možno spravím akciu na plienky a trochu zvýšim cenu piva s cieľom zvýšiť zisk. Ak zostaneme pri analyzovaní týchto nákupných košíkov, zoberme si dvojicu „mlieko a pečivo”. Ak ľudia dosť často nakupujú pečivo a mlieko spolu, a chceme im nanútiť, aby si kúpili aj ďalšie veci, môžeme umiestniť mlieko a pečivo na opačné strany obchodu (teraz sa zamyslíte, ako je to riešené v obchode, kde nakupujete) a tým donútime zákazníka poprechádzať sa po obchode, čo väčšinou skončí kúpou aj ďalších vecí.

Ďalšia zaujímavá aplikácia Big Data je napríklad v odporúčaní produktu, čo si pozrieť/kúpiť. Na Slovensku už máme službu Netflix (poskytovateľ filmov cez internet), ktorá sa preslávila tým, že užívateľom vie poskytnúť personalizované odporúčania, ktoré filmy si má pozrieť. No a ako to asi vie? Koncept je veľmi jednoduchý, vy pozeráte nejaké filmy a následne ich hodnotíte. A keďže Netflix využíva veľmi veľa ľudí, tak sa umelá inteligencia dokáže naučiť, aký typ zákazníka ste vy, a čo ostatní zákazníci podobní vám majú radi a to vám odporúča. Podobne je to napríklad na internetových stránkach novín, ako je napr. New York Times, kde zákazníkom navrhujú články, čo by ich asi zaujímalo alebo na YouTube vám púšťajú jedno video za druhým a vás to celkom baví pozerať až do rána (a medzi tým sa napozeráte reklám a reklám). Aby som to zhrnul, Big Data v praxi majú nasledovný primárny cieľ: odhaliť niečo zaujímavé, čo sa dá použiť na zvýšenie zisku spoločnosti.

M. B.: Ako dokáže umelá inteligencia spracovať a analyzovať také množstvo veľkých dát – Big Data?

M. TAKÁČ: Je veľa rôznych problémov a každý má iný spôsob riešenia. Ale skoro každá metóda riešenia má zopár spoločných komponentov: ako uložiť dáta (niektoré problémy majú TeraByte dát), ako ich efektívne spracovávať na super výkonných počítačoch a aký algoritmus použiť na dosiahnutie požadovaného výsledku v pomerne rozumnom čase. Zoberme si napríklad emaily. Každý deň sa pošle možno 150 miliárd emailov, dajme tomu že cez Google nech je to ~1% z nich, takže sme na 1 miliarde emailov denne. Na USB kľúč sa to asi nevmestí, môžeme skúsiť nejaký lepší pevný disk, a možno tam dáme emaily z jedného dňa, no určite sa tam nevmestia emaily za posledný mesiac či rok. Takže vidíme, že musíme použiť možno stovky až tisícky pevných diskov a stovky až tisícky počítačov prepojených navzájom na analyzovanie rôznych úloh.

M. B.: Kam smeruje umelá inteligencia? Kde sú, podľa Vás, jej hranice?

M. TAKÁČ: Na túto otázku by sme asi mohli polemizovať veľmi dlho. Osobne som toho názoru, že AI zmení veľmi veľa a možno už za 5 – 10 rokov to pocítime. Umelá inteligencia nám napríklad umožňuje robiť operácie, aké chirurg – človek nebol schopný (ide o špeciálne úkony), o niekoľko rokov bude zrejme väčšina kamiónov jazdiť bez šoféra a možno diagnostiku ochorení si budeme robiť doma cez počítač a bez doktora. Podľa mňa dôležitejšia otázka je, ako sa na to pripraviť už teraz, aby mladí ľudia vedeli byt efektívni a vedeli koexistovať s novými technológiami. Ale ktohovie čo budúcnosť naozaj prinesie. Ako hovoril môj profesor na ekonómii: Je ťažké robiť predikcie, hlavne do budúcnosti.

M. B.: V roku 2019 ste získali cenu Richarda P. Vinciho za excelentnosť v oblasti vzdelávania. Mohli by ste nám objasniť o čo išlo?

M. TAKÁČ: Čo sa týka učenia, tak učím minimálne, iba tri predmety za akademický rok (2 semestre), ale čo majú študenti veľmi radi, je asi moja filozofia učenia. Tá sa dá charakterizovať asi tak dvoma vetami: „Po prvé. Nemôžeš sa naučiť hrať na klavíri, ak by si sa iba pozeral na mňa, ako hrám.” To znamená, že u mňa na hodinách musia očakávať veľmi veľa projektov a musia ich riešiť. „Po druhé. Je oveľa lepšie byť neúspešný v riešení super ťažkého problému, ako vyriešiť ľahučký príklad na výbornú.” V mojom ponímaní tie projekty, ktoré im zadávam, sú super ťažké, mnoho z tých projektov nikto na svete nevie optimálne vyriešiť, čo je dané hlavne komplexnosťou a otvorenosťou projektu.

Takisto verím v tímovú prácu, preto všetky projekty sú povinne v skupinkách aspoň štyroch ľudí. A hneď viem na čo myslíte: Jeden spraví celý projekt a ostatní sa iba vezú! Zlý prístup! No, aby som vás presvedčil, že na mojich hodinách to tak nejde, tak vám ešte prezradím, ako hodnotím projekty. Každý študent v skupine má ústnu skúšku, na ktorej sa ho pýtam na rôzne detaily o projekte a celá skupina dostane takú známku, akú by mala najhoršia odpoveď v rámci danej skupiny. Takže, aj keď mám nejakého veľmi šikovného študenta v skupine, ten sa snaží ostošesť to všetkých naučiť a dbať o to, aby to všetci naozaj pochopili. A to je cieľom učenia, nie?!

Popri prednáškach vediem mnoho menších výskumných projektov, buď bakalárov alebo diplomovky budúcich inžinierov na rôzne témy z umelej inteligencie. Takisto som začal s krúžkami robotiky a umelej inteligencie na strednej a základnej škole, aby sa budúci študenti nadchli pre programovanie a umelú inteligenciu.

M. B.: Ďakujem Vám za rozhovor.

Úspešný mladý slovenský výskumník Martin Takáč, PhD., z Univerzity Lehigh v Bethleheme, Pennsylvania, USA, bude hosťom vedeckej kaviarne Veda v Centre – Letný špeciál, kde bude prezentovať tému „Súčasné trendy v Big Data a umelej inteligencii". Vedecká kaviareň sa uskutoční vo štvrtok 11. júla 2019 o 17.00 hod. v Centre vedecko-technických informácií SR, Lamačská cesta 8/A, v Bratislave (Patrónka). Vstup pre verejnosť je voľný!

Júlová vedecká kaviareň je sprievodným podujatím Festivalu vedy Európska noc výskumníkov 2019.

 

Rozhovor pripravila a uverejnila: Marta Bartošovičová, NCP VaT pri CVTI SR

Fotozdroj: https://www2.lehigh.edu/news/a-holistic-interest-in-algorithms

https://engineering.lehigh.edu/faculty/martin-takac

http://optml.lehigh.edu/people/

archív Martina Takáča, PhD.

Súvisiace:

Hore
fotografická súťaž TVT 2019
Noc výskumníkov 2019
kúpa časopisov jún 2016
Atmosféra počas TVT 2018
Publikácie Veda v CENTRE
Aurelium - centrum vedy
Vedec roka 2018
QUARK
Prechod VK na VND - leto
TVT 2018 články
TAG Centrum vedy
TAG Mládež
TAG QUARK
TAG Ženy vo vede
TAG Spektrum vedy
TAG Slovenská veda
TAG História
TAG Rozhovor
TAG Publikácia
TAG Zaujímavosti vo vede
banner záhrady
Zaujímavosti vo vede
Určité zmeny črevnej mikroflóry môžu byť spojené s rozvojom chronických chorôb.
Zistite viac