Webová aplikácia, ktorá umožní používateľom rýchlo a jednoducho nájsť to, čo práve potrebujú, má vzniknúť v rámci projektu DeepSearch, s podtitulom „alebo nájdeme to, čo práve potrebujete“. Zaoberajú sa ním študenti Slovenskej technickej univerzity v Bratislave v rámci predmetu Tímový projekt.
Vedúcou tímu je Ing. Nadežda Andrejčíková, PhD., ako odporúčané technológie sa uvádzajú Elastic Search, Python, Ruby on Rails, poprípade DBMS Caché.
Realizátori projektu pracujú prevažne s neštruktúrovanými dátami v slovenčine (češtine), teda s článkami, ktoré vznikli ako výsledok digitalizácie, alebo priamo v elektronickej podobe. Okrem týchto textov sú k dispozícii ku každému článku základné metadáta (názov, autori, zdroj, kľúčové slová a podobne). Okrem toho je možné využiť rôzne slovníky, tezaury a súbory autorít, ktoré sú budované v knižniciach.
„Ide o veľmi aktuálny problém. Existujú už predspracované dáta, takže bude na čom stavať. Projekt je v každom smere otvorený kreatívnym nápadom a inováciám v riešení,“ uvádzajú jeho tvorcovia.
Informácie sú dnes veľmi cenným artiklom aj napriek tomu, že ich je stále viac. Problém je nájsť v danom čase práve to, čo teraz a tu potrebujeme a môcť sa na ne ešte aj spoľahnúť. Veľa informácií sa nachádza v časopisoch, ktoré sú buď zdigitalizované alebo dnes väčšinou už priamo v elektronickej podobe. Faktom je že, plnotextové vyhľadávanie nám ponúkne veľa takých informácií, ktoré s našim problémom vôbec nesúvisia alebo len veľmi okrajovo. Prechádzať ich ručne je časovo veľmi náročné. Preto v minulom roku vznikol tím Nautilus, ktorý vytvoril aplikáciu na automatizované spracovanie zdigitalizovaných časopisov tak, že jednotlivé čísla rozdelili na články a vytvorili k nim aj základné metadáta.
„Našou úlohou je teraz spracovať tieto texty tak, aby sa v nich dalo efektívne vyhľadávať na základe významu. Keďže spracovanie prirodzeného jazyka je nielen náročné, ale aj veľmi rozsiahle, v prvom kroku sa sústreďujeme na identifikáciu a rozpoznanie pomenovaných entít. Z kontextu sa snažíme zistiť význam, v akom boli tieto použité a podľa toho článok prelinkujeme so zodpovedajúcim záznamom v súbore autorít. Získame tak cenný zdroj, v ktorom budeme môcť automaticky odhaľovať nové znalosti,“ popisujú realizátori projektu.
Používatelia budú mať jednoduchý, ľahko použiteľný, rýchly a efektívny nástroj pre vyhľadávanie informácií a budú môcť jednoducho objavovať a získavať informácie „znovu nájdené“.
Riešenie je v každom smere otvorené kreatívnym nápadom a inováciám v riešení, dodali tvorcovia projektu.
*********************************************
Fakulta informatiky a informačných technológií (FIIT) STU v Bratislave nadväzuje na skúsenosti, ktoré má s nápaditými IT projektmi. Študenti FIIT STU každý rok v rámci predmetu Tímový projekt simulujú prácu vývojárskych tímov a riešia témy, ktorým aktuálne čelia aj firmy pôsobiace v IT sektore. Tento rok riešia študentské tímy 27 projektov.
Práve IT sektor charakterizuje vysoká intenzita inovácií, ktoré komerčne zhodnocujú start-upy a pre študentov môžu byť tieto zručnosti veľkým prínosom.
„Tímové projekty sú jedným z najobľúbenejších predmetov u študentov. Je to dôsledok aj toho, aké témy študenti riešia. Zapojenie externého prostredia do projektov prináša ešte zaujímavejšie témy a tiež nové skúsenosti nielen pre študentov, ale aj pre ich vedúcich z radov učiteľov. Zároveň vzniká platforma na vytvorenie nových spoluprác s firmami, verejnými a mimovládnymi organizáciami a celkové posilnenie spolupráce univerzity s praxou,“ povedala profesorka Mária Bieliková, garantka predmetu Tímový projekt na FIIT STU v Bratislave.
Informácie poskytla: Andrea Settey Hajdúchová, manažérka pre komunikáciu, Slovenská technická univerzita v Bratislave
Spracovala: Slávka Cigáňová (Habrmanová), NCP VaT pri CVTI SR
Ilustračné foto: Pixabay.com
Uverejnila: VČ