Preskočiť na obsah Preskočiť na pätu (NCP VaT)
VEDA NA DOSAH – váš zdroj informácií o slovenskej vede

DeepSearch, alebo nájdeme to, čo práve potrebujete

VEDA NA DOSAH

ilustračné foto /webová aplikácia/; zdroj: Pixabay.com

Webová aplikácia, ktorá umožní používateľom rýchlo a jednoducho nájsť to, čo práve potrebujú, má vzniknúť v rámci projektu DeepSearch, s podtitulom „alebo nájdeme to, čo práve potrebujete“. Zaoberajú sa ním študenti Slovenskej technickej univerzity v Bratislave v rámci predmetu Tímový projekt.

Vedúcou tímu je Ing. Nadežda Andrejčíková, PhD., ako odporúčané technológie sa uvádzajú Elastic Search, Python, Ruby on Rails, poprípade DBMS Caché.

Realizátori projektu pracujú prevažne s neštruktúrovanými dátami v slovenčine (češtine), teda s článkami, ktoré vznikli ako výsledok digitalizácie, alebo priamo v elektronickej podobe. Okrem týchto textov sú k dispozícii ku každému článku základné metadáta (názov, autori, zdroj, kľúčové slová a podobne). Okrem toho je možné využiť rôzne slovníky, tezaury a súbory autorít, ktoré sú budované v knižniciach.   

„Ide o veľmi aktuálny problém. Existujú už predspracované dáta, takže bude na čom stavať. Projekt je v každom smere otvorený kreatívnym nápadom a inováciám v riešení,“ uvádzajú jeho tvorcovia.

Informácie sú dnes veľmi cenným artiklom aj napriek tomu, že ich je stále viac. Problém je nájsť v danom čase práve to, čo teraz a tu potrebujeme a môcť sa na ne ešte aj spoľahnúť. Veľa informácií sa nachádza v časopisoch, ktoré sú buď zdigitalizované alebo dnes väčšinou už priamo v elektronickej podobe. Faktom je že, plnotextové vyhľadávanie nám ponúkne veľa takých informácií, ktoré s našim problémom vôbec nesúvisia alebo len veľmi okrajovo. Prechádzať ich ručne je časovo veľmi náročné. Preto v minulom roku vznikol tím Nautilus, ktorý vytvoril aplikáciu na automatizované spracovanie zdigitalizovaných časopisov tak, že jednotlivé čísla rozdelili na články a vytvorili k nim aj základné metadáta. 

„Našou úlohou je teraz spracovať tieto texty tak, aby sa v nich dalo efektívne vyhľadávať na základe významu. Keďže spracovanie prirodzeného jazyka je nielen náročné, ale aj veľmi rozsiahle, v prvom kroku sa sústreďujeme na identifikáciu a rozpoznanie pomenovaných entít. Z kontextu sa snažíme zistiť význam, v akom boli tieto použité a podľa toho článok prelinkujeme so zodpovedajúcim záznamom v súbore autorít. Získame tak cenný zdroj, v ktorom budeme môcť automaticky odhaľovať nové znalosti,“ popisujú realizátori projektu.

Používatelia budú mať jednoduchý, ľahko použiteľný, rýchly a efektívny nástroj pre vyhľadávanie informácií a budú môcť jednoducho objavovať a získavať informácie „znovu nájdené“.

Riešenie je v každom smere otvorené kreatívnym nápadom a inováciám v riešení, dodali tvorcovia projektu.  

*********************************************

Fakulta informatiky a informačných technológií (FIIT) STU v Bratislave nadväzuje na skúsenosti, ktoré má s nápaditými  IT projektmi. Študenti FIIT STU každý rok v rámci predmetu Tímový projekt simulujú prácu vývojárskych tímov a riešia témy, ktorým aktuálne čelia aj firmy pôsobiace v IT sektore. Tento rok riešia študentské tímy 27 projektov.

Práve IT sektor charakterizuje vysoká intenzita inovácií, ktoré komerčne zhodnocujú start-upy a pre študentov môžu byť tieto zručnosti veľkým prínosom.

„Tímové projekty sú jedným z najobľúbenejších predmetov u študentov. Je to dôsledok aj toho, aké témy študenti riešia. Zapojenie externého prostredia do projektov prináša ešte zaujímavejšie témy a tiež nové skúsenosti nielen pre študentov, ale aj pre ich vedúcich z radov učiteľov. Zároveň vzniká platforma na vytvorenie nových spoluprác s firmami, verejnými a mimovládnymi organizáciami a celkové posilnenie spolupráce univerzity s praxou,“ povedala profesorka Mária Bieliková, garantka predmetu Tímový projekt na FIIT STU v Bratislave.

 

Informácie poskytla: Andrea Settey Hajdúchová, manažérka pre komunikáciu, Slovenská technická univerzita v Bratislave

Spracovala: Slávka Cigáňová (Habrmanová), NCP VaT pri CVTI SR

Ilustračné foto: Pixabay.com

Uverejnila: VČ

   

CENTRUM VEDECKO-TECHNICKÝCH INFORMÁCIÍ SR Ministerstvo školstva, výskumu, vývoja a mládeže Slovenskej republiky