DeepSearch, alebo nájdeme to, čo práve potrebujete


DeepSearch, alebo nájdeme to, čo práve potrebujete

Webová aplikácia, ktorá umožní používateľom rýchlo a jednoducho nájsť to, čo práve potrebujú, má vzniknúť v rámci projektu DeepSearch, s podtitulom „alebo nájdeme to, čo práve potrebujete“. Zaoberajú sa ním študenti Slovenskej technickej univerzity v Bratislave v rámci predmetu Tímový projekt.

Vedúcou tímu je Ing. Nadežda Andrejčíková, PhD., ako odporúčané technológie sa uvádzajú Elastic Search, Python, Ruby on Rails, poprípade DBMS Caché.

Realizátori projektu pracujú prevažne s neštruktúrovanými dátami v slovenčine (češtine), teda s článkami, ktoré vznikli ako výsledok digitalizácie, alebo priamo v elektronickej podobe. Okrem týchto textov sú k dispozícii ku každému článku základné metadáta (názov, autori, zdroj, kľúčové slová a podobne). Okrem toho je možné využiť rôzne slovníky, tezaury a súbory autorít, ktoré sú budované v knižniciach.   

„Ide o veľmi aktuálny problém. Existujú už predspracované dáta, takže bude na čom stavať. Projekt je v každom smere otvorený kreatívnym nápadom a inováciám v riešení,“ uvádzajú jeho tvorcovia.

Informácie sú dnes veľmi cenným artiklom aj napriek tomu, že ich je stále viac. Problém je nájsť v danom čase práve to, čo teraz a tu potrebujeme a môcť sa na ne ešte aj spoľahnúť. Veľa informácií sa nachádza v časopisoch, ktoré sú buď zdigitalizované alebo dnes väčšinou už priamo v elektronickej podobe. Faktom je že, plnotextové vyhľadávanie nám ponúkne veľa takých informácií, ktoré s našim problémom vôbec nesúvisia alebo len veľmi okrajovo. Prechádzať ich ručne je časovo veľmi náročné. Preto v minulom roku vznikol tím Nautilus, ktorý vytvoril aplikáciu na automatizované spracovanie zdigitalizovaných časopisov tak, že jednotlivé čísla rozdelili na články a vytvorili k nim aj základné metadáta. 

„Našou úlohou je teraz spracovať tieto texty tak, aby sa v nich dalo efektívne vyhľadávať na základe významu. Keďže spracovanie prirodzeného jazyka je nielen náročné, ale aj veľmi rozsiahle, v prvom kroku sa sústreďujeme na identifikáciu a rozpoznanie pomenovaných entít. Z kontextu sa snažíme zistiť význam, v akom boli tieto použité a podľa toho článok prelinkujeme so zodpovedajúcim záznamom v súbore autorít. Získame tak cenný zdroj, v ktorom budeme môcť automaticky odhaľovať nové znalosti,“ popisujú realizátori projektu.

Používatelia budú mať jednoduchý, ľahko použiteľný, rýchly a efektívny nástroj pre vyhľadávanie informácií a budú môcť jednoducho objavovať a získavať informácie „znovu nájdené“.

Riešenie je v každom smere otvorené kreatívnym nápadom a inováciám v riešení, dodali tvorcovia projektu.  

*********************************************

Fakulta informatiky a informačných technológií (FIIT) STU v Bratislave nadväzuje na skúsenosti, ktoré má s nápaditými  IT projektmi. Študenti FIIT STU každý rok v rámci predmetu Tímový projekt simulujú prácu vývojárskych tímov a riešia témy, ktorým aktuálne čelia aj firmy pôsobiace v IT sektore. Tento rok riešia študentské tímy 27 projektov.

Práve IT sektor charakterizuje vysoká intenzita inovácií, ktoré komerčne zhodnocujú start-upy a pre študentov môžu byť tieto zručnosti veľkým prínosom.

„Tímové projekty sú jedným z najobľúbenejších predmetov u študentov. Je to dôsledok aj toho, aké témy študenti riešia. Zapojenie externého prostredia do projektov prináša ešte zaujímavejšie témy a tiež nové skúsenosti nielen pre študentov, ale aj pre ich vedúcich z radov učiteľov. Zároveň vzniká platforma na vytvorenie nových spoluprác s firmami, verejnými a mimovládnymi organizáciami a celkové posilnenie spolupráce univerzity s praxou,“ povedala profesorka Mária Bieliková, garantka predmetu Tímový projekt na FIIT STU v Bratislave.

 

Informácie poskytla: Andrea Settey Hajdúchová, manažérka pre komunikáciu, Slovenská technická univerzita v Bratislave

Spracovala: Slávka Cigáňová (Habrmanová), NCP VaT pri CVTI SR

Ilustračné foto: Pixabay.com

Uverejnila: VČ

   

Súvisiace:

Hore
Publikácie Veda v CENTRE
Veda v Centre
FVF 2018
Vedec roka 2017
kúpa časopisov jún 2016
Prechod VK na VND
Bratislavská vedecká cukráreň
QUARK
Atmosféra počas TVT 2017
Aurelium - centrum vedy
TVT 2017 články
TAG Centrum vedy
TAG Mládež
TAG QUARK
TAG Ženy vo vede
TAG Slovenská veda
TAG História
TAG Spektrum vedy
TAG Rozhovor
TAG Publikácia
TAG Zaujímavosti vo vede
banner záhrady
Zaujímavosti vo vede
Koaly spia priemerne 22 hodín denne.