Preskočiť na obsah Preskočiť na pätu (NCP VaT)
VEDA NA DOSAH – váš zdroj informácií o slovenskej vede

A kde je ten najzaujímavejší ukazovateľ týkajúci sa plagiátorstva?

VEDA NA DOSAH

Copyright - problem paste (Zdroj: Wikimedia https://upload.wikimedia.org/wikipedia/commons/thumb/5/5a/Copyright-problem_paste.svg/500px-Copyright-problem_paste.svg.png )

Plagiátorstvo je súputníkom celej ľudskej histórie. Od úsvitu písaného slova si autori „vypožičiavali“ texty, ich časti, znaky a obrázky od iných, viac či menej ich menili, a potom ich považovali za svoje výtvory. Datuje sa to od Homérovej Odysey a Virgíliovej Eneidy až po diela Williama Shakespeara. Ba ešte skôr. Bola to bežná prax. Autorské práva sa dostali do legislatívy až v 18. storočí – 1710 v Anglicku a 1790 v USA.

Odhaľovanie plagiátorstva pomocou informačno-komunikačných technológií má vo svete už pomerne dlhú tradíciu – od sedemdesiatych rokov minulého storočia. Najprv sa pracovalo na odhaľovaní plagiátov v zdrojových kódoch programov, potom sa pristúpilo aj k detekcii plagiátov v textových dokumentoch. V roku 1997 sa na trhu predstavil komerčný produkt TurnItIn slúžiaci na detekciu plagiátov od spoločnosti iParadigms (USA). Bol úspešný, v ďalšom roku už dosiahol medzinárodné uznanie. Potom nasledovali produkty od iných spoločností, ako napríklad Urkund 1999, Plagiarismsearch 2008, PlagScan 2008, Grammarly 2009, SK ANTIPLAG 2010, …

Školy si zabezpečujú službu kontroly originality individuálne – to je najbežnejší model vo svete. Tento model je s vysokou pravdepodobnosťou drahší ako model, pri ktorom sa kontrola originality zabezpečuje centrálne pre všetky školy v krajine (prípad Slovenska, v tomto roku bude podobný model zavedený do praxe v Poľsku).

Systémy pre odhaľovanie plagiátov (na kontrolu originality) vyhľadávajú podobnosti v kontrolovanej práci s inými dokumentmi. Výsledkom býva protokol o kontrole originality, ktorý zvyčajne obsahuje celkový index podobnosti a individuálne podobnosti s porovnávanými dokumentmi.

Na stránke ORGANIZATION for ONLINE LEARNIG sú v časti Plagiarism Statistics uvedené rôzne kvantitatívne štatistické ukazovatele vypovedajúce o plagiátorstve. Zaujímavá štatistika je v príspevku A national strategy for addressing student plagiarism, kde sa hodnotí trend podobnosti za obdobie rokov 2005 až 2012 vo Veľkej Británii, ale len pre práce s podobnosťou z intervalov <50 %; 75 %) a <75 %; 100 %>. Porovnáva sa počet dokumentov v týchto intervaloch k celkovému počtu predložených dokumentov na kontrolu za uvedené obdobie po rokoch. Trend je jednoznačný: pokles. Určite je to povzbudzujúci trend, ale nedáva nám informáciu o tom, koľko študentov predložilo „čisté” práce, kde je všetko riadne odcitované, t. j. nevyskytujú sa tam prevzaté alebo parafrázované úseky textu bez uvedenia zdroja.

V tejto poslednej štatistike, ale aj v predchádzajúcich nie je žiadna zmienka o nulovom plagiátorstve, ktoré je tým najdôležitejším ukazovateľom merajúcim prístup študentov k tvorbe ich písomných prác. Prečo takéto štatistiky absentujú?

Existujú dva hlavné dôvody – obmedzenia softvéru a chýbajúca spätná väzba od vysokých škôl. Softvér na kontrolu originality vytvára pre kontrolovanú prácu protokol o kontrole originality – v prípade, že index podobnosti kontrolovanej práce je nulový, to ešte neznamená, že práca nie je plagiátom (súbor dokumentov na porovnanie nezahŕňa všetky dokumenty; môžeme povedať, že práca nie je plagiátom vzhľadom k súboru dokumentov na porovnanie). Jednou z ďalších príčin softvérových obmedzení môže byť zvýšenie indexu podobnosti, ktoré môže vzniknúť tým, že jeden alebo viacero dokumentov citovaných v práci autorom sa nevyskytujú v súbore dokumentov na porovnanie, a potom sa v protokole môžu nájsť podobnosti s inými dokumentmi, ktoré autor vôbec nepoužil v čase tvorby dokumentu. Preto softvér nemá „posledné slovo“ v záležitostiach plagiátorstva, ale človek.

Softvér na kontrolu originality je schopný produkovať štatistické údaje aj o nulovom plagiátorstve za predpokladu, že by ku každej jednej kontrolovanej práci získal aj spätnú väzbu od vysokej školy o tom, či kontrolovaná práca je alebo nie je plagiátom.

Zatiaľ som sa s takouto štatistikou nestretol. Možno v budúcnosti sa takéto štatistiky (za študijný odbor, za fakultu, za školu, za republiku) stanú štandardom.

Ilustračný príklad: Relatívny počet prác bez plagiátorstva

 

Spracoval: Július Kravjar, CVTI SR

Ilustračné foto: Wikimédia

Uverejnila: MI, NCP VaT pri CVTI SR

Zdroje:

Wikipedia

A Machine Learning Approach for Plagiarism Detection

Wikipedia

ORGANIZATION for ONLINE LEARNIG

STUDENT PLAGIARISM AND THE USE OF A PLAGIARISM DETECTION TOOL BY COMMUNITY COLLEGE FACULTY

Old and new challenges in automatic plagiarism detection

A national strategy for addressing student plagiarism

Systémy na odhaľovanie plagiátov

Absence of zero plagiarism?

 

CENTRUM VEDECKO-TECHNICKÝCH INFORMÁCIÍ SR Ministerstvo školstva, výskumu, vývoja a mládeže Slovenskej republiky