Plagiátorstvo je súputníkom celej ľudskej histórie. Od úsvitu písaného slova si autori „vypožičiavali“ texty, ich časti, znaky a obrázky od iných, viac či menej ich menili, a potom ich považovali za svoje výtvory. Datuje sa to od Homérovej Odysey a Virgíliovej Eneidy až po diela Williama Shakespeara. Ba ešte skôr. Bola to bežná prax. Autorské práva sa dostali do legislatívy až v 18. storočí – 1710 v Anglicku a 1790 v USA.
Odhaľovanie plagiátorstva pomocou informačno-komunikačných technológií má vo svete už pomerne dlhú tradíciu – od sedemdesiatych rokov minulého storočia. Najprv sa pracovalo na odhaľovaní plagiátov v zdrojových kódoch programov, potom sa pristúpilo aj k detekcii plagiátov v textových dokumentoch. V roku 1997 sa na trhu predstavil komerčný produkt TurnItIn slúžiaci na detekciu plagiátov od spoločnosti iParadigms (USA). Bol úspešný, v ďalšom roku už dosiahol medzinárodné uznanie. Potom nasledovali produkty od iných spoločností, ako napríklad Urkund 1999, Plagiarismsearch 2008, PlagScan 2008, Grammarly 2009, SK ANTIPLAG 2010, …
Školy si zabezpečujú službu kontroly originality individuálne – to je najbežnejší model vo svete. Tento model je s vysokou pravdepodobnosťou drahší ako model, pri ktorom sa kontrola originality zabezpečuje centrálne pre všetky školy v krajine (prípad Slovenska, v tomto roku bude podobný model zavedený do praxe v Poľsku).
Systémy pre odhaľovanie plagiátov (na kontrolu originality) vyhľadávajú podobnosti v kontrolovanej práci s inými dokumentmi. Výsledkom býva protokol o kontrole originality, ktorý zvyčajne obsahuje celkový index podobnosti a individuálne podobnosti s porovnávanými dokumentmi.
Na stránke ORGANIZATION for ONLINE LEARNIG sú v časti Plagiarism Statistics uvedené rôzne kvantitatívne štatistické ukazovatele vypovedajúce o plagiátorstve. Zaujímavá štatistika je v príspevku A national strategy for addressing student plagiarism, kde sa hodnotí trend podobnosti za obdobie rokov 2005 až 2012 vo Veľkej Británii, ale len pre práce s podobnosťou z intervalov <50 %; 75 %) a <75 %; 100 %>. Porovnáva sa počet dokumentov v týchto intervaloch k celkovému počtu predložených dokumentov na kontrolu za uvedené obdobie po rokoch. Trend je jednoznačný: pokles. Určite je to povzbudzujúci trend, ale nedáva nám informáciu o tom, koľko študentov predložilo „čisté” práce, kde je všetko riadne odcitované, t. j. nevyskytujú sa tam prevzaté alebo parafrázované úseky textu bez uvedenia zdroja.
V tejto poslednej štatistike, ale aj v predchádzajúcich nie je žiadna zmienka o nulovom plagiátorstve, ktoré je tým najdôležitejším ukazovateľom merajúcim prístup študentov k tvorbe ich písomných prác. Prečo takéto štatistiky absentujú?
Existujú dva hlavné dôvody – obmedzenia softvéru a chýbajúca spätná väzba od vysokých škôl. Softvér na kontrolu originality vytvára pre kontrolovanú prácu protokol o kontrole originality – v prípade, že index podobnosti kontrolovanej práce je nulový, to ešte neznamená, že práca nie je plagiátom (súbor dokumentov na porovnanie nezahŕňa všetky dokumenty; môžeme povedať, že práca nie je plagiátom vzhľadom k súboru dokumentov na porovnanie). Jednou z ďalších príčin softvérových obmedzení môže byť zvýšenie indexu podobnosti, ktoré môže vzniknúť tým, že jeden alebo viacero dokumentov citovaných v práci autorom sa nevyskytujú v súbore dokumentov na porovnanie, a potom sa v protokole môžu nájsť podobnosti s inými dokumentmi, ktoré autor vôbec nepoužil v čase tvorby dokumentu. Preto softvér nemá „posledné slovo“ v záležitostiach plagiátorstva, ale človek.
Softvér na kontrolu originality je schopný produkovať štatistické údaje aj o nulovom plagiátorstve za predpokladu, že by ku každej jednej kontrolovanej práci získal aj spätnú väzbu od vysokej školy o tom, či kontrolovaná práca je alebo nie je plagiátom.
Zatiaľ som sa s takouto štatistikou nestretol. Možno v budúcnosti sa takéto štatistiky (za študijný odbor, za fakultu, za školu, za republiku) stanú štandardom.
Spracoval: Július Kravjar, CVTI SR
Ilustračné foto: Wikimédia
Uverejnila: MI, NCP VaT pri CVTI SR
Zdroje:
A Machine Learning Approach for Plagiarism Detection
ORGANIZATION for ONLINE LEARNIG
STUDENT PLAGIARISM AND THE USE OF A PLAGIARISM DETECTION TOOL BY COMMUNITY COLLEGE FACULTY
Old and new challenges in automatic plagiarism detection
A national strategy for addressing student plagiarism
Systémy na odhaľovanie plagiátov