Preskočiť na obsah Preskočiť na pätu (NCP VaT)
VEDA NA DOSAH – váš zdroj informácií o slovenskej vede

Výsledky analýzy efektívnosti nástrojov na podporu odhaľovania plagiátov

VEDA NA DOSAH

Ilustračné foto: Pixabay.com

Plagiátorstvo je hrozbou pre vzdelávací proces, pretože študenti môžu získať kredit za prácu niekoho iného pri absolvovaní predmetov, kurzov a semestrov bez toho, aby si zvýšili svoju vzdelanostnú úroveň. Asociácia ENAI sa preto rozhodla zmapovať kvalitu nástrojov na podporu odhaľovania plagiátov. 

Akademická integrita a plagiátorstvo 

Akademická integrita znamená dodržiavanie etických a profesionálnych princípov, štandardov, postupov a konzistentného systému hodnôt slúžiacich na podporu rozhodovania i na prijímanie opatrení v oblasti vzdelávania, výskumu a vedy.

Akékoľvek konanie alebo pokus o zásah, ktorý narúša akademickú integritu a môže viesť k nespravodlivej akademickej výhode alebo znevýhodneniu členov akademickej obce či širšej spoločnosti, je porušením akademickej integrity a považuje sa za akademické pochybenie (academic misconduct).

Plagiátorstvo je jedným z vážnych akademické pochybení, je porušením akademickej integrity. Definujeme ho ako prezentovanie práce alebo myšlienok prevzatých z iných zdrojov bez ich riadneho uvedenia.

Inak povedané, k plagiátorstvu dochádza vtedy, keď niekto použije slová, myšlienky alebo diela, ktoré možno pripísať inej identifikovateľnej osobe alebo zdroju bez uvedenia toho, odkiaľ boli získané v situácii, keď existuje legitímne očakávanie pôvodného autorstva s cieľom získať nejaký prospech, úžitok alebo zisk, ktorý nemusí byť peňažný.

Plagiátorstvo je hrozbou pre vzdelávací proces, pretože študenti môžu získať kredit za prácu niekoho iného pri absolvovaní predmetov, kurzov a semestrov bez toho, aby si zvýšili svoju vzdelanostnú úroveň. Podobne ako v prípade študentov aj pracovníci vo vede a výskume môžu byť odmeňovaní za prácu, ktorú nevykonali.

Plagiátorstvo môže mať vážne dôsledky, môže skresliť metaštúdie, ktoré vyvodzujú závery na základe počtu alebo percent príspevkov, ktoré potvrdzujú alebo vyvracajú určitý jav. Ak sú takéto príspevky ako podklady pre metaštúdiu plagiátom, potom závery metaštúdie môžu byť nesprávne a ak sú napríklad z medicínskeho prostredia, môžu ohrozovať zdravie človeka.

Plagiátorské škandály predstaviteľov politického a verejného života podkopávajú dôveru občanov v demokratické inštitúcie a tiež dôveru v akademickú obec. Je veľmi dôležité investovať úsilie do prevencie a odhaľovania plagiátorstva na inštitucionálnej a aj národnej úrovni.

Ilustračná foto: Pixabay.com

Plagiátorstvo kráča dejinami

Plagiátorstvo je fenomén kráčajúci časom. Už v starom Grécku a Ríme jednotlivci (Aristofanes, Isocrates, Cicero, Diodorus Sicílsky, Vitruvius, Ovídius, Plínius starší, Quintilianus, Galén,…) kritizovali praktiky využívania cudzích textov bez uvedenia ich zdroja. Podľa J. Baileyho využívanie kreativity iných a jej vydávanie za vlastnú, sprevádza ľudstvo od čias zrodu umenia a písaného slova.

Plagiátorstvo sa nevyhýba malým ani veľkým krajinám, chudobným ani bohatým. Páchajú ho študenti, ale aj špičky politického a verejného života. Aj Slovensko má svoje plagiátorské kauzy, stačí zadať do internetového vyhľadávača dve slová – kauza, plagiátorstvo – a máte ich pred sebou.

Pokiaľ ide o Európu, medzi najznámejšie plagiátorské kauzy, ktoré riešili dizertačné práce, patria kauzy okolo nemeckého ministra obrany K. T. zu Guttenberga, nemeckej ministerky školstva A. Schavanovej a maďarského prezidenta P. Schmitta. Pod ťarchou dôkazov odstúpili z vysokých postov a následne im boli odobraté tituly PhD. tými univerzitami, ktoré im ich pôvodne udelili. U nás v priebehu posledných desiatich rokov viacerí ministri školstva hovorili o odoberaní vysokoškolských titulov, ale legislatíva v tomto smere stále absentuje.

Plagiát v čase internetu

Penetrácia internetu a aj informačno-komunikačných technológií prispela k rastu plagiátorstva. Na druhej strane prispela aj ku skvalitneniu nástrojov podporujúcich odhaľovanie plagiátov. V minulosti, ale aj dnes je stále najlepšou hrádzou v boji proti plagiátom zodpovedná a kvalitná práca tandemu školiteľ – študent. Na školiteľovi leží hlavná zodpovednosť, je totiž odborníkom v predmetnej oblasti a veľmi dobre pozná aj príslušnú literatúru.

Dnes sa štandardne používajú nástroje na podporu odhaľovania plagiátov pomocou informačných a komunikačných technológií. CVTI SR prevádzkuje od roku 2010 systém SK ANTIPLAG. Tento systém predstavuje dvojicu úzko spolupracujúcich systémov, a to Centrálny register záverečných, rigoróznych a habilitačných prác (CRZP) a Systém na odhaľovanie plagiátov pre potreby slovenských akademických a výskumných inštitúcií (antiplagiátorský systém, APS, antiplag, systém na kontrolu originality).

Nástroje na podporu odhaľovania plagiátorstva kontrolujú originalitu dokumentov predložených na kontrolu tým, že ich porovnávajú s inými dokumentmi a nachádzajú podobnosti. Výstupom kontroly je celkové percento podobnosti dokumentu predloženého na kontrolu s inými dokumentmi, parciálne percentá podobnosti a zobrazenie pasáží podobných textov.

Tieto nástroje sú dobrým pomocníkom, slúžia na podporu pri procese rozhodovania vo veciach plagiátorstva. Nepotvrdzujú však, či je kontrolovaný dokument originálom alebo plagiátom, toto rozhodnutie je vo výhradnej kompetencii vysokej školy.

Ilustračná foto. Autor: Dollar Gill, Unsplash

Analýza efektívnosti nástrojov na podporu odhaľovania plagiátov

Asociácia European Network for Academic Integrity (ENAI), ktorej členom je aj Centrum vedecko-technických informácií SR (CVTI SR), si je vedomá faktu, že plagiátorstvo patrí medzi najčastejšie porušenia akademickej integrity. Rozhodla sa preto zmapovať kvalitu nástrojov na podporu odhaľovania plagiátov. Analýza prebehla prostredníctvom testovania, ktoré vykonali členovia pracovnej skupiny TeSToP (Testing of Support Tools for Plagiarism Detection / Testovanie podporných nástrojov na odhaľovanie plagiátorstva) asociácie ENAI.

Analýza pätnástich nástrojov je jednou z najdôkladnejších analýz v tejto oblasti. Pracoval na nej tím deviatich výskumných pracovníkov zo siedmich krajín v období od novembra 2018 do mája 2019.

Testovaných bolo 15 webových nástrojov na podporu odhaľovania plagiátov naprieč ôsmimi jazykmi (angličtina, čeština, lotyština, nemčina, slovenčina, španielčina, taliančina a turečtina). Podobná analýza, ale menšieho rozsahu (angličtina, nemčina, hebrejčina) bola publikovaná v roku 2013.

Prehľad testovaných systémov je uvedený v štúdii Testing of Support Tools for Plagiarism Detection, kde sa nachádza aj detailný popis metodiky testovania i hodnotenia a analýza výsledkov testovania.

Oslovených bolo 63 dodávateľov nástrojov na podporu odhaľovania plagiátov s otázkou, či chcú, aby sa ich systémy zúčastnili testovania. Zareagovali dvadsiati, ale do testovania sa tri systémy nedostali, lebo neprehľadávali internetové zdroje, jeden systém limitoval textový vstup veľmi nízkym počtom slov a jeden odstúpil sám. Na testovanie bolo teda k dispozícii pätnásť systémov.

Výsledok: systémy musia prejsť ešte dlhú cestu, aby sa priblížili k dokonalosti

Na testovanie efektívnosti nachádzania podobností boli pripravené súbory siedmich dokumentov v ôsmich jazykoch. Cieľom bolo otestovať rôzne systémy v tom, ako narábajú so širokou škálou textov z rôznych zdrojov.

Efektívnosť nachádzania podobností (t. j. úspešnosť systémov pri identifikovaní podobností) bola hodnotená stupnicou 0 až 5, pričom hodnota 5 znamenala, že boli detegované všetky (alebo takmer všetky) podobnosti. Systémy boli podľa efektívnosti klasifikované nasledovne:

  • užitočné systémy s počtom bodov z intervalu <3,75;5,0> (Do tejto kategórie sa nedostal žiadny systém.),

  • čiastočne užitočné systémy s počtom bodov z intervalu <2,5;3,75): Urkund, PlagAware, StrikePlagiarism, PlagScan, Turnitin a PlagiarismCheck,

  • okrajovo užitočné systémy s počtom bodov z intervalu <1,25;2,5): Akademia, Copyscape, Docol©c, PlagiarismCheck.org, Plagiarism Software, Unicheck, Viper,

  • nevhodné systémy s počtom bodov z intervalu <0;1,2): Dupli Checker, DPV, intihal.net.

Pokiaľ ide o použiteľnosť, stanovený bol súbor používateľských kritérií viažuci sa na jednoduchosť, účelnosť testovacieho procesu, zrozumiteľnosť výsledkov, a pod. Skúmalo sa, či nástroj tieto kritériá spĺňa alebo nie. Za každé kritérium, ktoré nástroj spĺňal, dostal jeden bod. Ak ho nespĺňal, dostal nulu. Systémy boli podľa použiteľnosti klasifikované nasledovne:

  • užitočné systémy s počtom bodov ≥ 35: PlagScan, Urkund, Unichíck, Turnitin a Docol©c,

  • čiastočne užitočné systémy s počtom bodov z intervalu <23;35): DPV, PlagAware, PlagiarismCheck.org, StrikePlagiarism.com, Viper,

  • okrajovo užitočné systémy s počtom bodov z intervalu <11;23): Akademia, Dupli Checker, Copyscape, intihal.net, Plagiarism Software,

  • nevhodné systémy s počtom bodov z intervalu <0;11): do tejto kategórie sa nedostal žiadny systém.

Podľa efektívnosti nachádzania podobností medzi najlepšie nástroje patria Urkund, PlagAware, StrikePlagiarism, PlagScan, Turnitin a PlagiarismCheck. Pokiaľ ide o použiteľnosť, medzi najlepšie systémy sa zaraďujú PlagScan, Urkund, Unichíck, Turnitin a Docol©c.

Ak sa na hodnotenie pozrieme z dvojrozmerného hľadiska (efektívnosť nachádzania podobností x použiteľnosť), najlepšími systémami sú systémy PlagScan, Turnitin a Urkund.

Hoci sú z hľadiska použiteľnosti užitočné, tak z hľadiska efektívnosti nachádzania podobností sú len čiastočne užitočné. Ani jeden systém nebol zaradený do kategórie užitočné z hľadiska efektívnosti nachádzania podobností, a to je dosť nelichotivé vysvedčenie pre tvorcov testovaných systémov.

Dvojrozmerné hodnotenie v grafoch

Pozície jednotlivých systémov v tomto dvojrozmernom hodnotení je znázornené v grafe, kde na osi X je hodnotenie efektívnosti nachádzania podobností a na osi Y je hodnotenie použiteľnosti.

V tabuľke nižšie je uvedené hodnotenie jednotlivých systémov podľa jazykových skupín. Ani jeden systém nedosiahol absolutórium 5 bodov.

Badateľný je rozdiel v najvyšších hodnotách medzi germánskymi (angličtina a nemčina) 3,5 bodu a románskymi jazykmi (taliančina a španielčina) 3,3 bodu oproti slovanským jazykom (čeština a slovenčina) 2,3 bodu. Slovanské jazyky všeobecne vykazujú nižšie hodnotenie. Súvisí to pravdepodobne s tým, že nástroje na podporu odhaľovania plagiátorstva boli najprv predstavené na trhoch, ktoré používali germánske a románske jazyky.

Odhaľovanie translačného, resp. prekladového plagiátorstva je stále v plienkach, najlepší nástroj v tomto smere dosiahol hodnotenie len na úrovni 1,1. Odhaľovanie parafrázovania s hodnotením 1,7 taktiež neoslnilo.

Väčšina systémov dobre nachádza podobnosti s Wikipédiou, pri iných zdrojoch boli medzi jednotlivými systémami veľké odlišnosti.

Poznámka k terminológii

Slovné spojenia systémy na odhaľovanie plagiátorstva, resp. systémy na detekciu plagiátov, resp. antiplagiátorské systémy, resp. systémy na kontrolu originality sú bežne používané u nás aj v zahraničí, ale plagiáty neodhaľujú. Tieto systémy identifikujú podobné pasáže textu kontrolovaného dokumentu s inými dokumentmi, sú len podporným nástrojom pre rozhodovanie vo veciach plagiátorstva. Ani jeden z takýchto systémov nehovorí o tom, či je kontrolovaná práca originálom alebo plagiátom. Je na človeku, aby aj za pomoci tohto nástroja určil, či ide o plagiátorstvo.

Július Kravjar, CVTI SR

Zdroje:

European Network for Academic Integrity

Foltýnek, T. et al. Testing of Support Tools for Plagiarism Detection, 2020

Tauginienė, L. et al. Glossary for Academic Integrity. ENAI Report 3G [online]: revised version, 2018

Zprávy z MUNI, https://www.em.muni.cz/udalosti/10816-masarykova-univerzita-resi-jak-zdokonalit-boj-s-plagiaty, 2019

https://en.wikipedia.org

Bailey, J. The World’s First “Plagiarism” Case, 2011

CENTRUM VEDECKO-TECHNICKÝCH INFORMÁCIÍ SR Ministerstvo školstva, výskumu, vývoja a mládeže Slovenskej republiky