Taalondersteuning

SafeAssign maakt gebruik van algoritmen die beslissingen nemen over de originaliteit van de ingeleverde tekst. De algoritmen analyseren woordfrequentie, de structuur van zinnen en andere taalkundige kenmerken. De complexiteit van het besluitvormingsproces van SafeAssign verschilt per taal, net als de hoeveelheid inhoud die Blackboard doorzoekt voor elke taal.

Blackboard analyseert de complexiteit van taalverwerking op basis van deze tools:

  • Zoeken in gegevensbron naar originaliteit in de taal.
    • Wikipedia-gegevens
    • Gegevens van andere websites
    • Ingezonden gegevens van instelling
    • Gegevens in de algemene naslagdatabase
    • Volledige tekstgegevens van ProQuest
  • Filteren van stopwoorden: SafeAssign verwijdert stopwoorden uit een zin voordat er wordt gezocht naar overeenkomende tekst in de bovenstaande gegevensbronnen. Stopwoorden in deze context zijn veelgebruikte woorden zoals 'een', 'het', 'de' en 'op'.
  • Taalanalyse: SafeAssign zet alle woorden om in kleine letters en brengt ze terug tot de hoofdvorm. 'Lepels' wordt bijvoorbeeld 'lepel'. SafeAssign maakt gebruik van taalanalysefuncties om het aantal overeenkomsten te vergroten dat een vergelijkbare betekenis kan hebben als de oorspronkelijke tekst op basis van de hoofdvorm van het woord, maar waarbij de overeenkomende tekst andere woorden gebruikt.

In deze tabel zie je een overzicht van de tools die voor elke taal worden gebruikt in het zoekproces van SafeAssign.

Tools die voor elke taal worden gebruikt
Taal Instellingsdatabase Algemene database Wikipedia-pagina's Andere websites in taal ProQuest-database Filteren van stopwoorden Taalanalyse
Arabisch (ar_SA) Ja Ja Ja Ja Ja Bèta  
Chinees (zh_CN) Ja Ja Ja Ja Ja Bèta  
Tsjechisch (cs_CZ) Ja Ja Ja Ja Ja    
Deens (da_DK) Ja Ja Ja Ja      
Nederlands (nl_NL) Ja Ja Ja Ja Ja    
Engels, Verenigd Koninkrijk (en_GB) Ja Ja Ja Ja Ja Ja Ja
Engels, Verenigde Staten (en_US) Ja Ja Ja Ja Ja Ja Ja
Fins (fi) Ja Ja Ja Ja   Bèta  
Frans (fr_FR) Ja Ja Ja Ja Ja Bèta  
Duits (de_DE) Ja Ja Ja Ja Ja Bèta  
Italiaans (it_IT) Ja Ja Ja Ja Ja Bèta  
Japans (ja_JP) Ja Ja Ja Ja Ja Bèta  
Koreaans (ko_KO) Ja Ja Ja Ja      
Maleis (ms_MY) Ja Ja Ja Ja      
Noors (nn_NO) Ja Ja   Ja      
Pools (pl_PL) Ja Ja Ja Ja Ja    
Portugees, Braziliaans (pt_BR) Ja Ja Ja Ja Ja Bèta  
Russisch (ru_RU) Ja Ja Ja Ja Ja    
Spaans (es_ES) Ja Ja Ja Ja Ja Ja Ja
Zweeds (sv_SE) Ja Ja Ja Ja      
Thais (th_TH) Ja Ja Ja Ja      
Turks (tr_TR) Ja Ja Ja Ja Ja    
Welsh (cy_GB) Ja Ja Ja Ja