Språkstøtte

SafeAssign bruker algoritmer som tar avgjørelser om originaliteten for innsendt tekst. Algoritmene bør vurdere ordfrekvens, setningsstruktur og andre språkegenskaper. Avgjørelsen i SafeAssign-en varierer avhengig av språk, og mengden innhold Blackboard søker etter hvert språk.

Blackboard bryter ned kompleksiteten på språkprosessen basert på disse verktøyene:

  • Søk i datakilden etter originalt innhold på språket.
    • Wikipedia-data
    • Andre nettsteddata
    • Institusjonens innsendingsdata
    • Globale innsendingsdata
    • ProQuest full tekst data
  • Stopp ordfiltrering: SafeAssign fjerner stoppord fra en setning før det søkes etter samsvarende tekst i data-kildene ovenfor. Stoppord er ofte brukte ord, for eksempel «som en, den/det, og på».
  • Språkanalyse: SafeAssign gjør om alle ord til små bokstaver og bryter dem ned til roten. «Trær» blir for eksempel «tre». SafeAssign bruker språkanalyse for å øke antallet treff som kan ha lignende betydning som den opprinnelige teksten basert på roten av ordet, men den samsvarende teksten bruker andre ord.

Denne tabellen er en del av verktøyene som brukes for alle språk i søkeprosessen for SafeAssign.

Verktøy som brukes for hvert språk
SpråkInstitusjondatabaseGlobal databaseWikipedia-siderAndre nettsteder på språkProQuest-databaseStoppord-filtreringSpråkanalyse
Arabisk (ar_SA)YesYesYesYesYesBeta 
Kinesisk (zh_CN)YesYesYesYesYesBeta 
Tsjekkisk (cs_CZ)YesYesYesYesYes  
Dansk (da_DK)YesYesYesYes   
Nederlandsk (nl_NL)YesYesYesYesYes  
Engelsk, Storbritannia (en_GB)YesYesYesYesYesYesYes
Engelsk, USA (en_US)YesYesYesYesYesYesYes
Finsk (Fi)YesYesYesYes Beta 
Fransk (fr_FR)YesYesYesYesYesBeta 
Tysk (de_DE)YesYesYesYesYesBeta 
Italiensk (it_IT)YesYesYesYesYesBeta 
Japansk (ja_JP)YesYesYesYesYesBeta 
Koreansk (ko_KO)YesYesYesYes   
Malayisk (ms_MY)YesYesYesYes   
Norsk (nn_NO)YesYes Yes   
Polsk (pl_PL)YesYesYesYesYes  
Portugisisk, brasiliansk (pt_BR)YesYesYesYesYesBeta 
Russisk (ru_RU)YesYesYesYesYes  
Spansk (es_ES)YesYesYesYesYesYesYes
Svensk (sv_SE)YesYesYesYes   
Thai (th_TH)YesYesYesYes   
Tyrkisk (tr_TR)YesYesYesYesYes  
Walisisk (cy_GB)YesYesYesYes