Idiomes compatibles

SafeAssign utilitza algoritmes que prenen decisions sobre l’originalitat del text tramès. Els algoritmes consideren la freqüència de les paraules, l'estructura de les oracions i altres característiques lingüístiques. La complexitat de la presa de decisions de SafeAssign varia segons l'idioma, com passa també amb la quantitat de contingut que cerca Blackboard per a cada idioma.

Blackboard trenca la complexitat del processament de la llengua basant-se en aquestes eines:

  • Cerca a la font de les dades per conèixer l'originalitat en el seu idioma.
    • Dades de la Viquipèdia
    • Altres dades de llocs web
    • Dades de trameses institucionals
    • Dades de trameses globals
    • Dades de text complet de Proquest
  • Filtratge de paraules buides: SafeAssign elimina les paraules buides d'una frase abans de cercar text coincident a les fonts de dades anteriors. Les paraules buides són paraules freqüents, com ara "com a, això, el" i "a".
  • Anàlisi lingüística: SafeAssign passa totes les paraules a minúscules i en separa l'arrel. Per exemple, "arbres" passa a ser "arbre". SafeAssign utilitza analitzadors lingüístics per incrementar el nombre de coincidències que poden tenir significat similar al text original per l'arrel de la paraula, encara que el text coincident utilitzi paraules diferents.

En aquesta taula es mostren les eines emprades per a cada idioma al procés de cerca de SafeAssign.

Eines emprades per a cada idioma
IdiomaBase de dades institucionalBase de dades globalPàgines de la ViquipèdiaAltres llocs web en l'idiomaBase de dades de ProquestFiltratge de paraules buidesAnàlisi lingüística
Àrab (ar_SA)YesYesYesYesYesBeta 
Xinès (zh_CN)YesYesYesYesYesBeta 
Txec (cs_CZ)YesYesYesYesYes  
Danès (da_DK)YesYesYesYes   
Neerlandès (nl_NL)YesYesYesYesYes  
Anglès, Regne Unit (en_GB)YesYesYesYesYesYesYes
Anglès, Estats Units (en_US)YesYesYesYesYesYesYes
Finlandès (fi)YesYesYesYes Beta 
Francès (fr_FR)YesYesYesYesYesBeta 
Alemany (de_DE)YesYesYesYesYesBeta 
Italià (it_IT)YesYesYesYesYesBeta 
Japonès (ja_JP)YesYesYesYesYesBeta 
Coreà (ko_KO)YesYesYesYes   
Malai (ms_MY)YesYesYesYes   
Noruec (nn_NO)YesYes Yes   
Polonès (pl_PL)YesYesYesYesYes  
Portuguès, Brasil (pt_BR)YesYesYesYesYesBeta 
Rus (ru_RU)YesYesYesYesYes  
Espanyol (es_ES)YesYesYesYesYesYesYes
Suec (sv_SE)YesYesYesYes   
Tai (th_TH)YesYesYesYes   
Turc (tr_TR)YesYesYesYesYes  
Gal·lès (cy_GB)YesYesYesYes