SafeAssign utilise des algorithmes qui évaluent l'originalité du texte envoyé. Les algorithmes considèrent la fréquence des mots, la structure des phrases et d'autres caractéristiques linguistiques. La complexité de la prise de décision de SafeAssign varie en fonction de la langue, ainsi que la quantité de contenu Blackboard analysé pour chaque langue.

Blackboard se base sur les outils suivants pour faciliter le traitement des langues :

  • Sources de données pour l'analyse d'originalité d'une langue.
    • Données Wikipédia
    • Autres données de site Web
    • Données de travaux remis de l'établissement
    • Données de travaux remis globalement
    • Données de texte complet ProQuest
  • Filtrage des mots vides : SafeAssign supprime les mots vides d'une phrase avant de rechercher des correspondances de texte dans les sources de données ci-dessus. Les mots vides sont des mots couramment utilisés, tels que « un(e) », « il/elle », « et ».
  • Analyse linguistique : SafeAssign met tous les mots en minuscules et les réduit à leur racine. Par exemple, « Arbres » devient « arbre ». SafeAssign utilise des outils d'analyse linguistique se basant sur la racine des mots pour détecter plus de correspondances ayant une signification similaire à celle du texte d'origine, mais utilisant des mots différents.

Ce tableau répertorie les outils utilisés pour chaque langue dans le processus de recherche de SafeAssign.

Outils utilisés pour chaque langue
LangueBase de données d'établissementBase de données globalePages WikipédiaAutres sites Web dans cette langueBase de données ProQuestFiltrage des mots videsAnalyse linguistique
Arabe (ar_SA)YesYesYesYesYesBêta 
Chinois (zh_CN)YesYesYesYesYesBêta 
Tchèque (cs_CZ)YesYesYesYesYes  
Danois (da_DK)YesYesYesYes   
Néerlandais (nl_NL)YesYesYesYesYes  
Anglais, Royaume-Uni (en_GB)YesYesYesYesYesYesYes
Anglais, États-Unis (en_US)YesYesYesYesYesYesYes
Finnois (FI)YesYesYesYes Bêta 
Français (fr_FR)YesYesYesYesYesBêta 
Allemand (de_DE)YesYesYesYesYesBêta 
Italien (it_IT)YesYesYesYesYesBêta 
Japonais (ja_JP)YesYesYesYesYesBêta 
Coréen (ko_KO)YesYesYesYes   
Malais (ms_MY)YesYesYesYes   
Norvégien (nb_NO)YesYes Yes   
Polonais (pl_PL)YesYesYesYesYes  
Portugais brésilien (pt_BR)YesYesYesYesYesBêta 
Russe (ru_RU)YesYesYesYesYes  
Espagnol (es_ES)YesYesYesYesYesYesYes
Suédois (sv_SE)YesYesYesYes   
Thaï (th_TH)YesYesYesYes   
Turc (tr_TR)YesYesYesYesYes  
Gallois (cy_GB)YesYesYesYes