SafeAssignはアルゴリズムを使用して、提出されたテキストのオリジナリティを判断しています。このアルゴリズムは、単語の頻度、文章の構造、その他の言語特性を検討します。SafeAssignの決定処理の複雑さは、言語により異なり、Blackboardが各言語について検索するコンテンツの量の影響も受けます。

Blackboardは言語処理の複雑さを、以下のツールに基づいて軽減します。

  • その言語でのオリジナリティをデータソースで検索します。
    • Wikipediaデータ
    • その他のWebサイトデータ
    • 教育機関の提出物データ
    • グローバルな提出物データ
    • Proquest全文データ
  • ストップワードのフィルタリング :SafeAssignは上記のデータソースの一致テキストを検索する前に、文章からストップワードを取り除きます。ストップワードとは、"as a、it、the、on"など、一般的に使用されている単語です。
  • 言語分析 :SafeAssignは、すべての単語を小文字にして、語根まで分解します。たとえば、"Trees"は"tree"になります。SafeAssignは言語アナライザを使用して、オリジナルのテキストと同様の意味を持つ可能性がある一致の数を増やします。これは単語の語根をベースに、一致するテキストでの別の単語の使用を分析します。

この表は、SafeAssignの検索プロセスで各言語に使用されるツールを示しています。

各言語に使用されるツール
言語教育機関のデータベースグローバルデータベースWikipediaページ言語のその他のWebサイトProquestデータベースストップワードのフィルタリング言語分析
アラビア語 (ar_SA)YesYesYesYesYesベータ 
中国語 (zh_CN)YesYesYesYesYesベータ 
チェコ語 (cs_CZ)YesYesYesYesYes  
デンマーク語 (da_DK)YesYesYesYes   
オランダ語 (nl_NL)YesYesYesYesYes  
英語、英国 (en_GB)YesYesYesYesYesYesYes
英語、米国 (en_US)YesYesYesYesYesYesYes
フィンランド語 (fi)YesYesYesYes ベータ 
フランス語 (fr_FR)YesYesYesYesYesベータ 
ドイツ語 (de_DE)YesYesYesYesYesベータ 
イタリア語 (it_IT)YesYesYesYesYesベータ 
日本語 (ja_JP)YesYesYesYesYesベータ 
韓国語 (ko_KO)YesYesYesYes   
マレー語 (ms_MY)YesYesYesYes   
ノルウェー語 (nn_NO)YesYes Yes   
ポーランド語 (pl_PL)YesYesYesYesYes  
ブラジルポルトガル語 (pt_BR)YesYesYesYesYesベータ 
ロシア語 (ru_RU)YesYesYesYesYes  
スペイン語 (es_ES)YesYesYesYesYesYesYes
スウェーデン語 (sv_SE)YesYesYesYes   
タイ語 (th_TH)YesYesYesYes   
トルコ語 (tr_TR)YesYesYesYesYes  
ウェールズ語 (cy_GB)YesYesYesYes