SafeAssign использует алгоритмы, которые принимают решение о подлинности отправленного текста. Алгоритмы учитывают повторяемость слов, структуру предложений и другие лингвистические характеристики. Сложность принятия решений SafeAssign зависит от языка. Это же относится к объему содержимого, поиск которого выполняется Blackboard для каждого языка.

Сложность языковой обработки Blackboard определяется указанными ниже средствами.

  • Источник данных поиска для оценки подлинности работы на определенном языке:
    • данные Википедии;
    • данные других веб-сайтов;
    • данные учреждения об отправке;
    • глобальные данные об отправке;
    • Полные текстовые данные Proquest.
  • Фильтрация стоп-слов: прежде чем искать соответствующий текст в указанных выше источниках данных, SafeAssign удаляет из предложения стоп-слова. Стоп-слова — это часто используемые слова, например «в», «на», «для» и т. д.
  • Языковой анализ: SafeAssign делает все слова строчными и усекает их до их корня. Например, слово «Деревья» преобразуется в «дерево». SafeAssign использует анализаторы языка для увеличения количества совпадений по корню слова, которые могут иметь такое же значение, как в исходном тексте, в то время как в совпадающем тексте используются другие слова.

В таблице ниже приводится разбивка средств, используемых для каждого языка в поисковом процессе SafeAssign.

Средства, используемые для каждого языка
Язык База данных учреждения Глобальная база данных Страницы Википедии Другие веб-сайты на языке База данных Proquest Фильтрация стоп-слов Языковой анализ
Арабский (ar_SA) Да Да Да Да Да Бета-выпуск  
Китайский (zh_CN) Да Да Да Да Да Бета-выпуск  
Чешский (cs_CZ) Да Да Да Да Да    
Датский (da_DK) Да Да Да Да      
Голландский (nl_NL) Да Да Да Да Да    
Английский, Великобритания (en_GB) Да Да Да Да Да Да Да
Английский, США (en_US) Да Да Да Да Да Да Да
Финский (fi) Да Да Да Да   Бета-выпуск  
Французский (fr_FR) Да Да Да Да Да Бета-выпуск  
Немецкий (de_DE) Да Да Да Да Да Бета-выпуск  
Итальянский (it_IT) Да Да Да Да Да Бета-выпуск  
Японский (ja_JP) Да Да Да Да Да Бета-выпуск  
Корейский (ko_KO) Да Да Да Да      
Малайский (ms_MY) Да Да Да Да      
Норвежский (nn_NO) Да Да   Да      
Польский (pl_PL) Да Да Да Да Да    
Португальский, Бразилия (pt_BR) Да Да Да Да Да Бета-выпуск  
Русский (ru_RU) Да Да Да Да Да    
Испанский (es_ES) Да Да Да Да Да Да Да
Шведский (sv_SE) Да Да Да Да      
Тайский (th_TH) Да Да Да Да      
Турецкий (tr_TR) Да Да Да Да Да    
Валлийский (cy_GB) Да Да Да Да