Поддержка языков
SafeAssign использует алгоритмы, которые принимают решение о подлинности отправленного текста. Алгоритмы учитывают повторяемость слов, структуру предложений и другие лингвистические характеристики. Сложность принятия решений и поддержка SafeAssign зависит от языка. Это же относится к объему содержимого, поиск которого выполняется Blackboard для каждого языка.
Поддержка SafeAssign японского языка ограничена.
Сложность языковой обработки Blackboard определяется указанными ниже средствами.
- Источник данных поиска для оценки подлинности работы на определенном языке:
- данные Википедии;
- данные других веб-сайтов;
- данные учреждения об отправке;
- глобальные данные об отправке;
- Полные текстовые данные Proquest.
- Фильтрация стоп-слов. Прежде чем искать соответствующий текст в указанных выше источниках данных, SafeAssign удаляет из предложения стоп-слова. Стоп-слова — это часто используемые слова, например «в», «на», «для» и т. д.
- Языковой анализ: SafeAssign делает все слова строчными и усекает их до их корня. Например, слово «Деревья» преобразуется в «дерево». SafeAssign использует анализаторы языка для увеличения количества совпадений по корню слова, которые могут иметь такое же значение, как в исходном тексте, в то время как в совпадающем тексте используются другие слова.
В таблице ниже приводится разбивка средств, используемых для каждого языка в поисковом процессе SafeAssign.
Для достижения наилучших результатов рекомендуем по возможности использовать SafeAssign для английского языка. Использование для других языков может давать менее точные результаты из-за меньшего объема сравнительных данных или сложности языка.