Suporte a idiomas

O SafeAssign usa algoritmos que tomam decisões sobre a originalidade do texto enviado. Os algoritmos consideram a frequência da palavra, a estrutura da frase e outras características linguísticas. A complexidade da tomada de decisão do SafeAssign varia por idioma assim como a quantidade de conteúdo que o Blackboard pesquisa para cada idioma.

O Blackboard divide a complexidade de processamento do idioma com base nessas ferramentas:

  • Pesquisar fonte de dados de originalidade no idioma.
    • Dados da Wikipédia
    • Dados de outro site
    • Dados de envios institucionais
    • Dados de envios globais
    • Dados de texto completo do ProQuest
  • Filtragem de palavra vazia (stop word): O SafeAssign remove as palavras vazias de uma frase antes de pesquisar texto o correspondente nas fontes de dados acima. Palavras vazias são palavras usadas com frequência, como "como a, o/a, e em".
  • Análise de idioma: o SafeAssign coloca todas as palavras em minúsculas e as divide em sua raiz. Por exemplo, "árvores" vira "árvore". O SafeAssign usa os analisadores de idioma para aumentar o número de correspondências que podem ter um significado semelhante ao texto original com base na raiz da palavra, mas o texto correspondente usa palavras diferentes.

Esta tabela divide as ferramentas usadas para cada idioma no processo de pesquisa do SafeAssign.

Ferramentas usadas para cada idioma
IdiomaBanco de dados da instituiçãoBanco de dados globalPáginas da WikipédiaOutros sites no idiomaBanco de dados ProQuestFiltragem de palavra vazia (stop word)Análise de idioma
Árabe (ar_SA)YesYesYesYesYesBeta 
Chinês (zh_CN)YesYesYesYesYesBeta 
Tcheco (cs_CZ)YesYesYesYesYes  
Dinamarquês (da_DK)YesYesYesYes   
Holandês (nl_NL)YesYesYesYesYes  
Inglês, Reino Unido (en_GB)YesYesYesYesYesYesYes
Inglês, Estados Unidos (en_US)YesYesYesYesYesYesYes
Finlandês (fi)YesYesYesYes Beta 
Francês (fr_FR)YesYesYesYesYesBeta 
Alemão (de_DE)YesYesYesYesYesBeta 
Italiano (it_IT)YesYesYesYesYesBeta 
Japonês (ja_JP)YesYesYesYesYesBeta 
Coreano (ko_KO)YesYesYesYes   
Malaio (ms_MY)YesYesYesYes   
Norueguês (nn_NO)YesYes Yes   
Polonês (pl_PL)YesYesYesYesYes  
Português, brasileiro (pt_BR)YesYesYesYesYesBeta 
Russo (ru_RU)YesYesYesYesYes  
Espanhol (es_ES)YesYesYesYesYesYesYes
Sueco (sv_SE)YesYesYesYes   
Tailandês (th_TH)YesYesYesYes   
Turco (tr_TR)YesYesYesYesYes  
Galês (cy_GB)YesYesYesYes