Suporte a idiomas

O SafeAssign usa algoritmos que tomam decisões sobre a originalidade do texto enviado. Os algoritmos consideram a frequência da palavra, a estrutura da frase e outras características linguísticas. A complexidade da tomada de decisão do SafeAssign varia por idioma assim como a quantidade de conteúdo que o Blackboard pesquisa para cada idioma.

O Blackboard divide a complexidade de processamento do idioma com base nessas ferramentas:

  • Pesquisar fonte de dados de originalidade no idioma.
    • Dados da Wikipédia
    • Dados de outro site
    • Dados de envios institucionais
    • Dados de envios globais
    • Dados de texto completo do ProQuest
  • Filtragem de palavra vazia (stop word): O SafeAssign remove as palavras vazias de uma frase antes de pesquisar por texto correspondente nas fontes de dados acima. Palavras vazias são palavras usadas com frequência, como "como a, o/a, e em".
  • Análise de idioma: o SafeAssign coloca todas as palavras em minúsculas e as divide em sua raiz. Por exemplo, "árvores" vira "árvore". O SafeAssign usa os analisadores de idioma para aumentar o número de correspondências que podem ter um significado semelhante ao texto original com base na raiz da palavra, mas o texto correspondente usa palavras diferentes.

Esta tabela divide as ferramentas usadas para cada idioma no processo de pesquisa do SafeAssign.

Ferramentas usadas para cada idioma
Idioma Banco de dados da instituição Banco de dados global Páginas da Wikipédia Outros sites no idioma Banco de dados ProQuest Filtragem de palavra vazia (stop word) Análise de idioma
Árabe (ar_SA) Sim Sim Sim Sim Sim Beta  
Chinês (zh_CN) Sim Sim Sim Sim Sim Beta  
Tcheco (cs_CZ) Sim Sim Sim Sim Sim    
Dinamarquês (da_DK) Sim Sim Sim Sim      
Holandês (nl_NL) Sim Sim Sim Sim Sim    
Inglês, Reino Unido (en_GB) Sim Sim Sim Sim Sim Sim Sim
Inglês, Estados Unidos (en_US) Sim Sim Sim Sim Sim Sim Sim
Finlandês (fi) Sim Sim Sim Sim   Beta  
Francês (fr_FR) Sim Sim Sim Sim Sim Beta  
Alemão (de_DE) Sim Sim Sim Sim Sim Beta  
Italiano (it_IT) Sim Sim Sim Sim Sim Beta  
Japonês (ja_JP) Sim Sim Sim Sim Sim Beta  
Coreano (ko_KO) Sim Sim Sim Sim      
Malaio (ms_MY) Sim Sim Sim Sim      
Norueguês (nn_NO) Sim Sim   Sim      
Polonês (pl_PL) Sim Sim Sim Sim Sim    
Português, brasileiro (pt_BR) Sim Sim Sim Sim Sim Beta  
Russo (ru_RU) Sim Sim Sim Sim Sim    
Espanhol (es_ES) Sim Sim Sim Sim Sim Sim Sim
Sueco (sv_SE) Sim Sim Sim Sim      
Tailandês (th_TH) Sim Sim Sim Sim      
Turco (tr_TR) Sim Sim Sim Sim Sim    
Galês (cy_GB) Sim Sim Sim Sim