언어 지원

SafeAssign에서는 제출된 텍스트의 독창성에 대한 결정을 내리는 알고리즘을 사용합니다. 해당 알고리즘에서는 단어 사용 빈도, 문장 구조 및 기타 언어적 특성을 고려합니다. SafeAssign의 결정 시 복잡성은 Blackboard에서 각 언어를 검색하는 콘텐츠의 양과 마찬가지로 언어에 따라 다릅니다.

Blackboard에서는 다음과 같은 도구를 기반으로 하여 언어 처리 복잡성을 분석합니다.

  • 데이터 소스에서 언어의 독창성을 검색합니다.
    • 위키백과 데이터
    • 기타 웹 사이트 데이터
    • 교육기관 제출 데이터
    • 글로벌 제출 데이터
    • Proquest 전체 텍스트 데이터
  • 불용어 필터링: SafeAssign에서는 위의 데이터 소스에서 일치하는 텍스트를 검색하기 전에 문장에서 불용어를 제거합니다. 불용어는 일반적으로 사용되는 단어입니다(예: a, it, the, on).
  • 언어 분석: SafeAssign에서는 모든 단어를 소문자로 만들고 어원으로 분해합니다. 예를 들어 'Trees'는 'tree'가 됩니다. SafeAssign에서는 언어 분석기를 사용하여 단어의 어원을 기반으로 원본 텍스트와 유사한 의미를 지닐 수 있는 일치 항목의 수를 늘리지만, 일치하는 텍스트에서는 다른 단어를 사용합니다.

이 표에서는 SafeAssign의 검색 프로세스에서 각 언어에 사용된 도구를 분석합니다.

각 언어에 사용된 도구
언어 교육기관 데이터베이스 글로벌 데이터베이스 위키백과 페이지 언어의 기타 웹 사이트 Proquest 데이터베이스 불용어 필터링 언어 분석
아랍어(ar_SA) 예 예 예 예 예 베타  
중국어(zh_CN) 예 예 예 예 예 베타  
체코어(cs_CZ) 예 예 예 예 예    
덴마크어(da_DK) 예 예 예 예      
네덜란드어(nl_NL) 예 예 예 예 예    
영어(영국)(en_GB) 예 예 예 예 예 예 예
영어(미국)(en_US) 예 예 예 예 예 예 예
핀란드어(fi) 예 예 예 예   베타  
프랑스어(fr_FR) 예 예 예 예 예 베타  
독일어(de_DE) 예 예 예 예 예 베타  
이탈리아어(it_IT) 예 예 예 예 예 베타  
일본어(ja_JP) 예 예 예 예 예 베타  
한국어(ko_KO) 예 예 예 예      
말레이어(ms_MY) 예 예 예 예      
노르웨이어(nn_NO) 예 예   예      
폴란드어(pl_PL) 예 예 예 예 예    
포르투갈어(브라질)(pt_BR) 예 예 예 예 예 베타  
러시아어(ru_RU) 예 예 예 예 예    
스페인어(es_ES) 예 예 예 예 예 예 예
스웨덴어(sv_SE) 예 예 예 예      
태국어(th_TH) 예 예 예 예      
터키어(tr_TR) 예 예 예 예 예    
웨일스어(cy_GB) 예 예 예 예