언어 지원

SafeAssign에서는 제출된 텍스트의 독창성에 대한 결정을 내리는 알고리즘을 사용합니다. 해당 알고리즘에서는 단어 사용 빈도, 문장 구조 및 기타 언어적 특성을 고려합니다. SafeAssign의 결정 시 복잡성은 Blackboard에서 각 언어를 검색하는 콘텐츠의 양과 마찬가지로 언어에 따라 다릅니다.

Blackboard에서는 다음과 같은 도구를 기반으로 하여 언어 처리 복잡성을 분석합니다.

  • 데이터 소스에서 언어의 독창성을 검색합니다.
    • 위키백과 데이터
    • 기타 웹 사이트 데이터
    • 교육기관 제출 데이터
    • 글로벌 제출 데이터
    • Proquest 전체 텍스트 데이터
  • 불용어 필터링: SafeAssign에서는 위의 데이터 소스에서 일치하는 텍스트를 검색하기 전에 문장에서 불용어를 제거합니다. 불용어는 일반적으로 사용되는 단어입니다(예: a, it, the, on).
  • 언어 분석: SafeAssign에서는 모든 단어를 소문자로 만들고 어원으로 분해합니다. 예를 들어 'Trees'는 'tree'가 됩니다. SafeAssign에서는 언어 분석기를 사용하여 단어의 어원을 기반으로 원본 텍스트와 유사한 의미를 지닐 수 있는 일치 항목의 수를 늘리지만, 일치하는 텍스트에서는 다른 단어를 사용합니다.

이 표에서는 SafeAssign의 검색 프로세스에서 각 언어에 사용된 도구를 분석합니다.

각 언어에 사용된 도구
언어교육기관 데이터베이스글로벌 데이터베이스위키백과 페이지언어의 기타 웹 사이트Proquest 데이터베이스불용어 필터링언어 분석
아랍어(ar_SA)YesYesYesYesYes베타 
중국어(zh_CN)YesYesYesYesYes베타 
체코어(cs_CZ)YesYesYesYesYes  
덴마크어(da_DK)YesYesYesYes   
네덜란드어(nl_NL)YesYesYesYesYes  
영국 영어(en_GB)YesYesYesYesYesYesYes
영어(미국)(en_US)YesYesYesYesYesYesYes
핀란드어(fi)YesYesYesYes 베타 
프랑스어(fr_FR)YesYesYesYesYes베타 
독일어(de_DE)YesYesYesYesYes베타 
이탈리아어(it_IT)YesYesYesYesYes베타 
일본어(ja_JP)YesYesYesYesYes베타 
한국어(ko_KO)YesYesYesYes   
말레이어(ms_MY)YesYesYesYes   
노르웨이어(nn_NO)YesYes Yes   
폴란드어(pl_PL)YesYesYesYesYes  
포르투갈어(브라질)(pt_BR)YesYesYesYesYes베타 
러시아어(ru_RU)YesYesYesYesYes  
스페인어(es_ES)YesYesYesYesYesYesYes
스웨덴어(sv_SE)YesYesYesYes   
태국어(th_TH)YesYesYesYes   
터키어(tr_TR)YesYesYesYesYes  
웨일스어(cy_GB)YesYesYesYes