Cefnogaeth Iaith
Mae SafeAssign yn defnyddio algorithmau sy’n gwneud penderfyniadau am wreiddioldeb y testun a gyflwynir. Mae’r algorithmau yn ystyried amlder geiriau, strwythur brawddegau, a nodweddion ieithyddol eraill. Mae cymhlethdod gwneud penderfyniadau SafeAssign yn amrywio fesul iaith fel y mae’r nifer o gynnwys mae Blackboard yn chwilio amdano ar gyfer pob iaith.
Mae Blackboard yn torri cymhlethdod prosesu ieithoedd i lawr ar sail yr offer hyn:
- Chwilio ffynhonnell y data am wreiddioldeb yn yr iaith.
- Data Wicipedia
- Data gwefannau eraill
- Data cyflwyniadau'r sefydliad
- Data cyflwyniadau cyffredinol
- Data testun cyfan Proquest
- Hidlo geiriau stopio: Mae SafeAssign yn tynnu geiriau stopio o frawddeg cyn iddo chwilio am destun sy’n cyfateb yn y ffynonellau data uchod. Mae geiriau stopio yn eiriau a ddefnyddir yn aml, megis “fel, (f)e, (f)o, hi, y(r),” ac “ar”.
- Dadansoddiad iaith: Mae SafeAssign yn newid pob geiriau i lythrennau bach ac yn eu torri i lawr at eu bonion. Er enghraifft, daw “gwersi” yn “gwers”. Mae SafeAssign yn defnyddio dadansoddwyr iaith i gynyddu'r nifer o gyfatebiadau a allai gael ystyr sy’n debyg i'r testun gwreiddiol ar sail bôn y gair, ond mae’r testun sy’n cyfateb yn defnyddio geiriau eraill.
Mae’r tabl hwn yn torri’r offer a ddefnyddir ar gyfer pob iaith ym mhroses chwilio SafeAssign i lawr.
Iaith | Cronfa ddata'r sefydliad | Cronfa ddata gyffredinol | Tudalennau Wicipedia | Gwefannau eraill yn yr iaith | Cronfa ddata Proquest | Hidlo geiriau stopio | Dadansoddiad iaith |
---|---|---|---|---|---|---|---|
Arabeg (ar_SA) | ![]() |
![]() |
![]() |
![]() |
![]() |
Beta | |
Tsieinëeg (zh_CN) | ![]() |
![]() |
![]() |
![]() |
![]() |
Beta | |
Tsiec (cs_CZ) | ![]() |
![]() |
![]() |
![]() |
![]() |
||
Daneg (da_DK) | ![]() |
![]() |
![]() |
![]() |
|||
Iseldireg (nl_NL) | ![]() |
![]() |
![]() |
![]() |
![]() |
||
Saesneg, Y Deyrnas Unedig (en_GB) | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Saesneg, Yr Unol Daleithiau (en_US) | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Ffinneg (fi) | ![]() |
![]() |
![]() |
![]() |
Beta | ||
Ffrangeg (fr_FR) | ![]() |
![]() |
![]() |
![]() |
![]() |
Beta | |
Almaeneg (de_DE) | ![]() |
![]() |
![]() |
![]() |
![]() |
Beta | |
Eidaleg (it_IT) | ![]() |
![]() |
![]() |
![]() |
![]() |
Beta | |
Japaneg (ja_JP) | ![]() |
![]() |
![]() |
![]() |
![]() |
Beta | |
Corëeg (ko_KO) | ![]() |
![]() |
![]() |
![]() |
|||
Maleieg (ms_MY) | ![]() |
![]() |
![]() |
![]() |
|||
Norwyeg (nn_NO) | ![]() |
![]() |
![]() |
||||
Pwyleg (pl_PL) | ![]() |
![]() |
![]() |
![]() |
![]() |
||
Portiwgaleg, Brasil (pt_BR) | ![]() |
![]() |
![]() |
![]() |
![]() |
Beta | |
Rwsieg (ru_RU) | ![]() |
![]() |
![]() |
![]() |
![]() |
||
Sbaeneg (es_ES) | ![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Swedeg (sv_SE) | ![]() |
![]() |
![]() |
![]() |
|||
Thai (th_TH) | ![]() |
![]() |
![]() |
![]() |
|||
Tyrceg (tr_TR) | ![]() |
![]() |
![]() |
![]() |
![]() |
||
Cymraeg (cy_GB) | ![]() |
![]() |
![]() |
![]() |