Cefnogaeth Iaith
Mae SafeAssign yn defnyddio algorithmau sy’n gwneud penderfyniadau am wreiddioldeb y testun a gyflwynir. Mae’r algorithmau yn ystyried amlder geiriau, strwythur brawddegau, a nodweddion ieithyddol eraill. Mae cymhlethdod gwneud penderfyniadau SafeAssign yn amrywio fesul iaith fel y mae’r nifer o gynnwys mae Blackboard yn chwilio amdano ar gyfer pob iaith.
Mae Blackboard yn torri cymhlethdod prosesu ieithoedd i lawr ar sail yr offer hyn:
- Chwilio ffynhonnell y data am wreiddioldeb yn yr iaith.
- Data Wicipedia
- Data gwefannau eraill
- Data cyflwyniadau'r sefydliad
- Data cyflwyniadau cyffredinol
- Data testun cyfan Proquest
- Hidlo geiriau stopio: Mae SafeAssign yn tynnu geiriau stopio o frawddeg cyn iddo chwilio am destun sy’n cyfateb yn y ffynonellau data uchod. Mae geiriau stopio yn eiriau a ddefnyddir yn aml, megis “fel, (f)e, (f)o, hi, y(r),” ac “ar”.
- Dadansoddiad iaith: Mae SafeAssign yn newid pob geiriau i lythrennau bach ac yn eu torri i lawr at eu bonion. Er enghraifft, daw “gwersi” yn “gwers”. Mae SafeAssign yn defnyddio dadansoddwyr iaith i gynyddu'r nifer o gyfatebiadau a allai gael ystyr sy’n debyg i'r testun gwreiddiol ar sail bôn y gair, ond mae’r testun sy’n cyfateb yn defnyddio geiriau eraill.
Mae’r tabl hwn yn torri’r offer a ddefnyddir ar gyfer pob iaith ym mhroses chwilio SafeAssign i lawr.
Iaith | Cronfa ddata'r sefydliad | Cronfa ddata gyffredinol | Tudalennau Wicipedia | Gwefannau eraill yn yr iaith | Cronfa ddata Proquest | Hidlo geiriau stopio | Dadansoddiad iaith |
---|---|---|---|---|---|---|---|
Arabeg (ar_SA) | ![]() | ![]() | ![]() | ![]() | ![]() | Beta | |
Tsieinëeg (zh_CN) | ![]() | ![]() | ![]() | ![]() | ![]() | Beta | |
Tsiec (cs_CZ) | ![]() | ![]() | ![]() | ![]() | ![]() | ||
Daneg (da_DK) | ![]() | ![]() | ![]() | ![]() | |||
Iseldireg (nl_NL) | ![]() | ![]() | ![]() | ![]() | ![]() | ||
Saesneg, Y Deyrnas Unedig (en_GB) | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
Saesneg, Yr Unol Daleithiau (en_US) | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
Ffinneg (fi) | ![]() | ![]() | ![]() | ![]() | Beta | ||
Ffrangeg (fr_FR) | ![]() | ![]() | ![]() | ![]() | ![]() | Beta | |
Almaeneg (de_DE) | ![]() | ![]() | ![]() | ![]() | ![]() | Beta | |
Eidaleg (it_IT) | ![]() | ![]() | ![]() | ![]() | ![]() | Beta | |
Japaneg (ja_JP) | ![]() | ![]() | ![]() | ![]() | ![]() | Beta | |
Corëeg (ko_KO) | ![]() | ![]() | ![]() | ![]() | |||
Maleieg (ms_MY) | ![]() | ![]() | ![]() | ![]() | |||
Norwyeg (nn_NO) | ![]() | ![]() | ![]() | ||||
Pwyleg (pl_PL) | ![]() | ![]() | ![]() | ![]() | ![]() | ||
Portiwgaleg, Brasil (pt_BR) | ![]() | ![]() | ![]() | ![]() | ![]() | Beta | |
Rwsieg (ru_RU) | ![]() | ![]() | ![]() | ![]() | ![]() | ||
Sbaeneg (es_ES) | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() | ![]() |
Swedeg (sv_SE) | ![]() | ![]() | ![]() | ![]() | |||
Thai (th_TH) | ![]() | ![]() | ![]() | ![]() | |||
Tyrceg (tr_TR) | ![]() | ![]() | ![]() | ![]() | ![]() | ||
Cymraeg (cy_GB) | ![]() | ![]() | ![]() | ![]() |