Cefnogaeth Iaith
Mae SafeAssign yn defnyddio algorithmau sy’n gwneud penderfyniadau am wreiddioldeb y testun a gyflwynir. Mae’r algorithmau yn ystyried amlder geiriau, strwythur brawddegau, a nodweddion ieithyddol eraill. Mae cymhlethdod gwneud penderfyniadau SafeAssign yn amrywio fesul iaith fel y mae’r nifer o gynnwys mae Blackboard yn chwilio amdano ar gyfer pob iaith.
Mae Blackboard yn torri cymhlethdod prosesu ieithoedd i lawr ar sail yr offer hyn:
- Chwilio ffynhonnell y data am wreiddioldeb yn yr iaith.
- Data Wicipedia
- Data gwefannau eraill
- Data cyflwyniadau'r sefydliad
- Data cyflwyniadau cyffredinol
- Data testun cyfan Proquest
- Hidlo geiriau stopio: Mae SafeAssign yn tynnu geiriau stopio o frawddeg cyn iddo chwilio am destun sy’n cyfateb yn y ffynonellau data uchod. Mae geiriau stopio yn eiriau a ddefnyddir yn aml, megis “fel, (f)e, (f)o, hi, y(r),” ac “ar”.
- Dadansoddiad iaith: Mae SafeAssign yn newid pob geiriau i lythrennau bach ac yn eu torri i lawr at eu bonion. Er enghraifft, daw “gwersi” yn “gwers”. Mae SafeAssign yn defnyddio dadansoddwyr iaith i gynyddu'r nifer o gyfatebiadau a allai gael ystyr sy’n debyg i'r testun gwreiddiol ar sail bôn y gair, ond mae’r testun sy’n cyfateb yn defnyddio geiriau eraill.
Mae’r tabl hwn yn torri’r offer a ddefnyddir ar gyfer pob iaith ym mhroses chwilio SafeAssign i lawr.
Iaith | Cronfa ddata'r sefydliad | Cronfa ddata gyffredinol | Tudalennau Wicipedia | Gwefannau eraill yn yr iaith | Cronfa ddata Proquest | Hidlo geiriau stopio | Dadansoddiad iaith |
---|---|---|---|---|---|---|---|
Arabeg (ar_SA) | Beta | ||||||
Tsieinëeg (zh_CN) | Beta | ||||||
Tsiec (cs_CZ) | |||||||
Daneg (da_DK) | |||||||
Iseldireg (nl_NL) | |||||||
Saesneg, Y Deyrnas Unedig (en_GB) | |||||||
Saesneg, Yr Unol Daleithiau (en_US) | |||||||
Ffinneg (fi) | Beta | ||||||
Ffrangeg (fr_FR) | Beta | ||||||
Almaeneg (de_DE) | Beta | ||||||
Eidaleg (it_IT) | Beta | ||||||
Japaneg (ja_JP) | Beta | ||||||
Corëeg (ko_KO) | |||||||
Maleieg (ms_MY) | |||||||
Norwyeg (nn_NO) | |||||||
Pwyleg (pl_PL) | |||||||
Portiwgaleg, Brasil (pt_BR) | Beta | ||||||
Rwsieg (ru_RU) | |||||||
Sbaeneg (es_ES) | |||||||
Swedeg (sv_SE) | |||||||
Thai (th_TH) | |||||||
Tyrceg (tr_TR) | |||||||
Cymraeg (cy_GB) |