Mae SafeAssign yn defnyddio algorithmau sy’n gwneud penderfyniadau am wreiddioldeb y testun a gyflwynir. Mae’r algorithmau yn ystyried amlder geiriau, strwythur brawddegau, a nodweddion ieithyddol eraill. Mae cymhlethdod gwneud penderfyniadau a chefnogaeth SafeAssign yn amrywio fesul iaith, fel y mae’r nifer o gynnwys mae Blackboard yn chwilio amdano ar gyfer pob iaith.

Mae cefnogaeth SafeAssign yn Japaneg yn gyfyngedig.

Mae Blackboard yn torri cymhlethdod prosesu ieithoedd i lawr ar sail yr offer hyn:

  • Chwilio ffynhonnell y data am wreiddioldeb yn yr iaith.
    • Data Wicipedia
    • Data gwefannau eraill
    • Data cyflwyniadau'r sefydliad
    • Data cyflwyniadau cyffredinol
    • Data testun cyfan Proquest
  • Hidlo geiriau stopio: Mae SafeAssign yn tynnu geiriau stopio o frawddeg cyn iddo chwilio am destun sy’n cyfateb yn y ffynonellau data uchod. Mae geiriau stopio yn eiriau a ddefnyddir yn aml, megis “fel, (f)e, (f)o, hi, y(r),” ac “ar”.
  • Dadansoddiad iaith: Mae SafeAssign yn newid pob geiriau i lythrennau bach ac yn eu torri i lawr at eu bonion. Er enghraifft, daw “gwersi” yn “gwers”. Mae SafeAssign yn defnyddio dadansoddwyr iaith i gynyddu'r nifer o gyfatebiadau a allai gael ystyr sy’n debyg i'r testun gwreiddiol ar sail bôn y gair, ond mae’r testun sy’n cyfateb yn defnyddio geiriau eraill.

Mae’r tabl hwn yn torri’r offer a ddefnyddir ar gyfer pob iaith ym mhroses chwilio SafeAssign i lawr.

I gael y canlyniadau gorau, argymhellwn ddefnyddio SafeAssign yn Saesneg, os yn bosibl. Gall ieithoedd eraill ddarparu canlyniadau llai manwl gywir oherwydd lefel is o ddata o'i gymharu â chymhlethdodau iaith eraill.