Tagio yn ôl rheolau ar gyfer y Gymraeg

Mae CyTag yn gasgliad o offer prosesu iaith naturiol ar gyfer y Gymraeg sy'n gweithio wrth y lefel arwynebol. Mae'r casgliad yn cynnwys pedair cydran ar hyn o bryd:

Datblygwyd CyTag fel rhan o CorCenCC, prosiect a ariennir gan yr ESRC/AHRC gyda'r bwriad o greu Corpws Cenedlaethol o Cymraeg Cyfoes, i gynnwys 10 miliwn o eiriau, dan arweinyddiaeth Dr. Dawn Knight. The role of CyTag on the project is as a bespoke solution for POS tagging the final corpus. It has been primarily developed by Steven Neale and Kevin Donnelly.

Mae CyTag ar gael fel meddalwedd rydd, dan telerau fersiwn 3 (neu hwyrach) o'r GNU General Public License. Am fwy o wybodaeth am y drwydded, gweler http://www.gnu.org/licenses.

Dyfyniad: Os defnyddir CyTag neu'r set tagiau rhannau ymadrodd CorCenCC yn eich gwaith, gofynnir i chi ddyfynnu ein papur LREC 2018.