< Terug naar vorige pagina

Publicatie

Outomatiese genreklassifikasie vir Afrikaans

Tijdschriftbijdrage - Tijdschriftartikel

Op die terrein van teksverwerking speel die metadata oor n bepaalde teks in baie gevalle n belangrike rol. Sodanige metadata word dikwels toegevoeg met behulp van outomatiese teksklassifiseerders wat op grond van die inhoud van n teks een of meer vooraf bepaalde klasse of kategorieë outomaties aan n teks toeken. Een van die dimensies waarvolgens n teks geklassifiseer kan word, is die genre van n teks en in hierdie studie word die ontwikkeling van n outomatiese genreklassifikasiesisteem in n hulpbronskaars omgewing voorgehou. (Ander dimensies sluit in: outeur van n teks, domein van tekste, informele teenoor formele tekste, ensovoorts.) Die artikel het ten doel om n eksperimentele ondersoek te loods na bestaande genreklassifikasiesisteme, en om dan die tegnieke en benaderings te implementeer vir Afrikaans (as voorbeeld van n hulpbronskaars taal). Met die ontwikkeling van n outomatiese genreklassifikasiesisteem is daar n reeks veranderlikes wat in gedagte gehou moet word en wat n invloed op die prestasie van masjienleerbenaderings het (d.i. die algoritme wat gebruik word, die hoeveelheid afrigtingsdata, en die datavoorstelling as eienskappe). As dié veranderlikes reg hanteer word en n optimale versameling van hierdie veranderlikes geïdentifiseer kan word, kan die ontwikkeling van n genreklassifikasiesisteem suksesvol gedoen word. In die studie word daar n genreklassifikasiesisteem daargestel deur gebruik te maak van die volgende benadering wat eksperimenteel geïdentifiseer is: Die implementering van n MNB-algoritme, afgerig met woordversamelingbenadering as eienskapstel. Dié sisteem lewer n resulterende f-telling (prestasiesyfer) van 0.929.
Tijdschrift: Die Suid-Afrikaanse tydskrif vir natuurwetenskap en tegnologie
ISSN: 0254-3486
Volume: 33
Pagina's: 1 - 12
Jaar van publicatie:2014
Trefwoorden:A1 Journal article
BOF-keylabel:ja
Toegankelijkheid:Open