Title
Outomatiese genreklassifikasie vir Afrikaans Outomatiese genreklassifikasie vir Afrikaans
Author
Faculty/Department
Faculty of Arts. Linguistics and Literature
Publication type
article
Publication
Pretoria ,
Subject
Linguistics
Source (journal)
Die Suid-Afrikaanse tydskrif vir natuurwetenskap en tegnologie. - Pretoria
Volume/pages
33(2014) :1 , p. 1-12
ISSN
0254-3486
vabb
c:vabb:381041
Carrier
E
Target language
Dutch (dut)
Full text (Publishers DOI)
Affiliation
University of Antwerp
Abstract
Op die terrein van teksverwerking speel die metadata oor n bepaalde teks in baie gevalle n belangrike rol. Sodanige metadata word dikwels toegevoeg met behulp van outomatiese teksklassifiseerders wat op grond van die inhoud van n teks een of meer vooraf bepaalde klasse of kategorieë outomaties aan n teks toeken. Een van die dimensies waarvolgens n teks geklassifiseer kan word, is die genre van n teks en in hierdie studie word die ontwikkeling van n outomatiese genreklassifikasiesisteem in n hulpbronskaars omgewing voorgehou. (Ander dimensies sluit in: outeur van n teks, domein van tekste, informele teenoor formele tekste, ensovoorts.) Die artikel het ten doel om n eksperimentele ondersoek te loods na bestaande genreklassifikasiesisteme, en om dan die tegnieke en benaderings te implementeer vir Afrikaans (as voorbeeld van n hulpbronskaars taal). Met die ontwikkeling van n outomatiese genreklassifikasiesisteem is daar n reeks veranderlikes wat in gedagte gehou moet word en wat n invloed op die prestasie van masjienleerbenaderings het (d.i. die algoritme wat gebruik word, die hoeveelheid afrigtingsdata, en die datavoorstelling as eienskappe). As dié veranderlikes reg hanteer word en n optimale versameling van hierdie veranderlikes geïdentifiseer kan word, kan die ontwikkeling van n genreklassifikasiesisteem suksesvol gedoen word. In die studie word daar n genreklassifikasiesisteem daargestel deur gebruik te maak van die volgende benadering wat eksperimenteel geïdentifiseer is: Die implementering van n MNB-algoritme, afgerig met woordversamelingbenadering as eienskapstel. Dié sisteem lewer n resulterende f-telling (prestasiesyfer) van 0.929.
Full text (open access)
https://repository.uantwerpen.be/docman/irua/b3cfdb/0c1c2f76.pdf
Handle