Classificatieperformantie en stabiliteitsmeting van de K-Dependent Bayesian Classifier op kankerdata
In dit werk wordt een vergelijkende studie uitgevoerd van de performantie van het K-Dependent Bayesian classificatiemodel met andere state-of-the-art classificatietechnieken, zoals SVM en KNN. Deze studie gebeurt op hoogdimensionale kankerdatasets die gebruik maken van microarray- en massaspectrometrietechnologie. Daarbij wordt de invloed van twee bestaande discretisatiemethoden op de classificatieaccuraatheid geëvalueerd en een nieuwe gesuperviseerde discretisatiemethode ontwikkeld (Three-Bin Minimal Entropy Partitioning). Tevens wordt bekeken hoe men de performantie van KDB kan optimaliseren, zowel in rekentijd als in geheugenvereisten. Verder wordt het KDB-model onderworpen aan een stabiliteitsmeting d.m.v. het biomarker evaluation protocol.