Project
Ontwikkelen van dataminingmethoden voor de bio-informatica
Datamining in bioinformatica wordt geconfronteerd met complexe gegevens, die uitdagingen w.r.t.
schaalbaarheid en gestructureerde gegevenstypen. Eén datastructuur die vaak wordt aangetroffen in deze context is
hiërarchische gegevens. Gen-functies kunnen bijvoorbeeld worden gestructureerd in een hiërarchie van meer algemeen
functies (bijv. "receptoractiviteit") voor meer specifieke functies (bijv. "G-eiwit-gekoppeld
fotoreceptoractiviteit "). In veel leertaken, zoals een hiërarchisch gestructureerde achtergrond
informatie wordt volledig genegeerd.
In dit onderzoeksvoorstel behandelen we dit tekort op drie manieren. Ten eerste zullen we de
hiërarchische structuur van celtypen bij het classificeren van een patiënt als het hebben van een ziekte of niet, gebaseerd op de
cellen aanwezig in zijn bloedmonster. Ten tweede zullen we hiërarchisch gestructureerde celtypen gebruiken en
genfuncties bij het analyseren van microserie-gegevenssets. Ten derde zullen we het bestaan van
meerdere optimale functiesets in de context van een hiërarchisch gestructureerd doelattribuut.