Project

Multi-label semi-supervised leren voor big data problemen

In het tijdperk van big data wordt het analyseren en extraheren van kennis uit grootschalige datasets een zeer uitdagende taak. De toepassing van standaard dataminingtools in dergelijke datasets is niet eenvoudig. Daarom is een nieuwe klasse schaalbare mining-methoden vereist die de enorme opslag- en verwerkingscapaciteiten van cloudplatforms omvat.
In dit onderzoeksvoorstel zullen we zeer schaalbare methoden ontwerpen voor preprocessing en data mining-taken om big data-problemen in het algemeen aan te pakken, en in het bijzonder die welke kunnen worden ingelijst in de semi-begeleide multi-label leercontext. Dit recente onderwerp trekt veel aandacht in veel echte toepassingen, zoals bio-informatica, beeldclassificatie, tekst mining, web mining, spraakherkenning, etc.
We zullen het semi-begeleide multi-label leerprobleem aanpakken met behulp van preprocessing
technieken en nieuwe classificatiemethoden. Na een zorgvuldige studie van de state-of-the-art, zullen we nieuwe classificatie-algoritmen ontwikkelen. Vervolgens zullen we nieuwe functieselectie / wegingsalgoritmen en instantieverminderingstechnieken ontwikkelen om big data-problemen aan te pakken en het gebrek aan schaalbaarheid van bestaande voorstellen overtreffen met behulp van cloudgebaseerde technologieën.
Als toepassingsdomeinen zullen we ons richten op problemen met datamining in de context van bio-informatica.
De recente data-explosie in deze velden vereist het gebruik van schaalbare tools voor datamining.

Datum:1 okt 2014 → 1 jun 2016

Trefwoorden:multi-label, data problemen

Disciplines:Diergeneeskunde, Dierkundige biologie, Andere landbouwwetenschappen, diergeneeskunde en levensmiddelenwetenschappen, Andere veterinaire wetenschappen

Project

Multi-label semi-supervised leren voor big data problemen

Onderzoekers

Project partners

Financiering