< Terug naar vorige pagina

Project

Semi-gesuperviseerde en interpreteerbare machine learning met een toepassing op het laagspanningsnetwerk


Vanwege de enorme toename van beschikbare data en rekenkracht nodig om deze te verwerken,  blijft de interesse in machinaal leren (ML) toenemen. Dit omdat ML waardevolle inzichten uit deze data kan halen. Deze thesis introduceert nieuwe ML-technieken die voortkomen uit twee industriële behoeften: (1) om ML-systemen rekening te laten houden met gebruikersbehoeften en (2) om de gebruiker de voorspellingen van het systeem te doen begrijpen. Bovendien tonen we ook de waarde van ML aan met een hedendaagse toepassing: het versterken van het laagspanningsnetwerk.  

In standaard ongesuperviseerd clusteren is het moeilijk om rekening te houden met gebruikersverwachtingen. Er zijn vaak meerdere clusteringsmogelijkheden voor dezelfde set instanties waardoor experimentatie met verschillende algoritmes en instellingen vereist is om de gewenste clustering te bekomen. Actief semi-gesuperviseerd clusteren biedt een alternatief door vragen te stellen aan de gebruiker om zo constraints (beperkingen) te verzamelen. Deze constraints worden dan gebruikt om een clustering in lijn met de gebruikersverwachtingen te produceren. Het omgaan met ruis blijft echter een uitdaging: als sommige constraints onjuist zijn, falen bestaande algoritmes om een goed resultaat te produceren.   Als eerste bijdrage introduceren we een raamwerk dat actief semi-gesuperviseerde algoritmes robuust maakt tegen ruis. Door probabilistisch over ruis te redeneren kan het raamwerk incorrecte beperkingen detecteren en corrigeren. Op die manier kan het algoritme een goede clustering produceren zelfs als sommige van de gegeven beperkingen onjuist zijn.  

Naast clusteren hebben we tevens anomaliedetectie (AD) onderzocht. Veel AD-algoritmes identificeren anomalieën maar leggen niet uit waarom ze een bepaald geval als abnormaal bestempelen. Dit maakt het moeilijk om actie te ondernemen zonder verdere analyse. Als een anomaliedetector zijn voorspellingen uitlegt is meteen duidelijk waarom het algoritme een bepaald geval als abnormaal beschouwt. Deze verklaringen laten gebruikers toe de redenering van het algoritme te verifiëren en maken het makkelijker om, op basis van de resultaten, actie te ondernemen. Als tweede bijdrage geven we daarom een uitgebreid overzicht van dependency-based (op-afhankelijkheden-gebaseerde) AD: een strategie voor AD die uitlegbaar is. Deze methoden modelleren de afhankelijkheden tussen attributen en markeren instanties, die deze afhankelijkheden schenden, als abnormaal. De afhankelijkheden en schendingen kunnen rechtstreeks dienen als verklaringen. Bijvoorbeeld, ``Dieren met een staart hebben meestal een ruggengraat; echter, een schorpioen heeft een staart maar geen ruggengraat''. Bovendien identificeren we twee zwakke punten van bestaande modellen en stellen we twee nieuwe ideeën voor om deze op te lossen. Hoewel verder onderzoek nodig is, geloven we dat de gepresenteerde inzichten zeer relevant zijn voor toekomstige ontwikkelingen op het gebied van dependency-based AD. 

Daarnaast is er in de AD literatuur geen overeenstemming over hoe de hyperparameters van verschillende anomaliedetectoren moeten worden afgestemd bij het experimenteel vergelijken van algoritmes. De meeste papers vergelijken ofwel prestaties met ``standaard'' instellingen, ofwel maximale prestaties onder optimale instellingen. Deze methodologieën zijn ofwel te pessimistisch, waarbij wordt uitgegaan van geen enkele afstemming van de hyperparameters, of onrealistisch optimistisch, waarbij wordt uitgegaan van optimale afstemming. Deze methodologieën leiden daarnaast vaak tot methodologisch onjuiste en niet-reproduceerbare vergelijkingen. Daarom stellen we als derde bijdrage voor om een kleine validatieset te gebruiken om de hyperparameters af te stemmen voor een realistische, eerlijke, betrouwbare en reproduceerbare vergelijking.

Als laatste bijdrage laten we de waarde van ML zien door het te gebruiken om een kostenefficiënte versterking van het laagspanningsnet te ondersteunen. Het plannen van zo'n versterking vereist het berekenen van de typische stromen en spanningen in het hele net. Hiervoor zijn tijdsreeksen van het elektriciteitsverbruik van elke aangesloten gebruiker nodig. Aangezien deze tijdsreeksen vaak ontbreken, hebben we twee methoden ontwikkeld om ze te voorspellen op basis van consumentendata, weergegevens en kalanderinformatie. Onze eerste methode lost de taak op, maar is complex en traag met beperkte interpreteerbaarheid. Daarom hebben we een tweede methode ontwikkeld die predictive clustering (voorspellend clusteren) gebruikt. Dit tweede model is eenvoudiger met vergelijkbare voorspellende accuraatheid en is snel en interpreteerbaar. Zo kan een expert bekijken welke tijdsreeksen voorspeld worden in welke omstandigheden. We hopen dat onze bijdrage de kosten van versterking van het laagspanningsnet verlaagt en netbeheerders meer datagedreven inzichten bezorgt. 

Datum:1 okt 2019 →  9 sep 2023
Trefwoorden:anomaly detection
Disciplines:Datamining
Project type:PhD project