< Terug naar vorige pagina

Project

Veranderingspuntdetectie gebaseerd op tijd-invariante modellering van tijdreeksen

Tijdreeksgegevens, bestaande uit opeenvolgende metingen van een of meer variabelen over de tijd, bieden aanzienlijke inzichten in de dynamiek van generatieve systemen wanneer ze worden gesegmenteerd op basis van statistische eigenschappen. Change point detection (CPD) verwijst naar het identificeren van abrupte veranderingen in statistieken binnen deze reeksen, wat vaak wijst op overgangen tussen verschillende onderliggende toestanden. Gezien de cruciale rol van CPD als een voorbewerkingsstap in diverse toepassingen, zijn er in de afgelopen decennia talloze algoritmen ontwikkeld. Veel bestaande algoritmen zijn echter afgestemd op specifieke datasets en vereisen doorgaans voorkennis met betrekking tot de toepassingen. Zelfs wanneer methoden brede toepasbaarheid claimen, beperken hun eenvoudige aannames vaak hun detectienauwkeurigheid en praktische adoptie.

Dit proefschrift beoogt deze uitdagingen aan te pakken door generieke ongesuperviseerde algoritmen voor CPD voor te stellen die op een effectieve manier kunnen worden toegepast in diverse toepassingen. Onze benadering begint met een op auto-encoder gebaseerd CPD-model, bekend als Time-Invariant Representation (TIRE). Hoewel TIRE superieure prestaties heeft aangetoond vergeleken met veel state-of-the-art CPD-methoden, moeten enkele beperkingen worden aangepakt: 1) de tijd-invariantie term in de doelfunctie voorkomt niet effectief de lekkage van informatie tussen tijd-invariante en tijd-variërende kenmerken, wat resulteert in verminderde detectienauwkeurigheid; 2) de aanwezigheid van talrijke afstembare hyperparameters bemoeilijkt de praktische toepassing; en 3) het oorspronkelijke TIRE-model was ontworpen voor laag-dimensionale tijdreeksgegevens, waardoor het ongeschikt is voor multikanaalgegevens.

Om deze problemen te overwinnen, stellen we een nieuwe doelfunctie voor, genaamd "diamond loss". Deze nieuwe doelfunctie legt beperkingen op aan tijd-invariante en tijd-variërende kenmerken, waardoor hun scheiding wordt verbeterd en de noodzaak voor een afwegingshyperparameter tussen de twee verliesvoorwaarden wordt geëlimineerd. Daarnaast ontwikkelen we een multi-view TIRE-structuur die automatisch CPD-gerelateerde informatie uit het tijdsdomein, frequentiedomein of beide kan behouden binnen de tijd-invariante kenmerken zonder domeinspecifieke kennis of afbreuk te doen aan de detectienauwkeurigheid. Verder ontwerpen we een nieuw multikanaal TIRE-model dat expliciet informatie tussen kanalen incorporeert, waardoor het geschikter is voor multikanaal tijdreeksdatasets.

Naast ons werk aan ongesuperviseerde CPD-algoritmen, verkennen we CPD in een semi-gesuperviseerde setting. In tegenstelling tot ongesuperviseerde CPD-algoritmen, die vaak resultaten opleveren die sterk afwijken van de verwachtingen van gebruikers, kunnen semi-gesuperviseerde CPD-algoritmen zich richten op het detecteren van toepassingsrelevante veranderingspunten terwijl valse positieven of irrelevante veranderingen worden genegeerd. In deze context introduceren we een algoritme genaamd Active-Learning Change Point Detection (ALCPD). ALCPD bestaat uit een semi-gesuperviseerde TIRE-model dat continu nieuw gedetecteerde veranderingspunten voorstelt en een random forest-model dat valse positieve voorbeelden uit de nieuwe kandidaat change points-set probeert te verwijderen. Deze twee modellen worden afwisselend getraind, met constante feedback van de eindgebruiker. Onze experimentele resultaten tonen aan dat gebruikersfeedback de detectienauwkeurigheid aanzienlijk verbetert. We stellen vervolgens een Interactief Change Point Detection (ICPD) algoritme voor, waarbij we het semi-gesuperviseerde TIRE-model en het random forest-model in de ALCPD-methode vervangen door een one-class support vector machine (OCSVM) model. Deze wijziging stabiliseert het trainingsproces door tegenwerking tussen de twee modellen in de ALCPD-methode te voorkomen, waardoor het ICPD-model snel convergeert na het verzamelen van een voldoende aantal queries.

Door deze bijdragen biedt dit proefschrift een uitgebreide reeks CPD-tools die gemakkelijk kunnen worden toegepast in verschillende instellingen en scenario's. Onze uitgebreide kwantitatieve experimenten op een verscheidenheid aan gesimuleerde en real-life datasets bevestigen de voordelen van deze nieuw voorgestelde methoden ten opzichte van bestaande state-of-the-art CPD-benaderingen. De bevindingen van dit onderzoek bevorderen het veld van tijdreeksanalyse door meer robuuste, nauwkeurige en veelzijdige CPD-technieken te bieden, waardoor hun toepasbaarheid in diverse domeinen wordt vergroot. Dit werk adresseert niet alleen de beperkingen van huidige CPD-methodologieën, maar effent ook het pad voor toekomstig onderzoek en ontwikkeling in adaptieve en generaliseerbare tijdreekssegmentatietechnieken.

Datum:26 aug 2020 →  28 nov 2024
Trefwoorden:Artificial Intelligence, time series, segmentation
Disciplines:Signaalverwerking
Project type:PhD project