< Terug naar vorige pagina

Project

Robuuste niet-parametrische methoden voor functionele gegevens

Dit proefschrift introduceert drie nieuwe statistische methoden voor de robuuste analyse van functionele gegevens en geeft theoretische inzichten in twee
reeds bestaande niet-parametrische regressiemethoden, namelijk regressie met penalized en smoothing splines. In hoofdstuk 2, bekijken we het functionele lineaire regressieparadigma en stellen we een tweestaps schattingsprocedure voor die de robuuste functionele hoofdcomponenten én robuuste lineaire regressie
ombineert. Bovendien stellen we een transformatie voor die de kromming van de schattingsfactoren vermindert wat in veel situaties voordelig kan
zijn. Voor deze schatters bewijzen we Fisher-consistentie en consistentie voor eindig-dimensionale processen onder milde regulariteitsvoorwaarden. Door hun invloedsfunctie te bestuderen, kunnen we formeel aantonen dat de voorgestelde schatters veel minder kwetsbaar zijn voor afwijkende waarnemingen dan de klassieke schatters op basis van gegeneraliseerde kleinste-kwadratenprocedures. Een simulatiestudie toont aan dat in eindige steekproeven de voorgestelde schatters een redelijke efficiëntie hebben, beschermen tegen uitschieters, gladde schattingen opleveren en al met al goed presteren in vergelijking met bestaande methoden.

In Hoofdstuk 3 verleggen we de focus naar robuuste niet-parametrische regressie en in het bijzonder de populaire penalized-spline schattingsfactoren. De klassieke
objectieffunctie is gebaseerd op de kleinste kwadraten en daarom zeer gevoelig voor modelafwijkingen en atypische waarnemingen. Om deze tekortkomingen
te verbeteren, hebben verschillende auteurs penalized splines voorgesteld met een meer resistente objectiefunctie, maar de theoretische eigenschappen van
deze algemene (M-type) penalized spline-schatters waren nog niet volledig begrepen. We tonen in dit hoofdstuk dat M-type penalized spline-schatters
dezelfde onvergentiesnelheden behalen als hun kleinste-kwadraten-tegenhangers, zelfs met bij gebruik van een initiële schaalschatter. We illustreren de voordelen
van penalized splines van het M-type in een Monte-Carlo-studie en twee real-data voorbeelden, die atypische waarnemingen bevatten.

In Hoofdstuk 4 laten we zien dat de robuuste penalized spline-schatting ook toegepast kan worden bij functionele lineaire regressie. Onder een balansconditie
op de design matrix vertonen deze schatters dezelfde asymptotische eigenschap- pen als de overeenkomstige kleinste-kwadraten- schattingsfactoren, terwijl ze
aanzienlijk meer te vertrouwen zijn in de aanwezigheid van uitschieters. De voorgestelde methoden generaliseren gemakkelijk naar functionele modellen die
aanvullende functionele predictoren, scalaire covariaten of niet-parametrische componenten bevatten, waardoor er een breed raamwerk voor schatters ontstaat.
De eindige steekproefprestaties van de voorgestelde familie van schatters worden geïllustreerd aan de hand van een Monte-Carlo-studie en een echte dataset,
waarin wordt vastgesteld dat de voorgestelde schatters hoge efficiëntie kunnen combineren met bescherming tegen uitschieters én gladde schattingen kunnen
produceren die gunstig presteren in vergelijking met bestaande benaderingen, zowel robuust als niet-robuust.

Hoofdstuk 5 is een theoretische bijdrage aan de studie van smoothing spline- schatters met algemene objectieffuncties. Dergelijke schatters zijn al lang
populair in numerieke analyse, maar werden pas halverwege de jaren 70 door Grace Wahba in Statistiek geïntroduceerd. We geven een algemene behandeling
van het probleem van de smoothing en laten zien dat de kleinste kwadraten (super) convergentiesnelheden kunnen worden uitgebreid tot M-type schatters
waarvan de asymptotische eigenschappen tot dusver nog niet beschreven zijn. We laten verder zien dat het gebruik van initiële schaalschatttingen kan
gehanteerd worden onder aanzienlijk zwakkere veronderstellingen dan deze gevonden in de literatuur en we stellen optimale convergentiesnelheden vast voor
de afgeleiden, die niet zijn verkregen buiten het kleinste-kwadratenraamwerk. Een simulatiestudie en een real-data voorbeeld illustreren de competitieve
prestatie van niet-gladde M-type splines in relatie tot de kleinste kwadraten spline op reguliere data en hun superieure prestatie op data die afwijkingen
bevatten.

Ten slotte beschrijft Hoofdstuk 6 de eerste theoretisch optimale robuuste schatter voor de gemiddelde functie van discreet bemonsterde functionele
gegevens. De voorgestelde methode is gebaseerd op een M-type smoothing spline schatting met herhaalde metingen en is geschikt voor zowel dicht opeen
waargenomen trajecten als voor schaars opeen waargenomen trajecten die onderhevig zijn aan meetfouten. Onze analyse schetst duidelijk de rol van
de observatiefrequentie bij de bepaling van de asymptotische eigenschappen van de M-type smoothing spline-schatters: voor vaak waargenomen trajecten domineert de bemonsteringsfrequentie de fout wanneer deze klein is, maar is niet meer belangrijk wanneer deze groot is. Dit in tegenstelling tot de onafhankelijk geobserveerde trajecten waar de observatiefrequentie een beperktere rol speelt, aangezien de asymptotische fout gezamenlijk wordt bepaald door de observatiefrequentie en omvang. We illustreren de uitstekende prestaties van de voorgestelde familie van schatters ten opzichte van bestaande methoden in een Monte-Carlo-studie en een real-data-voorbeeld dat uitschieters bevat.

Datum:1 okt 2016 →  21 sep 2020
Trefwoorden:Robustness, Nonparametric estimation, Asymptotics
Disciplines:Toegepaste wiskunde, Computerarchitectuur en -netwerken, Distributed computing, Informatiewetenschappen, Informatiesystemen, Programmeertalen, Scientific computing, Theoretische informatica, Visual computing, Andere informatie- en computerwetenschappen, Statistische en numerieke methoden
Project type:PhD project