Project

Een studie over afhankelijkheden en de effecten van selectie voor hedendaagse gegevensstructuren

Hedendaagse data omvatten multidimensionale en multivariate data van verschillende oorsprong: zoals data in de vorm van cijfers, functies, oppervlakten of beelden, grafen en circulaire data. Flexibele modellen zijn nodig om zulke data nauwkeurig te beschrijven. Dit project focust op twee domeinen van statistische analysemethoden voor de modelparameters, welke eindig of oneindig dimensionaal kunnen zijn. Een eerste aspect is een studie van de complexe afhankelijkheidsstructuren in de gegevens door middel van de ontwikkeling van copula-achtige methoden. Om de afhankelijkheden te modelleren zijn verschillende technieken nodig, afhankelijk van de specifieke datastructuur (denk aan grafen of circulaire data welke een eigen aanpak vereisen). Eigen aan deze modellering is de keuze van een copulamodel en van de marginale verdelingen. Een tweede aspect is een studie van de effecten van selectie. Wanneer bij aanvang van een statistische analyse een model geselecteerd wordt uit een collectie van mogelijke modellen (dit omvat ook variabelenselectie), moet alle verdere statistische besluitvorming dat zo'n geselecteerd model gebruikt de stochastische aspecten van de modelkeuze in rekening nemen. Deze post-selectie besluitvorming is cruciaal om geldige statistische conclusies te trekken. In dit project zullen we zulke geldige technieken ontwikkelen voor verschillende modeleringsproblemen.

Datum:1 okt 2020 → Heden

Trefwoorden:Dependency, Post-selection inference, Flexible modelling, Multivariate data, Copulas

Disciplines:Statistiek

Project

Een studie over afhankelijkheden en de effecten van selectie voor hedendaagse gegevensstructuren

Onderzoekers

Project partners

Financiering

Publicaties