< Terug naar vorige pagina

Project

Nieuwe statistische technieken voor de analyses van complexe data in de sociale wetenschappen

Sociaal onderzoek vereist steeds meer onderzoekers om grote en complexe data die vaak cross-nationaal van aard te verzamelen. Met behulp van grote vragenlijsten, vaardigheden, attitudes en eigenschappen worden gemeten en opgeslagen in grote datasets. Een typisch voorbeeld van een complexe dataset is het PISA-onderzoek (Program for International Student Assessment), een driejaarlijks internationaal onderzoek dat zich richt op onderwijs systemen wereldwijd te evalueren door het testen van vaardigheden en kennis op 15-jarige leerlingen. Statistische technieken te analyseren deze complexe gegevens moeten adequaat om te gaan met de combinatie van 1) de clustering van leerlingen in verschillende landen, 2) de categorische antwoordmogelijkheden van de vragenlijsten, zoals “correct” / “incorrect”, en 3) ontbrekende waarden in de gegevens wanneer respondenten niet in te vullen alle vragen. Helaas, de huidige beschikbare technieken niet adequaat omgaan met complexe data en als gevolg daarvan, onderzoekers vaak suboptimale analyse technieken toe te passen. In dit project, ik doel hebben om nieuwe statistische technieken ontwikkelen om grote en complexe data te analyseren op een correcte en praktische manier. Daartoe zal ik 1) de ontwikkeling van een algemene statistische methode voor het analyseren van complexe data, 2) oplossingen voor geclusterde gegevens met ontbrekende waarden en fit maatregelen aan te geven of een model past bij de gegevens te ontwikkelen, en 3) het ontwikkelen van vrij beschikbare software voor onderzoekers . Bovendien zal dit onderzoek leiden tot duidelijke richtlijnen voor onderzoekers in de sociale wetenschappen het omgaan met grote en complexe data.

Datum:1 okt 2015 →  30 sep 2018
Trefwoorden:Structurele Vergelijkingsmodellen, multilevel data, categorische data
Disciplines:Psychometrie, Statistiek en data-analyse