< Terug naar vorige pagina

Project

Een p-waarde pooling-benadering van significantietesten met meervoudige imputatie voor ontbrekende gegevens.

Tot op zekere hoogte zijn bijna alle gegevens onvolledig. Onvolledige gegevens worden over het algemeen als problematisch beschouwd omdat ze het vermogen kunnen verminderen en de daaruit voortvloeiende gevolgtrekkingen aanzienlijk kunnen beïnvloeden. Meerdere imputatie is naar voren gekomen als een van de nieuwste methoden voor het verwerken van ontbrekende gegevens. Bij de meervoudige imputatie benadering worden m datasets gemaakt met alle ontbrekende waarden ingevoerd. Elke gegevensset wordt vervolgens afzonderlijk geanalyseerd en in de laatste stap worden schattingen van de m gegevenssets samengevoegd met behulp van bestaande pool regels. Terwijl meervoudige imputatie over het algemeen onbevooroordeelde schattingen en standaardfouten oplevert, suggereert bestaand bewijs dat de huidige benaderingen voor het testen van de significantie van meervoudig toegerekende schattingen veel problemen hebben (bijv. Gebrek aan vermogen, grote steekproef vereisten, afhankelijkheid van het percentage afwezigheid). Aangezien de meeste onderzoekers die meervoudige imputatie gebruiken, deze techniek gebruiken in combinatie met frequentistische hypothesetests, is het ontbreken van betrouwbare technieken om de statistische significantie van meervoudig toegerekende schattingen te testen zeer problematisch. Daarom is onderzoek naar de statistische eigenschappen van bestaande significantietest technieken dringend nodig. Bovendien zal het voorgestelde doctoraatsproject zich ook richten op de ontwikkeling van een robuuste techniek voor het testen van de significantie in gepoolde schattingen die worden verkregen met behulp van meervoudig toegekende datasets, zelfs wanneer de imputaties geen schattingen geven maar eerder verschillende hoeveelheden (bijv. alleen p-waarden). We stellen voor om p-waarden (of test statistieken) samen te voegen om de bestaande methoden voor het testen van de significantie in de meervoudig toegekende datasets te verbeteren, met name als er geen schattingen beschikbaar zijn. Ten slotte zullen we ook de nieuwe techniek van significantie testen implementeren in de vorm van een R-pakket dat naadloos werkt met bestaande meerdere imputatie pakketten zoals muizen en amelia. Samenvattend heeft het voorgestelde doctoraatsproject de volgende vier doelstellingen: 1. Evaluatie van de geschiktheid van de bestaande methoden voor het genereren van significantieniveaus uit meervoudig toegerekende datasets. 2. Ontwikkeling van een nieuwe aanpak voor het testen van de significantie in meervoudig toegerekende datasets die is gebaseerd op een juiste pooling van p-waarden. 3. Vergelijking van de bestaande methoden met de nieuw ontwikkelde p-waarde pooling-methode. 4. Implementeren van de p-waarde pooling-methode in een R-pakket

Datum:1 okt 2019 →  1 okt 2023
Trefwoorden:Multiple imputation, pooling p-values, missing data
Disciplines:Biostatistiek
Project type:PhD project