< Terug naar vorige pagina

Project

Statistische methodologie voor het opsporen van fraude

Fraudedetectie heeft belangrijke toepassingen op veel gebieden van de samenleving en het dagelijks leven, zoals fraudedetectie van ziektekostenverzekeringsfondsen om regeringen te helpen het 'levensreddende geld' van mensen te beschermen, fraudedetectie van internationale handelsgegevens om tariefverliezen te voorkomen, fraudedetectie van creditcardtransacties om banken te helpen risico's te identificeren, enzovoort. Met de opeenstapeling van gegevens op verschillende gebieden is het gebruik van statistische methoden geleidelijk een trend geworden bij het opsporen van fraude. Statistische methoden presteren ook goed bij het identificeren van fraude en kunnen automatisch frauduleuze transacties detecteren en blokkeren. Vanuit het oogpunt van statistiek is fraudedetectie in wezen een binair classificatieprobleem. Een natuurlijke eerste stap voor het binaire classificatieprobleem is het overwegen van logistische regressie en/of beslissingsbomen. Deze twee methoden zijn zeer interpreteerbaar, maar hun prestaties zijn niet altijd erg goed. Vervolgens werden deze eenvoudige analytische modellen gecombineerd met ensemblemethoden om enkele complexe modellen voor te stellen, zoals willekeurige bossen en boostmethoden. Deze ensemblemethoden worden veel gebruikt bij het opsporen van fraude en presteren beter dan eenvoudige analytische modellen. Ze hebben echter een zeer belangrijk nadeel dat niet wenselijk is vanuit het oogpunt van fraudepreventie: het zijn black-box-modellen, wat betekent dat ze erg complex zijn om te interpreteren. Ons onderzoek probeert dus interpreteerbaarheid en hoge prestaties te combineren om interpreteerbare ensemble-statistische methoden voor fraudedetectie vast te stellen.

Datum:8 feb 2023 →  Heden
Trefwoorden:Statistics, Mathematics, Data Science, Interpretability, Fraud detection
Disciplines:Statistiek
Project type:PhD project