Project

Core sets die privacy beschermen

Empirische risicominimalisatie vormt de kern van moderne machine learning-methodologieën. In dit kader wordt een
verliesfunctie in verwachting geminimaliseerd, waarbij de verwachting wordt genomen met betrekking tot gegevens die
representatief zijn. In diverse toepassingen is het handig om een samenvatting te krijgen van een set gegevens die belangrijke
aspecten van de distributie bewaart, terwijl privégegevens worden verwijderd waarmee een tegenstander individuele
identificatiegegevens kan herstellen. De aspecten van de distributie die behouden moeten blijven, zijn de aspecten die een goede
generalisatie mogelijk maken, terwijl de getransformeerde weergave van de gegevens vaak compact moet zijn om middelen te
besparen. In dit project onderzoeken we het gebruik van privacybeschermende core sets. Een core set is een spaarzaam
weergave van een grotere gegevensset die de prestaties van een machine learning-algoritme behoudt. De constructie van de
core set kan een intrinsieke eigenschap hebben om de privacy te behouden, maar er is nog steeds ruimte voor datalekken, zelfs
van punten die niet in de kernset zijn opgenomen. Dit project zal core sets ontwikkelen die tegelijkertijd goed statistisch leren
garanderen en tegelijkertijd privacygaranties bieden. Door dit te doen, zullen we de efficiëntie en prestaties van machine
learning-algoritmen verbeteren, terwijl we de veiligheid van onze persoonlijke gegevens die tijdens hun training worden gebruikt,
waarborgen.

Datum:1 apr 2021 → Heden

Trefwoorden:privacy-preserving core sets, machine learning algorithms

Disciplines:Machine learning en besluitvorming

Project

Core sets die privacy beschermen

Onderzoekers

Project partners

Financiering