
'Differential Privacy' is een set wiskundige technieken om ‘big data’ analyses te doen zonder individuele gegevens bloot te geven. De techniek voegt een statistische 'ruis' (random data) toe aan de individuele gegevens vooraleer deze worden doorgestuurd.
Ontwikkelaars en aanbieders van online diensten verzamelen regelmatig gebruikersgegevens voor onderzoeksdoeleinden. Meestal worden de data dan anoniem gemaakt: persoonlijke gegevens zoals naam en adres worden verwijderd. Maar toch is dat niet genoeg om de privacy van de personen te beschermen: uit onderzoek blijkt dat anonieme data dikwijls toch terug te voeren zijn op een bepaalde persoon. Uit een Amerikaanse studie bleek zo dat 87% van de Amerikanen uniek geïdentificeerd kunnen worden op basis van hun geboortedatum, geslacht en postcode.
'Differential Privacy' is een set wiskundige technieken om ‘big data’ analyses te doen zonder individuele gegevens bloot te geven. De techniek voegt een statistische 'ruis' (random data) toe aan de individuele gegevens vooraleer deze worden doorgestuurd. Wanneer deze data van een grote groep worden geanalyseerd, dan wordt deze ruis statistisch gecompenseerd. Het resultaat van de research op die data blijft aldus relevant.
Het voordeel van deze techniek is dat onderzoekers grote hoeveelheden gebruikersdata kunnen analyseren, zonder dat deze terug te voeren zijn op individuele gebruikers.