Improving Data Utility in Differential Privacy and K-anony Mity
Doctoral Thesis
Improving Data Utility in Differential Privacy and K-anony Mity Doctoral Thesis
"Aquesta tesi adopta el punt de vista de la comunitat informàtica. Ens centrem en dos models de privadesa àmpliament acceptats: el k-anonimat i la privadesa diferencial. Un cop triat el model de privadesa, l'objectiu passa a ser complir-ne els requisits, alhora que preservar la màxima utilitat possible en les dades resultants. L'objectiu principal d'aquesta tesi és la millora de la utilitat en la publicació de dades k-anònimes i diferencialment privades. El k-anonimat presenta alguns problemes. Pel que fa al risc de revelació, no protegeix contra la revelació d'atributs ni contra intrusos informats. Pel que fa a la utilitat de les dades, tractar amb fitxers amb un nombre elevat d'atributs quasiidentificadors pot ser problemàtic. Proposem una relaxació del k-anonimat que tracta aquests problemas. La privadesa diferencial limita el risc de revelació afegint un soroll aleatori al resultat de les consultes. Mostrem que la distribució de Laplace no és òptima: es poden complir els requeriments de la privadesa diferencial afegint sorolls més petits. A més, caracteritzem i construïm les distribucions òptimes (univariant i multivariant). Els mecanismes habituals per obtener privadesa diferencial no tenen en compte el possible coneixement previ dels usuaris; implícitament, se'ls suposa un coneixement nul. Proposem un mecanismo basat a limitar el guany de coneixement de l'usuari respecte del seu coneixement inicial. El k-anonimat i la privadesa diferencial es presenten sovint com a models contraposats. La privadesa diferencial i el k-anonimat no són conceptes completament inconnexos: si es pren com a punt de partida per obtenir privadesa diferencial un conjunt de dades k-anònim (obtingut mitjançant un cert tipus de microagregació), la quantitat de soroll necessari es veu reduïda significativament." -- TDX.