Arrel     Publicacions     Enllaços     Congressos     Història            20 20 20

Privadesa de dades

Mineria de dades preservant-ne la privadesa

Control estadístic

http://www.ppdm.cat


Microagregació: La microagregació és un mètode de protecció pertorbatiu. Donat un fitxer es construeixen petites agrupacions de registres i després es substitueix cada registre pel centroide de la seva agrupació. Les agrupacions han de tenir entre k i 2k registres, on k és un paràmetre del sistema. Com més gran és k, major és la pèrdua i menor és el risc.
Univariada vs. Multivariada: Hi ha dos tipus de microagregació per quan el fitxer s'ha definit en termes de diverses variables. La microagregació univariada consisteix en aplicar la microagregació a cada variable de forma independent. La microagregació multivariada consisteix en tractar subconjunts de les variables i fer les agrupacions considerant a la vegada totes les variables el subconjunt. Hi ha algorismes de temps polinòmic pel cas de microagregació univariada però no é així pel cas de la multivariada. En aquest darrer cas s'ha demostrat que és un problema NP, per això s'han desenvolupat algorismes heurístics.
Microagregació i k-anonimitat: La microagregació només assegura la k-anonimitat quan s'aplica de forma multivariada i prenent totes les variables a la vegada. En qualsevol altra cas no s'assegura. De fet, és habitual que no es satisfaci perquè sovint per reduir la pèrdua d'informació es fa una partició de les variables i s'aplica la microagregació a cada subconjunt.
Publicacions:
  • Domingo-Ferrer, J., Torra, V., (2001) A quantitative comparison of disclosure control methods for microdata, Confidentiality, disclosure, and data access : Theory and practical applications for statistical agencies. Doyle, P.; Lane, J.I.; Theeuwes, J.J.M.; Zayatz, L.V. eds., Elsevier, pp. 111-133. PDF@URV
    • Aquest paper compara el rendiment de diversos mètodes de protecció en relació al risc de revelació i la pèrdua d'informació. Inclou diverses variacions de la microagregació (totes numèriques). Es va demostrar que alguns dels mètodes de microagregació tenen un bon rendiment.
  • Torra, V. (2004) Microaggregation for categorical variables: a median based approach, Privacy in Statistical Databases, 2004. (Lecture Notes in Computer Science 3050 162-174) PDF @ Springer Link
    • En aquest paper extenem la microagregació, primer només definida per a dades numèriques.
  • Domingo-Ferrer, J., Torra, V. (2005) Ordinal, Continuous and Heterogeneous k-Anonymity Through Microaggregation, Data Mining and Knowledge Discovery, 11:2 195-212. PDF @ Springer Link
    • En aquest paper combinem la microagregació numèrica i la categòrica. La implementació de la microagregació segueix l'algorisme MDAV (un mètode heurístic. Es discuteix la microagregació per aconseguir la k-anonimitat.
  • Nin, J., Herranz, J., Torra, V. (2008) How to Group Attributes in Multivariate Microaggregation. International Journal on Uncertainty, Fuzziness and Knowledge-Based Systems (IJUFKS) 16:1 121-138 PDF @ World Scientific
    • La microagregació no acostuma a tractar totes les variables/atributs a la vegada, sino que se'n fa una partició i es microagrega cada subconjunt de forma independent. En aquest paper discutim quina és la manera òptima de fer aquesta partició de manera que s'aconsegueixi un bon compromís entre la pèrdua d'informació i el risc de revelació.
  • Torra, V., Miyamoto, S. (2004) Evaluating fuzzy clustering algorithms for microdata protection, Privacy in Statistical Databases, 2004. (Lecture Notes in Computer Science 3050 175-186) PDF @ Springer Link
    • En aquest paper presentem una aproximació heurística basada en la categorització difusa que difumina els microclusters.
  • Nin, J., Torra, V. (2009) Analysis of the Univariate Microaggregation Disclosure Risk. New Generation Computing, Springer. PDF @ Springer
    • En aquest paper ataquem la microagregació univariant fent un atac ad-hoc. Mostrem que els atacants poden reidentificar més registres que els que aconseguirien amb mètodes estàndards. A més a més mostrem que no hi ha incertesa al moment de fer la reidentificació. Cal observar que hi ha casos on no és possible distingir entre les reidentificacions correctes i les incorrectes. Avaluar el risc d'aquesta manera es necessari de cara a aplicar protecció de dades amb transparència. Informació sobre transparència aquí.
  • Nin, N., Herranz, J., Torra, V. (2008) On the Disclosure Risk of Multivariate Microaggregation. Data and Knowledge Engineering (DKE), Elsevier, 67:3 399-412. Paper @ ScienceDirect
    • En aquest paper ataquem un fitxer protegit amb microagregació multivariant. Com en el cas anterior, obtenim més reidentificacions que amb els mètodes habituals. Com en el cas anterior, aquest tipus d'anàlisis és necessari per aplicar els mètodes de protecció amb transparència.
  • Torra, V. (2008) Constrained Microaggregation: Adding Constraints for Data Editing, Transactions on Data Privacy 1:2 (2008) 86 - 104 Paper @ TDP (open access)
    • El paper estudia com fer la microagregació quan hi ha restriccions entre les variables i volem que les dades protegides també satisfacin aquestes restriccions.
  • Nin, J., Torra, V. (2006) Extending microaggregation procedures for time series protection, Lecture Notes in Artificial Intelligence, 4259 899-908. (5th Int. Conf. on Rough Sets and Current Trends in Computing, RSCTC RSCTC 2006). http://dx.doi.org/10.1007/11908029_93
    • Aquest paper esten la microagregació per aplicar-la a sèries temporals.
  • Nin, J., Torra, V. (2009) Towards The Evaluation of Time Series Protection Methods. Information Sciences, 179:11 1663-1677. http://dx.doi.org/10.1016/j.ins.2009.01.024
    • Aquest paper presenta un marc complet per a la protecció de sèries temporals que inclou l'estudi del risc i de la pèrdua d'informació. S'ha aplicat aquest marc al mètode esmentat anteriorment de microagregació de sèries temporals.

 

Citeu aquest web com:
V. Torra, Data privacy, Springer, 2017 (forthcomming). Web associada: http://www.ppdm.cat/dp/

Vicenç Torra, Last modified: 15 : 34 December 11 2014.