Machine learningPrivacy-preserving analysis

Generació de dades sintètiques per al control de la divulgació

La generació de dades sintètiques és una tècnica d'limitació de la divulgació estadística introduïda per Donald Rubin el 1993, en la qual els valors d'un conjunt de dades confidencial es reemplacen per mostres d'una distribució predictiva posterior ajustada en lloc de publicar-se directament. Els registres artificials resultants preserven l'estructura estadística conjunta de les dades originals, alhora que impedeixen la identificació d'individus reals, cosa que permet als analistes treballar amb un conjunt de dades alliberable públicament que es comporta com l'original per a la majoria de propòsits inferencials.

Obre a MethodMindAviatVídeoAviatDownload slides

Llegeix el mètode complet

Només per a membres

Inicia la sessió amb un compte gratuït per llegir aquesta secció.

Inicia la sessió

Method map

The neighbourhood of related methods — select a node to explore.

Fonts

  1. Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link

Com citar aquesta pàgina

ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/ca/privacy/synthetic-data-generation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Citat per

ScholarGateSynthetic Data Generation (Synthetic Data Generation for Disclosure Control). Recuperat el 2026-06-15 de https://scholargate.app/ca/privacy/synthetic-data-generation · Conjunt de dades: https://doi.org/10.5281/zenodo.20539026