Syntetisk datagenerering for kontroll av opplysninger
Syntetisk datagenerering er en teknikk for statistisk begrensning av opplysninger, introdusert av Donald Rubin i 1993, der verdier i et konfidensielt datasett erstattes med uttrekk fra en tilpasset posterior prediktiv fordeling, i stedet for å bli frigitt direkte. De resulterende kunstige postene bevarer den felles statistiske strukturen til de opprinnelige dataene, samtidig som de forhindrer identifisering av reelle individer. Dette gjør det mulig for analytikere å arbeide med et offentlig frigjørbart datasett som oppfører seg som originalen for de fleste inferensformål.
Les hele metoden
Logg inn med en gratis konto for å lese denne delen.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Slik siterer du denne siden
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/no/privacy/synthetic-data-generation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Differensielt personvernPersonvern↔ compare
- Generativt motsetningsnettverkDyp læring↔ compare
- Multippel imputasjonStatistikk↔ compare
Referert av
Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →