ScholarGate
Assistent
Machine learningPrivacy-preserving analysis

Synthetische data-generatie voor disclosure control

Synthetische data-generatie is een statistische techniek voor beperking van openbaarmaking, geïntroduceerd door Donald Rubin in 1993, waarbij waarden in een vertrouwelijke dataset worden vervangen door trekkingen uit een gepaste posterieure voorspellende verdeling in plaats van direct te worden vrijgegeven. De resulterende kunstmatige records behouden de gezamenlijke statistische structuur van de oorspronkelijke gegevens en voorkomen tegelijkertijd de identificatie van echte individuen, waardoor analisten kunnen werken met een publiekelijk vrij te geven dataset die zich voor de meeste inferentiële doeleinden gedraagt als het origineel.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link

Deze pagina citeren

ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/nl/privacy/synthetic-data-generation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateSynthetic Data Generation (Synthetic Data Generation for Disclosure Control). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/privacy/synthetic-data-generation · Gegevensset: https://doi.org/10.5281/zenodo.20539026