Syntetisk datagenerering til kontrol af oplysninger
Syntetisk datagenerering er en statistisk teknik til begrænsning af oplysninger, introduceret af Donald Rubin i 1993, hvor værdier i et fortroligt datasæt erstattes med trækninger fra en tilpasset posterior prædiktiv fordeling i stedet for at blive frigivet direkte. De resulterende kunstige optegnelser bevarer den oprindelige datasætets fælles statistiske struktur, samtidig med at identifikation af virkelige individer forhindres, hvilket gør det muligt for analytikere at arbejde med et offentligt tilgængeligt datasæt, der opfører sig som det oprindelige til de fleste inferentielle formål.
Læs hele metoden
Log ind med en gratis konto for at læse dette afsnit.
Method map
The neighbourhood of related methods — select a node to explore.
Kilder
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Sådan citerer du denne side
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/da/privacy/synthetic-data-generation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Differential PrivacyPrivatlivsbeskyttelse↔ compare
- Generativ modstridende netværkDyb læring↔ compare
- Multiple ImputationStatistik↔ compare
Refereret af
Har du fundet en fejl på denne side? Indberet den eller foreslå en rettelse →