Generování syntetických dat pro kontrolu zveřejnění
Generování syntetických dat je technika statistického omezení zveřejnění zavedená Donaldem Rubinem v roce 1993, při níž jsou hodnoty v důvěrném datovém souboru nahrazeny výběry z adjustované posteriorní prediktivní distribuce namísto přímého zveřejnění. Výsledné umělé záznamy zachovávají společnou statistickou strukturu původních dat a zároveň zabraňují identifikaci skutečných jednotlivců, což umožňuje analytikům pracovat s veřejně uvolnitelným datovým souborem, který se pro většinu inferenčních účelů chová jako originál.
Přečíst celou metodu
Pro přečtení této sekce se přihlaste s bezplatným účtem.
Method map
The neighbourhood of related methods — select a node to explore.
Zdroje
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Jak citovat tuto stránku
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/cs/privacy/synthetic-data-generation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Diferenciální soukromíSoukromí↔ compare
- Generativní adversariální síťHluboké učení↔ compare
- Vícenásobná imputaceStatistika↔ compare
Odkazuje sem
Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →