Machine learningPrivacy-preserving analysis

Generování syntetických dat pro kontrolu zveřejnění

Generování syntetických dat je technika statistického omezení zveřejnění zavedená Donaldem Rubinem v roce 1993, při níž jsou hodnoty v důvěrném datovém souboru nahrazeny výběry z adjustované posteriorní prediktivní distribuce namísto přímého zveřejnění. Výsledné umělé záznamy zachovávají společnou statistickou strukturu původních dat a zároveň zabraňují identifikaci skutečných jednotlivců, což umožňuje analytikům pracovat s veřejně uvolnitelným datovým souborem, který se pro většinu inferenčních účelů chová jako originál.

Otevřít v MethodMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link

Jak citovat tuto stránku

ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/cs/privacy/synthetic-data-generation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazuje sem

ScholarGateSynthetic Data Generation (Synthetic Data Generation for Disclosure Control). Získáno 2026-06-15 z https://scholargate.app/cs/privacy/synthetic-data-generation · Datová sada: https://doi.org/10.5281/zenodo.20539026