Machine learningPrivacy-preserving analysis

Generovanie syntetických dát na účely kontroly zverejnenia

Generovanie syntetických dát je technika štatistického obmedzenia zverejnenia, ktorú v roku 1993 zaviedol Donald Rubin. Pri tejto technike sa hodnoty v dôvernom datasete nahrádzajú výbermi z nasadenej posteriórnej prediktívnej distribúcie namiesto ich priameho zverejnenia. Výsledné umelé záznamy zachovávajú spoločnú štatistickú štruktúru pôvodných údajov a zároveň bránia identifikácii skutočných osôb, čo umožňuje analytikom pracovať s verejne zverejniteľným datasete, ktorý sa pre väčšinu inferenčných účelov správa ako pôvodný.

Otvoriť v MethodMindČoskoroVideoČoskoroDownload slides

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Method map

The neighbourhood of related methods — select a node to explore.

Zdroje

  1. Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link

Ako citovať túto stránku

ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/sk/privacy/synthetic-data-generation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Odkazujú sem

ScholarGateSynthetic Data Generation (Synthetic Data Generation for Disclosure Control). Získané 2026-06-15 z https://scholargate.app/sk/privacy/synthetic-data-generation · Dátová sada: https://doi.org/10.5281/zenodo.20539026