Генериране на синтетични данни за контрол на разкриването
Генерирането на синтетични данни е техника за ограничаване на статистическото разкриване, въведена от Доналд Рубин през 1993 г., при която стойностите в поверителен набор от данни се заменят с изтегляния от напасната последваща предсказваща дистрибуция, вместо да се публикуват директно. Получените изкуствени записи запазват съвкупната статистическа структура на оригиналните данни, като същевременно предотвратяват идентифицирането на реални лица, което позволява на анализаторите да работят с набор от данни, който може да бъде публикуван и който се държи като оригиналния за повечето изследователски цели.
Прочетете целия метод
Влезте с безплатен профил, за да прочетете този раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Източници
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Как да цитирате тази страница
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/bg/privacy/synthetic-data-generation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Диференциална поверителностПоверителност↔ compare
- Генеративна състезателна мрежаДълбоко обучение↔ compare
- Множествена импутацияСтатистика↔ compare
Цитиран в
Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →