Machine learningPrivacy-preserving analysis

Генериране на синтетични данни за контрол на разкриването

Генерирането на синтетични данни е техника за ограничаване на статистическото разкриване, въведена от Доналд Рубин през 1993 г., при която стойностите в поверителен набор от данни се заменят с изтегляния от напасната последваща предсказваща дистрибуция, вместо да се публикуват директно. Получените изкуствени записи запазват съвкупната статистическа структура на оригиналните данни, като същевременно предотвратяват идентифицирането на реални лица, което позволява на анализаторите да работят с набор от данни, който може да бъде публикуван и който се държи като оригиналния за повечето изследователски цели.

Отворете в MethodMindСкороВидеоСкороDownload slides

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Method map

The neighbourhood of related methods — select a node to explore.

Източници

  1. Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link

Как да цитирате тази страница

ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/bg/privacy/synthetic-data-generation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Цитиран в

ScholarGateSynthetic Data Generation (Synthetic Data Generation for Disclosure Control). Извлечено на 2026-06-15 от https://scholargate.app/bg/privacy/synthetic-data-generation · Набор от данни: https://doi.org/10.5281/zenodo.20539026