Генерация синтетических данных для контроля раскрытия информации
Генерация синтетических данных — это метод статистического ограничения раскрытия информации, предложенный Дональдом Рубином в 1993 году, при котором значения в конфиденциальном наборе данных заменяются выборками из подобранного апостериорного предиктивного распределения, а не выпускаются напрямую. Полученные искусственные записи сохраняют совместную статистическую структуру исходных данных, предотвращая при этом идентификацию реальных лиц, что позволяет аналитикам работать с общедоступным набором данных, который ведет себя подобно оригиналу для большинства целей вывода.
Читать метод полностью
Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.
Method map
The neighbourhood of related methods — select a node to explore.
Источники
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Как цитировать эту страницу
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/ru/privacy/synthetic-data-generation
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Дифференциальная приватностьКонфиденциальность↔ compare
- Генеративно-состязательная сетьГлубокое обучение↔ compare
- Множественная импутацияСтатистика↔ compare
Упоминается в
Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →