Генерація синтетичних даних для контролю розкриття інформації
Генерація синтетичних даних — це техніка статистичного обмеження розкриття інформації, запроваджена Дональдом Рубіном у 1993 році, за якою значення в конфіденційному наборі даних замінюються вибірками з припасованого апостеріорного предиктивного розподілу, а не випускаються безпосередньо. Отримані штучні записи зберігають спільну статистичну структуру вихідних даних, запобігаючи при цьому ідентифікації реальних осіб, що дозволяє аналітикам працювати з загальнодоступним набором даних, який поводиться подібно до вихідного для більшості цілей висновування.
Читати метод повністю
Увійдіть із безкоштовним обліковим записом, щоб прочитати цей розділ.
Карта методів
Околиця споріднених методів — виберіть вузол, щоб дослідити.
Джерела
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Як цитувати цю сторінку
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/uk/privacy/synthetic-data-generation
Який метод?
Поставте цей метод поруч із його найближчими спорідненими й читайте їх пліч-о-пліч — бібліотека викладає книги на стіл; вибір за вами.
- Диференційна приватністьКонфіденційність↔ порівняти
- Генеративно-змагальна мережаГлибоке навчання↔ порівняти
- Множинне імпутуванняСтатистика↔ порівняти
Згадується в
Помітили помилку на цій сторінці? Повідомте про неї або запропонуйте виправлення →