Generowanie danych syntetycznych na potrzeby kontroli ujawnień
Generowanie danych syntetycznych jest techniką statystycznego ograniczania ujawnień, wprowadzoną przez Donalda Rubina w 1993 roku, w której wartości w poufnym zbiorze danych są zastępowane przez próbki z dopasowanego rozkładu predykcyjnego a posteriori, zamiast być udostępnianymi bezpośrednio. Powstałe sztuczne rekordy zachowują łączną strukturę statystyczną oryginalnych danych, jednocześnie zapobiegając identyfikacji rzeczywistych osób, co umożliwia analitykom pracę z publicznie udostępnianym zbiorem danych, który dla większości celów wnioskowania zachowuje się podobnie jak oryginał.
Przeczytaj pełny opis metody
Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.
Mapa metod
Sąsiedztwo pokrewnych metod — wybierz węzeł, aby je zgłębić.
Źródła
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Jak cytować tę stronę
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/pl/privacy/synthetic-data-generation
Która metoda?
Zestaw tę metodę z najbliższymi jej krewnymi i czytaj je obok siebie — biblioteka kładzie księgi na stole; wybór należy do Ciebie.
- Prywatność różnicowaPrywatność↔ porównaj
- Generatywna Sieć AntagonistycznaUczenie głębokie↔ porównaj
- Uzupełnianie wielokrotneStatystyka↔ porównaj
Cytowana przez
Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →