ScholarGate
Asystent
Machine learningPrivacy-preserving analysis

Generowanie danych syntetycznych na potrzeby kontroli ujawnień

Generowanie danych syntetycznych jest techniką statystycznego ograniczania ujawnień, wprowadzoną przez Donalda Rubina w 1993 roku, w której wartości w poufnym zbiorze danych są zastępowane przez próbki z dopasowanego rozkładu predykcyjnego a posteriori, zamiast być udostępnianymi bezpośrednio. Powstałe sztuczne rekordy zachowują łączną strukturę statystyczną oryginalnych danych, jednocześnie zapobiegając identyfikacji rzeczywistych osób, co umożliwia analitykom pracę z publicznie udostępnianym zbiorem danych, który dla większości celów wnioskowania zachowuje się podobnie jak oryginał.

Otwórz w MethodMindWkrótceWideoWkrótcePobierz slajdy

Przeczytaj pełny opis metody

Tylko dla członków

Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.

Zaloguj się

Mapa metod

Sąsiedztwo pokrewnych metod — wybierz węzeł, aby je zgłębić.

Źródła

  1. Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link

Jak cytować tę stronę

ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/pl/privacy/synthetic-data-generation

Która metoda?

Zestaw tę metodę z najbliższymi jej krewnymi i czytaj je obok siebie — biblioteka kładzie księgi na stole; wybór należy do Ciebie.

Porównaj obok siebie

Cytowana przez

ScholarGateSynthetic Data Generation (Synthetic Data Generation for Disclosure Control). Pobrano 2026-06-15 z https://scholargate.app/pl/privacy/synthetic-data-generation · Zbiór danych: https://doi.org/10.5281/zenodo.20539026