ScholarGate
Avustaja
Machine learningPrivacy-preserving analysis

Synteettisen datan generointi tietosuojan hallintaan

Synteettisen datan generointi on tilastollinen tietojenluovutuksen rajoitustekniikka, jonka Donald Rubin esitteli vuonna 1993. Siinä luottamuksellisen tietoaineiston arvoja korvataan otoksilla sovitusta posteriorisesta ennustejakaumasta sen sijaan, että ne vapautettaisiin suoraan. Tuloksena olevat keinotekoiset tietueet säilyttävät alkuperäisen datan yhteistilastollisen rakenteen samalla kun ne estävät yksittäisten henkilöiden tunnistamisen. Tämä mahdollistaa sen, että analyytikot voivat työskennellä julkisesti julkaistavan tietoaineiston kanssa, joka käyttäytyy useimmissa päättelytarkoituksissa kuin alkuperäinen.

Avaa sovelluksessa MethodMindTulossaVideoTulossaLataa diat

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Menetelmäkartta

Lähimenetelmien naapurusto — valitse solmu tutkiaksesi.

Lähteet

  1. Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link

Näin viittaat tähän sivuun

ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/fi/privacy/synthetic-data-generation

Mikä menetelmä?

Aseta tämä menetelmä lähimpien sukulaistensa rinnalle ja lue niitä yhdessä — kirjasto asettaa teokset pöydälle; valinta on sinun.

Vertaa rinnakkain

Tähän viittaavat

ScholarGateSynthetic Data Generation (Synthetic Data Generation for Disclosure Control). Haettu 2026-06-15 osoitteesta https://scholargate.app/fi/privacy/synthetic-data-generation · Aineisto: https://doi.org/10.5281/zenodo.20539026