Synteettisen datan generointi tietosuojan hallintaan
Synteettisen datan generointi on tilastollinen tietojenluovutuksen rajoitustekniikka, jonka Donald Rubin esitteli vuonna 1993. Siinä luottamuksellisen tietoaineiston arvoja korvataan otoksilla sovitusta posteriorisesta ennustejakaumasta sen sijaan, että ne vapautettaisiin suoraan. Tuloksena olevat keinotekoiset tietueet säilyttävät alkuperäisen datan yhteistilastollisen rakenteen samalla kun ne estävät yksittäisten henkilöiden tunnistamisen. Tämä mahdollistaa sen, että analyytikot voivat työskennellä julkisesti julkaistavan tietoaineiston kanssa, joka käyttäytyy useimmissa päättelytarkoituksissa kuin alkuperäinen.
Lue koko menetelmä
Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.
Menetelmäkartta
Lähimenetelmien naapurusto — valitse solmu tutkiaksesi.
Lähteet
- Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Näin viittaat tähän sivuun
ScholarGate. (2026, June 2). Synthetic Data Generation for Disclosure Control. ScholarGate. https://scholargate.app/fi/privacy/synthetic-data-generation
Mikä menetelmä?
Aseta tämä menetelmä lähimpien sukulaistensa rinnalle ja lue niitä yhdessä — kirjasto asettaa teokset pöydälle; valinta on sinun.
- Differentiaalinen yksityisyysYksityisyydensuoja↔ vertaa
- Generatiivinen kilpaileva verkkoSyväoppiminen↔ vertaa
- Monitahinen imputointiTilastotiede↔ vertaa
Tähän viittaavat
Huomasitko virheen tällä sivulla? Ilmoita siitä tai ehdota korjausta →