Compara mètodes

Revisa els mètodes seleccionats l'un al costat de l'altre; les files que difereixen es ressalten.

	Avaluació del Risc de Divulgació ×	k-Anonimat: Protecció de la privadesa individual en dades publicades ×	Generació de dades sintètiques per al control de la divulgació ×
Camp	Privadesa	Privadesa	Privadesa
Família≠	Regression model	Machine learning	Machine learning
Any d'origen≠	1989	2002	1993
Autor original≠	George Duncan & Diane Lambert	Latanya Sweeney	Donald Rubin
Tipus≠	Probabilistic risk model	Privacy-preserving data transformation	Privacy-preserving data synthesis
Font seminal≠	Duncan, G. T., & Lambert, D. (1989). The risk of disclosure for microdata. Journal of Business & Economic Statistics, 7(2), 207–217. DOI ↗	Sweeney, L. (2002). k-anonymity: A model for protecting privacy. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 10(5), 557–570. DOI ↗	Rubin, D. B. (1993). Statistical disclosure limitation. Journal of Official Statistics, 9(2), 461–468. link ↗
Àlies	Microdata Disclosure Risk, Statistical Disclosure Control Risk Estimation, Istatistiksel Açıklama Riski Değerlendirmesi, Re-identification Risk Assessment	k-Anonymization, k-Anonymous Microdata, Quasi-Identifier Suppression Model, k-Anonimlik	Fully Synthetic Data, Partial Synthetic Data, Statistical Data Synthesis, Sentetik Veri Üretimi
Relacionats≠	3	2	3
Resum≠	Disclosure Risk Assessment is a probabilistic framework introduced by Duncan and Lambert (1989) for quantifying how likely it is that releasing microdata — individual-level records from surveys or administrative files — will allow an outside party to identify a specific respondent or infer sensitive attributes. It is used by statistical agencies, data custodians, and researchers charged with protecting confidentiality before any public release of person-level datasets.	k-Anonymity is a formal privacy model introduced by Latanya Sweeney in 2002 to protect individuals when personal data is released for research or public use. It requires that every record in a published dataset be indistinguishable from at least k−1 other records with respect to a designated set of quasi-identifying attributes — such as age, gender, and ZIP code — preventing re-identification by linking released data to external sources.	Synthetic data generation is a statistical disclosure limitation technique introduced by Donald Rubin in 1993, in which values in a confidential dataset are replaced by draws from a fitted posterior predictive distribution rather than released directly. The resulting artificial records preserve the joint statistical structure of the original data while preventing the identification of real individuals, enabling analysts to work with a publicly releasable dataset that behaves like the original for most inferential purposes.
ScholarGateConjunt de dades ↗	v1 1 Fonts PUBLISHED	v1 1 Fonts PUBLISHED	v1 1 Fonts PUBLISHED

Ves a la cerca → Baixa les diapositives