ScholarGate
助手

算法公平性与偏见

算法公平性关注自动化决策系统如何以及是否公平对待个体和群体,以及数据和模型如何编码或放大偏见。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

对自动化决策系统中公平和歧视的研究,包括偏见的衡量以及公平待遇的形式和伦理概念。

Scope

本主题涵盖数据和机器学习系统中偏见的来源、相互竞争的公平性形式定义(例如人口统计学均等、均等化赔率和校准)、表明这些定义可能冲突的不可能性结果、统计公平性与实质正义之间的关系,以及自动化决策在招聘、贷款和刑事司法等领域造成的社会后果。它描述了技术和伦理辩论,但并未规定任何系统应采用何种公平性标准。

Core questions

  • 偏见和歧视如何进入数据驱动的决策系统?
  • 算法“公平”意味着什么?相互竞争的定义能否同时满足?
  • 统计学上的公平性概念与法律和道德上的正义概念有何关联?
  • 自动化系统产生的歧视性结果由谁负责?

Key theories

数据驱动系统中的不同影响
Barocas和Selbst分析了数据挖掘如何在没有歧视意图的情况下,通过有偏见的训练数据、代理变量和特征选择产生歧视性结果。
公平性标准的不兼容性
形式化研究表明,不同的统计学公平性定义——例如校准和跨群体的平衡错误率——通常不能同时满足,除非在特殊情况下,这迫使人们做出带有价值判断的选择。

History

随着机器学习系统被部署到具有重要影响的场景中,对算法公平性的关注在2010年代中期逐渐增加。Barocas和Selbst在2016年对不同影响的分析、计算机科学界提出的形式化公平性定义以及O'Neil等人的流行批判确立了该领域的核心问题。

Debates

应采用哪种公平性定义
由于形式化的公平性标准可能相互冲突,争论的焦点在于是否存在单一的合适定义,如何在特定情境中进行选择,以及形式化指标是否能完全捕捉实质正义。

Key figures

  • Solon Barocas
  • Andrew Selbst
  • Cynthia Dwork
  • Cathy O'Neil

Related topics

Seminal works

  • barocas2016
  • oneil2016

Frequently asked questions

即使算法忽略受保护属性,它也可能存在偏见吗?
是的。移除种族或性别等属性并不能保证公平性,因为其他特征可以作为它们的代理,这是关于不同影响讨论的核心现象。
算法公平性是否存在一个单一的正确定义?
目前没有共识。已经提出了几种形式化的定义,结果表明它们可能相互不兼容,因此选择其中一个涉及有争议的伦理和政治判断。

Methods for this concept

Related concepts