即使算法忽略受保护属性，它也可能存在偏见吗？

是的。移除种族或性别等属性并不能保证公平性，因为其他特征可以作为它们的代理，这是关于不同影响讨论的核心现象。

算法公平性是否存在一个单一的正确定义？

目前没有共识。已经提出了几种形式化的定义，结果表明它们可能相互不兼容，因此选择其中一个涉及有争议的伦理和政治判断。

算法公平性关注自动化决策系统如何以及是否公平对待个体和群体，以及数据和模型如何编码或放大偏见。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

对自动化决策系统中公平和歧视的研究，包括偏见的衡量以及公平待遇的形式和伦理概念。

本主题涵盖数据和机器学习系统中偏见的来源、相互竞争的公平性形式定义（例如人口统计学均等、均等化赔率和校准）、表明这些定义可能冲突的不可能性结果、统计公平性与实质正义之间的关系，以及自动化决策在招聘、贷款和刑事司法等领域造成的社会后果。它描述了技术和伦理辩论，但并未规定任何系统应采用何种公平性标准。

数据驱动系统中的不同影响: Barocas和Selbst分析了数据挖掘如何在没有歧视意图的情况下，通过有偏见的训练数据、代理变量和特征选择产生歧视性结果。
公平性标准的不兼容性: 形式化研究表明，不同的统计学公平性定义——例如校准和跨群体的平衡错误率——通常不能同时满足，除非在特殊情况下，这迫使人们做出带有价值判断的选择。

随着机器学习系统被部署到具有重要影响的场景中，对算法公平性的关注在2010年代中期逐渐增加。Barocas和Selbst在2016年对不同影响的分析、计算机科学界提出的形式化公平性定义以及O'Neil等人的流行批判确立了该领域的核心问题。

应采用哪种公平性定义: 由于形式化的公平性标准可能相互冲突，争论的焦点在于是否存在单一的合适定义，如何在特定情境中进行选择，以及形式化指标是否能完全捕捉实质正义。

即使算法忽略受保护属性，它也可能存在偏见吗？: 是的。移除种族或性别等属性并不能保证公平性，因为其他特征可以作为它们的代理，这是关于不同影响讨论的核心现象。
算法公平性是否存在一个单一的正确定义？: 目前没有共识。已经提出了几种形式化的定义，结果表明它们可能相互不兼容，因此选择其中一个涉及有争议的伦理和政治判断。