랭킹 학습
랭킹 학습은 기계 학습을 적용하여 여러 특징을 결합하는 랭킹 함수를 구축하고, 레이블이 지정된 관련성 데이터 또는 사용자 피드백을 기반으로 훈련하여 단일 수동 조정 공식보다 더 나은 문서 순서를 결정합니다.
Definition
랭킹 학습은 기계 학습 방법을 사용하여 질의에 대한 문서 집합을 관련성 순으로 정렬하는 함수를 유도하는 것으로, 문서의 상대적 또는 절대적 관련성이 알려진 예제로부터 훈련되며, 점별 회귀 또는 분류, 쌍별 선호 학습, 또는 직접적인 목록별 최적화로 공식화됩니다.
Scope
이 주제는 검색을 위한 랭킹 함수 학습에 대한 지도 학습 및 피드백 기반 접근 방식을 다룹니다. 이는 점별(pointwise), 쌍별(pairwise), 목록별(listwise) 공식화, 관련성 레이블 및 클릭률 데이터의 사용, RankNet 및 경사 부스팅 랭킹 트리와 같은 대표적인 방법, 그리고 랭크 기반 지표의 최적화를 다룹니다. 랭커가 모델로서 학습되고 평가되는 방법을 다루며, 특징의 조합과 더 넓은 서비스 파이프라인은 웹 검색 랭킹에서 다룹니다.
Core questions
- 랭킹 문제는 어떻게 점별, 쌍별, 또는 목록별 학습으로 전환되는가?
- 관련성 레이블 또는 클릭률 데이터와 같은 어떤 훈련 신호가 학습을 주도하는가?
- 미분 불가능한 랭크 기반 평가 지표는 어떻게 최적화될 수 있는가?
- 많은 이질적인 특징들이 단일 학습 랭커로 어떻게 결합되는가?
- 클릭 데이터는 어떻게 편향을 유발하며, 이를 어떻게 해결할 수 있는가?
Key concepts
- 랭킹 함수
- 점별 / 쌍별 / 목록별 학습
- 관련성 레이블 및 등급별 관련성
- 클릭률 및 암묵적 피드백
- RankNet 및 경사 부스팅 트리
- 랭크 기반 손실 및 지표 최적화
- 특징 결합
- 위치 편향
Key theories
- 점별, 쌍별, 목록별 공식화
- 랭킹은 각 문서의 관련성을 독립적으로 예측함으로써(점별), 문서 쌍의 올바른 순서를 학습함으로써(쌍별), 또는 전체 결과 목록에 대한 손실을 최적화함으로써(목록별) 학습될 수 있으며, 후자는 랭크 기반 지표와 가장 직접적으로 일치합니다.
- 클릭률 데이터로부터 학습
- 사용자 클릭은 풍부하지만 편향된 암묵적 관련성 피드백을 제공합니다. 클릭을 결과 목록 내의 상대적 선호도로 취급하면 값비싼 수동 레이블뿐만 아니라 상호작용 로그로부터 랭킹 함수를 훈련할 수 있습니다.
Clinical relevance
랭킹 학습은 현대 검색 및 추천 시스템이 신호를 결합하는 표준적인 방법이며, 경사 부스팅 트리 및 신경 모델에 기반한 기계 학습 랭커는 주요 웹 검색 엔진, 전자 상거래 검색 및 광고 랭킹의 결과 순서를 결정합니다.
History
웹 검색이 많은 랭킹 신호를 축적함에 따라 수동 조정은 비실용적이 되었고, 이는 기계 학습 랭킹을 촉진했습니다. Joachims의 2002년 연구는 클릭률 데이터가 랭커를 훈련시킬 수 있음을 보여주었고, Burges와 동료들의 RankNet (2005)은 신경 쌍별 랭킹과 그 후속작인 LambdaRank 및 LambdaMART를 도입했습니다. Liu의 2009년 조사는 점별, 쌍별, 목록별 패러다임을 중심으로 분야를 통합했습니다.
Key figures
- Tie-Yan Liu
- Christopher Burges
- Thorsten Joachims
Related topics
Seminal works
- liu2009
- burges2005
- joachims2002
Frequently asked questions
- 점별, 쌍별, 목록별 랭킹 학습의 차이점은 무엇인가요?
- 점별 방법은 각 문서에 대해 독립적으로 관련성 점수를 예측합니다. 쌍별 방법은 두 문서 중 어느 것이 더 높은 순위를 차지해야 하는지 학습합니다. 목록별 방법은 전체 순위 목록에 대해 정의된 손실을 최적화합니다. 목록별 접근 방식은 사용자가 실제로 중요하게 생각하는 목록 수준 지표와 가장 밀접하게 일치합니다.
- 클릭 데이터가 편향되어 있는데 왜 사용하나요?
- 클릭은 수동 관련성 판단보다 훨씬 저렴하고 풍부하므로 대규모 훈련을 가능하게 합니다. 문제는 위치 및 표현 편향이며, 이 때문에 클릭을 상대적 선호도로 취급하고 점점 더 편향되지 않거나 반사실적 학습 보정을 적용하는 방법이 사용됩니다.