ランキング学習
ランキング学習は、機械学習を適用して、多くの特徴量を組み合わせるランキング関数を構築する手法です。これは、ラベル付けされた関連性データやユーザーフィードバックに基づいて訓練され、単一の手動調整された式よりも優れたドキュメントの順序付けを実現します。
Definition
ランキング学習とは、機械学習手法を用いて、クエリに対する一連のドキュメントを関連性に基づいて順序付ける関数を導出することです。これは、ドキュメントの相対的または絶対的な関連性が既知である例から訓練され、ポイントワイズ回帰または分類、ペアワイズ選好学習、あるいは直接的なリストワイズ最適化として定式化されます。
Scope
このトピックでは、検索のためのランキング関数を学習するための教師ありアプローチとフィードバック駆動型アプローチについて扱います。ポイントワイズ、ペアワイズ、リストワイズの定式化、関連性ラベルとクリックデータ(clickthrough data)の使用、RankNetや勾配ブースティングランキングツリーなどの代表的な手法、およびランクベースの評価指標の最適化について説明します。ランカーがモデルとしてどのように学習され評価されるかを扱い、特徴量の組み立てとより広範な提供パイプラインについては、ウェブ検索ランキングの項目で扱います。
Core questions
- ランキング問題は、ポイントワイズ、ペアワイズ、リストワイズ学習としてどのように定式化されるのでしょうか?
- 関連性ラベルやクリックデータなどのどのような訓練シグナルが学習を推進するのでしょうか?
- 微分不可能なランクベースの評価指標はどのように最適化できるのでしょうか?
- 多くの異種の特徴量は、単一の学習されたランカーにどのように統合されるのでしょうか?
- クリックデータはどのようにバイアスを導入し、どのように対処できるのでしょうか?
Key concepts
- ランキング関数
- ポイントワイズ / ペアワイズ / リストワイズ学習
- 関連性ラベルと段階的関連性
- クリックデータと暗黙的フィードバック
- RankNetと勾配ブースティングツリー
- ランクベースの損失と指標最適化
- 特徴量結合
- 位置バイアス
Key theories
- ポイントワイズ、ペアワイズ、リストワイズの定式化
- ランキングは、各ドキュメントの関連性を独立して予測すること(ポイントワイズ)、ドキュメントペアの正しい順序付けを学習すること(ペアワイズ)、または結果リスト全体に対する損失を最適化すること(リストワイズ)によって学習できます。後者はランクベースの指標と最も直接的に整合します。
- クリックデータからの学習
- ユーザーのクリックは豊富ですがバイアスのある暗黙的な関連性フィードバックを提供します。クリックを結果リスト内の相対的な選好として扱うことで、高価な手動ラベルだけでなく、インタラクションログからランキング関数を訓練することが可能になります。
Clinical relevance
ランキング学習は、現代の検索システムやレコメンデーションシステムがシグナルを組み合わせる標準的な方法であり、勾配ブースティングツリーやニューラルモデルに基づく機械学習されたランカーは、主要なウェブ検索エンジン、Eコマース検索、および広告ランキングの結果順序付けを推進しています。
History
ウェブ検索が多くのランキングシグナルを蓄積するにつれて、手動調整は非現実的になり、機械学習によるランキングが動機付けられました。Joachimsの2002年の研究は、クリックデータがランカーを訓練できることを示し、BurgesらのRankNet(2005年)はニューラルペアワイズランキングとその派生であるLambdaRankおよびLambdaMARTを導入しました。そして、Liuの2009年の調査は、ポイントワイズ、ペアワイズ、リストワイズのパラダイムを中心にこの分野を統合しました。
Key figures
- Tie-Yan Liu
- Christopher Burges
- Thorsten Joachims
Related topics
Seminal works
- liu2009
- burges2005
- joachims2002
Frequently asked questions
- ポイントワイズ、ペアワイズ、リストワイズのランキング学習の違いは何ですか?
- ポイントワイズ手法は、各ドキュメントの関連性スコアを独立して予測します。ペアワイズ手法は、2つのドキュメントのうちどちらが上位にランクされるべきかを学習します。リストワイズ手法は、ランク付けされたリスト全体で定義された損失を最適化します。リストワイズアプローチは、ユーザーが実際に重視するリストレベルの指標と最も密接に整合します。
- クリックデータはバイアスがあるのに、なぜ使用するのですか?
- クリックは手動の関連性判断よりもはるかに安価で豊富であるため、大規模な訓練を可能にします。問題は位置バイアスと提示バイアスであり、そのためクリックを相対的な選好として扱い、バイアス除去学習や反事実学習の補正を適用する手法が増えています。