教師なし学習
教師なし学習は、ラベル付けされていないデータから構造を発見し、ターゲットとなる出力がなくても、グループ化、低次元表現、潜在因子を見つけ出します。
PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
Learn & explore
動画近日公開
Definition
教師なし学習とは、入力のみから構造を推論するものであり、関連するターゲット値は存在しません。アルゴリズムは、クラスター割り当て、低次元座標、または観測されたデータがどのように発生したかを説明する生成的な潜在変数など、データのコンパクトな記述を探索します。
Scope
この分野は、ラベルのないデータからの学習を扱います。具体的には、グループへのクラスタリング、次元削減と多様体学習、期待値最大化アルゴリズムによって適合される潜在変数モデルと混合モデル、密度推定、そしてデータ自体から学習シグナルを生成する現代の自己教師あり学習と表現学習が含まれます。
Sub-topics
Core questions
- ラベルのないデータからどのような構造を回復できるか?
- 自然なグループ分けやクラスターはどのように定義され、発見されるか?
- 高次元データを少数の座標で要約するにはどうすればよいか?
- 潜在変数モデルは、隠れた原因を通じて観測をどのように説明するか?
Key theories
- 潜在変数モデルとEMアルゴリズム
- 多くの教師なしモデルは、データを生成する隠れた変数を仮定し、期待値最大化アルゴリズムは、潜在変数の推論と尤度を増加させるためのパラメータ更新を交互に行うことで、それらを適合させます。
- 次元削減
- 主成分分析や多様体学習などの手法は、最も重要な変動を保持する低次元表現を見つけ、可視化、圧縮、ノイズ削減を可能にします。
- クラスタリング構造
- クラスタリングは、類似する項目をグループに分割するものであり、クラスター内距離、確率的混合、または密度を通じて様々に形式化されますが、クラスターの適切な数や形状に対する単一の定義はありません。
Clinical relevance
教師なし学習は、ラベルが不足しているか存在しない場合に不可欠であり、顧客セグメンテーション、異常検出、探索的データ分析、および現代の教師ありシステムや言語システムを強化する表現の事前学習をサポートします。正解となるターゲットがないため、教師なし学習の結果を評価すること自体が微妙で重要な問題となります。
History
教師なし学習は、統計学におけるクラスタリングや因子分析、自己組織化ニューラルネットワークにルーツを持っています。1977年に形式化された期待値最大化アルゴリズムは、潜在変数モデルの適合を統一し、近年では自己教師あり表現学習が、ラベルなしデータに対する大規模モデルの事前学習における主要なパラダイムとなっています。
Debates
- 教師なし学習の結果をどのように評価するか
- ラベルがないため、単一の正解は存在せず、クラスタリングや学習された表現の評価は、間接的な基準、下流タスクのパフォーマンス、または人間の解釈に依存し、異なる妥当性尺度が異なる結果を示す可能性があります。
Key figures
- Arthur Dempster
- Donald Rubin
- Geoffrey Hinton
- Christopher Bishop
Related topics
Seminal works
- bishop2006
- hastie2009
- dempster1977
Frequently asked questions
- モデルはラベルなしでどのように学習できるのか?
- 教師なし学習手法は、どの点が近いか、どの方向が最も変動が大きいか、どの潜在因子が観測を生成したかなど、データにすでに存在する構造を利用します。データ自身の規則性がシグナルを提供します。
- 教師なし学習の評価が難しいのはなぜか?
- 比較すべき正解となるターゲットがないため、成功は間接的に判断されます。例えば、クラスターの解釈可能性や、学習された表現が後の教師ありタスクにどれだけ役立つかなどです。異なる基準では、同じ結果が異なる評価を受ける可能性があります。