依存構造解析
単語間のラベル付き主従関係として文構造を分析するものであり、遷移ベースおよびグラフベースのアルゴリズムが用いられ、Universal Dependenciesの標準の下で多言語間で適用されることが増えている。
PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
Learn & explore
動画近日公開
Definition
依存構造解析は、各単語がラベル付けされた文法関係によってその統語的ヘッドにリンクされる有向グラフを文に割り当てるものである。
Scope
依存構文表現、遷移ベース解析(オラクルを用いたシフト・リデュース)、グラフベース解析(最大全域木)、投射性、および一貫した多言語ツリーバンクを可能にするUniversal Dependenciesのアノテーションスキームを扱う。アタッチメントスコアによる評価についても言及する。構成素解析およびより広範な形式主義については、関連トピックで扱われる。
Core questions
- 遷移ベースパーサーはどのようにして依存木を段階的に構築するのか?
- グラフベース解析はどのようにして最大全域木として最適な木を見つけるのか?
- 投射性とは何か、そしてそれが解析を複雑にするのはなぜか?
- Universal Dependenciesはどのようにして言語間でアノテーションを比較可能にするのか?
Key concepts
- 依存関係
- ヘッドと依存項
- 遷移ベース解析
- グラフベース解析
- 投射性
- 最大全域木
- Universal Dependencies
- アタッチメントスコア
Key theories
- 遷移ベース依存構造解析
- 学習された分類器によって選択されるシフトおよびリデュースアクションのシーケンスによって依存木を構築し、線形時間解析を達成する。
- Universal Dependencies
- 依存関係の多言語間で一貫したインベントリとアノテーションガイドラインであり、ツリーバンクとパーサーを言語間で比較および転送することを可能にする。
History
依存文法はテニエールの中世20世紀の業績に遡るが、その計算形式は2000年代にNivreの遷移ベースパーサーとMcDonaldのグラフベースパーサーによって成熟した。2010年代半ばに開始されたUniversal Dependenciesプロジェクトは、100以上の言語にわたるアノテーションを統一した。
Debates
- 遷移ベース解析対グラフベース解析
- 遷移ベースパーサーは高速であるが局所的な誤りを犯す可能性があり、グラフベースパーサーはより高いコストでグローバルに最適化する。ニューラルメソッドはこのトレードオフを狭めたが、解消はしていない。
Key figures
- Joakim Nivre
- Ryan McDonald
- Marie-Catherine de Marneffe
- Lucien Tesnière
Related topics
Seminal works
- nivre2008
- demarneffe2021
- kubler2009
Frequently asked questions
- 投射性とは何を意味しますか?
- 依存木は、そのアークが文の上に交差することなく描画できる場合に投射的である。自由語順言語で一般的な非投射的構造は、交差する依存関係を許容する解析アルゴリズムを必要とする。