テキスト表現・前処理
135 の手法がこの系統にあります。
注目
略語展開Abbreviation and acronym resolution is a natural-language-processing pipeline that maps each short form in a text to its full-length definition using contextual cues from the surro音響音声学Acoustic Phonetics is the study of the physical properties of speech sounds using instrumentation to measure and analyze sound waves. Pioneered by Peter Ladefoged and Kenneth Steve議論マイニングArgument mining is a natural-language-processing task that automatically detects claims, premises and the argumentative structures that link them within text. Consolidated as a fieオーディオフィンガープリンティングAudio fingerprinting is a technique for creating a compact, robust identifier (fingerprint) for audio recordings that uniquely represents the content while being tolerant to modifi著者の帰属推定(文体測定学)Authorship attribution is the task of identifying the most probable author of an anonymous or disputed text by analysing its stylistic fingerprint. Rooted in the statistical work oAutomated Essay Scoring (AES)Automated Essay Scoring (AES) is a natural-language-processing task in which a computational model assigns scores to student-written essays across dimensions such as grammatical co
学びの道筋
このトピックで最も多く参照される基礎的な手法を、発展してきた順に並べました — はじめての方はここから読み始めてください。
すべての手法 135
略語展開音響音声学議論マイニングオーディオフィンガープリンティング著者の帰属推定(文体測定学)Automated Essay Scoring (AES)自動音楽記譜法ビートトラッキングBERTファインチューニングBERTベースの分類コード認識Chronos: 時系列予測のためのトークン化基盤モデル臨床テキストマイニングCLIP共起分析コロケーション分析NLPにおける常識推論比較言語学的方法固有表現抽出 (Coreference Resolution)コーパス言語学クロスドキュメントエンティティ追跡クロスリンガル テキスト分析方言計量学直接選好最適化文書クラスタリングドメイン適応ドメイン適応型BERTベース分類ドメイン適応型固有表現認識ドメイン適応型RoBERTaベース分類ドメイン適応型感情分析ドメイン適応型Word2Vecエレクトロパラトグラフィイベント検出説明可能な固有表現認識説明可能な感情分析FastTextファインチューニングされたBERTベースの分類ファインチューニングされた固有表現認識ファインチューニングされた質問応答ファインチューニングされたRoBERTaベースの分類ファインチューニングされた文埋め込みFine-Tuned Word2Vecグロットクロノロジー(Glottochronology)GPTファインチューニングGraphRAG幻覚検出音楽における調和解析ヘイトスピーチ検出ヒルベルト・黄変換 (Hilbert-Huang Transform, HHT)HPSG情報抽出楽器認識内部再構キーワード抽出テキストからの知識グラフ構築言語識別(LID)語彙の多様性語彙置換言語的受容性評価言語的エスノグラフィーメロディ抽出ミニマリスト・プログラム形態素解析多言語RoBERTaベースの分類多言語感情分析多言語トランスフォーマーマルチモーダルBERTベース分類マルチモーダル談話分析マルチモーダル固有表現認識マルチモーダルRoBERTaベース分類マルチモーダル Word2Vec音楽ジャンル分類音楽セグメンテーション音楽類似度尺度 (Music Similarity Measure)Musical Key DetectionN400/P600分析自然言語生成否定検出オープン情報抽出最適性理論ランベルト問題(Lambert's Problem)による軌道決定パラフレーズ検出ピッチ検出アルゴリズム政治的寛容性尺度プロパガンダ検出Prototype Theory心理言語学的アイトラッキングQLoRA可読性分析関係抽出検索拡張生成(Retrieval-Augmented Generation, RAG)RoBERTaベースの分類科学テキストマイニングSelf-supervised BERT-based Classification自己教師あり固有表現認識自己教師ありRoBERTaベース分類自己教師あり感情分析自己教師あり学習によるWord2Vec意味特徴分析意味的類似性Semi-supervised BERT-based ClassificationSemi-supervised RoBERTaベース分類半教師あり感情分析半教師ありWord2Vec文埋め込み(Sentence Embeddings)スロット充填Small-World and Scale-Free Network AnalysisソーシャルメディアNLPSpeculation Detection発話行為論スペル・文法チェックSystemic Functional Linguisticsテンポ推定Text Coherence Scoringテキスト複雑性分析テキスト重複排除テキスト頻度分析テキストネットワーク分析テキスト正規化テキスト回帰テキスト分割テキスト含意TF-IDF音色分析TimeGPTタイムライン抽出BERTベースの転移学習による分類固有表現抽出(NER)における転移学習文埋め込みによる転移学習Transformer (NLP)ボーカル分離弱教師ありBERTベース分類弱教師ありRoBERTaベース分類Weakly Supervised Word2Vec外国人嫌悪尺度