ScholarGate
アシスタント

ゲノムバリアントの機能アノテーション

ゲノムシーケンスは数百万のバリアントを生成しますが、そのほとんどは結果が不明です。機能アノテーションは、各バリアントに生物学的意味を付与するプロセスです。具体的には、バリアントがどこに位置するか、どの遺伝子または制御要素に影響を与えるか、機能に変化をもたらす可能性がどの程度あるかを特定し、重要な少数のバリアントを重要でない多数のバリアントから区別できるようにします。

PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
スライドをダウンロード
Learn & explore
動画近日公開

Definition

ゲノムバリアントの機能アノテーションとは、配列バリアントに生物学的文脈と予測される機能的結果を割り当てることです。これには、ゲノム上の位置、影響を受ける遺伝子または制御要素、分子学的影響(ミスセンス、ナンセンス、スプライス改変、または制御など)、および機能への予測される影響が含まれます。

Scope

このトピックでは、一塩基バリアント、挿入、欠失、および構造変化のアノテーションについて扱います。これには、遺伝子および制御領域に対するバリアントの位置特定、その分子学的結果の分類、およびコーディング領域と非コーディング領域における有害性の予測が含まれます。アノテーションを方法論的および参照的な主題として扱い、個々の臨床症例に対するバリアント解釈は提供しません。

Core questions

  • バリアントは遺伝子、エクソン、スプライス部位、および制御要素に対してどこに位置しますか?
  • その分子学的結果は何ですか — タンパク質を変化させますか、スプライシングを阻害しますか、それとも調節に影響を与えますか?
  • そのバリアントが機能に有害である可能性はどのくらいですか?
  • 単純なタンパク質変化の読み出しを欠く非コーディングバリアントはどのように解釈できますか?

Key concepts

  • バリアントの位置と結果の分類
  • ミスセンス、ナンセンス、フレームシフト、およびスプライスバリアント
  • コーディングバリアントの有害性予測
  • 非コーディングおよび制御バリアントのアノテーション
  • 参照アノテーションソース(遺伝子モデル、保存性、機能要素マップ)
  • 発現量的形質遺伝子座(eQTLs)

Mechanisms

アノテーションパイプラインは、まず各バリアントを参照ゲノムと遺伝子モデルのセットにマッピングし、ANNOVARやSnpEffなどのツールを使用して、その位置と基本的な結果(コーディングエクソン、スプライス部位、非翻訳領域、または遺伝子間領域のどこに位置するか)を決定します。アミノ酸を変化させるコーディングバリアントの場合、SIFTなどの予測アルゴリズムは、種間の配列保存性に基づいて、置換が許容されるか有害であるかを推定します。非コーディングバリアントはタンパク質を変化させないため、解釈がより困難です。ここでは、ENCODEのような機能要素のマップや、GTExのようなプロジェクトによってカタログ化された遺伝子バリアントと遺伝子発現(eQTLs)の間の関連性に基づいてアノテーションが行われます。出力は、下流の優先順位付けをサポートする各バリアントの多層的な記述です。

Clinical relevance

バリアントアノテーションは、ゲノム研究およびシーケンスデータを解釈するために使用される分析パイプラインにおける基礎的なステップです。これは、候補バリアントがどのように特徴付けられ、優先順位付けされるかを記述します。それが生成する予測は計算上の仮説であり、それ自体が病原性の決定や個々の診断または治療決定の根拠となるものではありません。

History

2000年代後半にハイスループットシーケンスによって全エクソームおよび全ゲノムデータが日常的になるにつれて、ボトルネックはバリアントの生成からその解釈へと移行しました。SIFT(2009年)のような保存性に基づく予測因子はコーディングバリアントに対応し、ANNOVAR(2010年)やSnpEff(2012年)のような汎用アノテーションエンジンは、バリアントタイプ全体にわたる結果の割り当てを体系化しました。その後、ENCODE(2012年)のような大規模な機能要素カタログや、GTEx(2015年)のような発現リソースは、解釈を非コーディングゲノム(バリアントの大部分を占める)にまで拡大しました。

Debates

非コーディングバリアントはどのように解釈されるべきですか?
コーディングバリアントは比較的解釈可能な分子学的読み出しを持っていますが、ほとんどのバリアントは非コーディングであり、直接的なタンパク質への影響を欠いています。その解釈は、機能要素マップとeQTLエビデンスに依存しますが、それらの完全性と組織特異性は依然として限界があります。

Key figures

  • Kai Wang
  • Pauline Ng
  • Steven Henikoff
  • Pablo Cingolani

Related topics

Seminal works

  • kumar-2009
  • wang-2010
  • cingolani-2012
  • encode-2012

Frequently asked questions

バリアントをアノテーションするとはどういう意味ですか?
それは、バリアントに生物学的文脈を付与することを意味します。具体的には、遺伝子や制御要素に対してどこに位置するか、どのような分子学的結果をもたらすか、そして機能に影響を与える可能性がどの程度あるかを特定し、重要なバリアントを中立的なバリアントと区別できるようにします。
非コーディングバリアントがコーディングバリアントよりもアノテーションが難しいのはなぜですか?
コーディングバリアントは遺伝暗号に基づいてタンパク質変化を予測できますが、非コーディングバリアントにはそのような直接的な読み出しがありません。それらの解釈は、制御要素のマップやバリアントと遺伝子発現との関連性に依存しますが、これらはまだ不完全です。

Methods for this concept

Related concepts