コピー数多型:検出と分類
コピー数多型(CNV)とは、参照ゲノムと比較して、重複による増加または欠失による減少によって、個体間で異なる数のコピーが存在するDNAセグメントのことです。CNVは構造的変異の主要な構成要素であり、アレイまたはシーケンスデータからCNVを確実に検出する方法、およびサイズ、コピー状態、および可能性のある重要性によってCNVを分類する方法が、中心的な方法論的課題となります。
Definition
コピー数多型とは、慣例的に1キロベース以上のDNAセグメントであり、参照ゲノムと比較して存在するコピー数が異なるもので、欠失(コピー損失)または重複もしくは高次増幅(コピーゲイン)として生じます。
Scope
このトピックでは、CNVとは何か、CNVの検出とサイズ決定に用いられる主要な技術(アレイ比較ゲノムハイブリダイゼーション、SNPアレイ、シーケンスからのリード深度またはペアエンドシグナル)、およびCNVが分類される基準(ゲイン対ロス、コピー数、再発性、頻度)について説明します。これは検出と分類の概念に関する参照的な記述であり、個人の診断的解釈を提供するものではありません。
Core questions
- コピー数多型は他の構造変異とどのように区別されますか?
- ハイブリダイゼーション強度、リード深度、ペアエンドおよびスプリットリードの証拠のうち、どのシグナルがCNVの検出に使用されますか?
- CNVはコピー状態、サイズ、再発性、集団頻度によってどのように分類されますか?
- 各検出プラットフォームの分解能の限界と誤検出の原因は何ですか?
Key concepts
- コピーゲイン(重複)とコピーロス(欠失)
- アレイ比較ゲノムハイブリダイゼーション(aCGH)
- SNPアレイのlog R比とBアレル頻度
- リード深度およびペアエンド検出
- ブレークポイントの解像度
- 再発性CNVと非再発性CNV
- 集団頻度と良性対病原性分類
Mechanisms
CNV検出は、DNA用量の物理的変化を測定可能なシグナルに変換します。アレイ比較ゲノムハイブリダイゼーションおよびSNPアレイは相対的なハイブリダイゼーション強度を読み取るため、欠失は影響を受ける領域全体でシグナルを低下させ、重複はシグナルを上昇させます。SNPアレイは、コピー状態を区別するのに役立つアレル比情報も追加します。シーケンスベースのアプローチは、リード深度からコピー数を推測します。重複領域ではより多くのリードが蓄積され、欠失領域ではより少ないリードが蓄積されます。また、不一致のペアエンドアライメントおよびスプリットリードのアライメントを使用してブレークポイントを特定します。分類では、コピー状態、サイズ、アーキテクチャによって定義されたブレークポイントでバリアントが再発するかどうか、および参照集団におけるその頻度を組み合わせます。
Clinical relevance
コピー数解析は、ゲノムのゲインとロスを特徴づけるために健康科学で広く使用されており、一般的な良性CNVとまれな用量変化イベントを区別することは、ゲノムデータを解釈する上で中心的な課題です。この項目では、CNVがどのように検出され、方法論的な問題として分類されるかを説明しており、個人の診断や管理の根拠となるものではありません。
Epidemiology
初期のゲノムワイド調査により、CNVが健常者によく見られることが確立されました。Sebatらは最初に広範なコピー数多型を示し、RedonらはHapMap集団におけるグローバルCNVをマッピングしました。1000 Genomes構造変異マップを含むその後のシーケンスベースのカタログは、頻度を洗練し、欠失と重複が合わせて可変ゲノムの大部分を占めることを示しました。
History
健常者の間でコピー数が広範に変動するという認識は、2004年にSebatおよびIafrateらのアレイ研究から生まれ、そのような変動はまれであるという仮定を覆しました。アレイプラットフォームからの全ゲノムCNVマップは2006年に続き、その後の10年間におけるハイスループットシーケンスへの移行は、ブレークポイントの解像度を向上させ、CNVの検出を一般的な構造変異の発見に統合するリード深度およびペアエンド法をもたらしました。
Debates
- 検出プラットフォームの違いはどのように調整されるべきですか?
- アレイとシーケンスベースの検出器は、重複するが同一ではないCNVセットを報告し、サイズ分解能、ブレークポイント精度、反復領域における感度が異なるため、プラットフォーム間の検出結果と頻度を調和させることは、依然として認識されている方法論的課題です。
Key figures
- Jonathan Sebat
- Stephen W. Scherer
- Charles Lee
- Evan E. Eichler
- Nigel P. Carter
Related topics
Seminal works
- sebat-2004
- redon-2006
- alkan-2011
Frequently asked questions
- CNVと欠失の違いは何ですか?
- 欠失はコピー数多型の一種(コピー損失)です。CNVという用語はより広範であり、重複や高次のコピーゲインも含まれるため、関連するサイズのすべての欠失はCNVですが、すべてのCNVが欠失であるわけではありません。
- なぜ2つのプラットフォームが同じサンプルに対して異なるCNVを報告するのですか?
- アレイ法とシーケンス法は、分解能、ブレークポイント精度、反復領域内の感度が異なるため、重複するが同一ではないバリアントのセットを検出し、同じイベントのサイズを異なる方法で決定する可能性があります。
Methods for this concept
- Copy Number Variation Analysis
- Machine learning-assisted copy number variation analysis
- Bayesian Copy Number Variation Analysis
- Differential Copy Number Variation Analysis
- Single-cell Copy Number Variation Analysis
- Variant Calling
- Time-series copy number variation analysis
- Network-based copy number variation analysis