ゲノムワイド関連解析とバリアント発見
ゲノムワイド関連解析(GWAS)は、形質や疾患を持つ人々と持たない人々の間で対立遺伝子頻度が系統的に異なる位置を見つけるために、何十万から何百万もの遺伝子バリアントを多数の個人のゲノムにわたってスキャンします。どの遺伝子が関与しているかについての事前の仮説なしにゲノム全体を検査することにより、GWASは、一般的で複雑な疾患の遺伝的基盤の探索を、候補遺伝子を推測するゲームから、系統的で仮説に依存しない発見事業へと変えました。
Definition
ゲノムワイド関連解析は、表現型と遺伝子バリアント(通常は一塩基多型)との関連を検証する観察的な遺伝子研究であり、ゲノム全体にわたってジェノタイピングまたはインピュテーションされ、ゲノムワイドな有意水準をクリアしたバリアントで関連を宣言します。
Scope
この分野では、無関係な集団におけるバリアント発見を取り巻く一連の方法と概念について読者に説明します。GWASがどのように設計され分析されるか、連鎖不平衡がどのようにして疎なアレイが未タイピングのバリアントをタグ付けすることを可能にするか、なぜ多くの形質の遺伝率が当初「欠落している」ように見えたのか、祖先の違いがどのようにして偽の関連を引き起こす可能性があるのか、そして稀なバリアントのアプローチがどのようにして一般的なSNPを超えて発見を拡大するのか、といった点です。これらはゲノミクスにおける方法論的な参照トピックとして位置づけられており、診断的または処方的な臨床内容ではありません。
Sub-topics
Core questions
- 事前の候補遺伝子なしに、ゲノム全体を形質との関連についてどのように検査できるのか?
- なぜバリアントの一部をジェノタイピングするだけで、残りの情報も捉えられるのか?
- 数百万の検定において、偽陽性を制御する有意水準はどのくらいか?
- なぜ初期のGWASの発見は、推定される遺伝率のごく一部しか説明できなかったのか?
- 症例群と対照群の祖先の違いは、関連シグナルをどのように歪めるのか?
Key concepts
- コモンディジーズ・コモンバリアント仮説
- 一塩基多型(SNP)
- 連鎖不平衡とタグSNP
- ゲノムワイド有意水準(約5 x 10^-8)
- 参照パネルからのジェノタイプインピュテーション
- ポリジェニックな構造と効果量
- 集団層別化
- 欠落した遺伝率
Mechanisms
GWASは、高密度のバリアントパネルをジェノタイピングし(または配列決定された参照パネルに対してインピュテーションし)、通常は祖先やその他の共変量を調整する回帰分析を介して、各バリアントと表現型との統計的関連を検証します。近接するバリアントは連鎖不平衡のブロック内で共遺伝するため、タイピングされたマーカーは未タイピングの原因バリアントの代理(タグ)として機能することができ、したがってマーカーでの関連は、必ずしも原因バリアント自体ではなく、シグナルを特定の領域に局在させます。膨大な数の検定を行うため、偽陽性を制御するために厳格なゲノムワイドな有意水準が必要であり、発見された結果は独立したサンプルでの再現によって確認されます。発見されるバリアントのほとんどは一般的で、個々の効果は小さく、非コードの制御領域に頻繁に存在し、これは一般的な形質に対する高度に多遺伝子的な構造と一致しています。
Clinical relevance
GWASは、疾患生物学の理解、薬剤標的の優先順位付け、およびポリジェニックスコアの構築に役立つ何千もの堅牢なバリアント-形質関連を特定してきました。参照分野として、集団規模の遺伝学的証拠がどのように生成され解釈されるかを説明します。これは方法と発見を記述するものであり、個人の診断、リスクカウンセリング、または治療決定の根拠となるものではありません。
Epidemiology
2005年から2007年頃の最初の研究波以来、GWASは何千から何百万もの参加者からなるコホートで数百の疾患および量的形質に適用されており、NHGRI-EBI GWAS Catalogのようなキュレーションされたリポジトリには現在、何万もの関連が記録されています。持続的な限界は、参加者の大多数がヨーロッパ系であることであり、これは発見およびポリジェニックスコアの他の集団への移転可能性を制約しています。
Evidence & guidelines
GWASの方法論的基準は、臨床診療ガイドラインではなく、大規模なコンソーシアムの取り組みとレビューの統合を通じて確立されました。Wellcome Trust Case Control Consortiumの研究(2007年)は、共有対照、多疾患デザインの典型的な実証であり、McCarthyら(2008年)およびVisscherら(2012年、2017年)によるレビュー論文は、有意水準、品質管理、再現性、および解釈に関するコンセンサスの期待を明確に示しています。
History
このアプローチは、高密度のSNPマップとHapMapプロジェクトがゲノムワイドな連鎖不平衡を特徴づけ、2000年代半ばに手頃な価格のジェノタイピングアレイが登場したことで実現可能になりました。2007年のWellcome Trust Case Control Consortiumの研究は、共有対照に対して7つの一般的な疾患を検査し、大規模なデザインを実証し、関連マッピングの急速な拡大を促進しました。その後のレビューは、少数の遺伝子座からゲノムワイドなカタログへの分野の成熟、および欠落した遺伝率、集団の多様性、そして稀なバリアントおよび全ゲノムシーケンス研究への移行への対応を追跡しました。
Debates
- GWASは一般的な形質の遺伝率をどの程度回復できるのか?
- 初期のGWAS遺伝子座は、推定される遺伝率のごく一部しか説明せず、このギャップが未検出の多数の小効果コモンバリアント、稀なバリアント、構造的変異、または過大評価された遺伝率を反映しているのかどうかについて議論を巻き起こしました。その後の全ゲノム解析手法はギャップを縮めましたが、完全に解消するには至りませんでした。
- GWASのヨーロッパ系祖先への偏りは、公平性と妥当性を制限するか?
- 参加者のほとんどがヨーロッパ系祖先であるため、発見された関連やポリジェニックスコアは他の集団に不完全にしか適用されず、一般化可能性に関する科学的懸念と、ゲノム医療の恩恵を誰が受けるかに関する公平性の懸念の両方を生じさせています。
Key figures
- Peter Visscher
- Mark McCarthy
- Joel Hirschhorn
- Naomi Wray
- Jian Yang
Related topics
Seminal works
- wtccc-2007
- mccarthy-2008
- visscher-2012
- visscher-2017
Frequently asked questions
- GWASと連鎖解析の違いは何ですか?
- 連鎖解析は家族内でのマーカーと疾患の共分離を追跡し、広範な染色体領域を特定しますが、GWASは無関係な個体間でゲノムワイドな高解像度で関連を検証するため、小効果のコモンバリアントにより適しています。
- なぜGWASはこれほど厳格な有意水準を用いるのですか?
- 数百万のバリアントが検査されるため、従来のp値0.05では膨大な数の偽陽性が生じます。ゲノム全体にわたる独立したコモンバリアントによって暗示される多重検定を考慮すると、約5 x 10^-8のゲノムワイドな有意水準が必要となります。