なぜ集団層別化は誤った関連を引き起こすのか？

症例と対照の祖先が異なる場合、祖先グループ間で単純に頻度が異なるバリアントは、疾患リスクも祖先によって異なる場合に、疾患と関連しているように見えることがある。したがって、この関連はバリアントの因果的効果ではなく、祖先による交絡を反映している。

現代の研究では、集団構造をどのように補正しているのか？

一般的なアプローチでは、ゲノムワイドデータから祖先を推定し、それを調整する。例えば、祖先の主成分を共変量として含めたり、検定統計量を再スケーリングするためにゲノム制御を適用したり、血縁関係と構造を考慮する混合モデルを使用したりする。

集団層別化と混血

集団層別化とは、遺伝学的研究において比較される群間で遺伝的祖先に系統的な違いが存在することであり、混血とは、以前は分離していた集団に由来する個体内で祖先が混ざり合うことである。これらはいずれも集団構造を生み出し、遺伝的関連研究を交絡させ、対立遺伝子頻度と疾患リスクの両方が祖先によって異なるという理由だけで、バリアントと疾患の間に見せかけの関連を生成する可能性がある。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

スライドをダウンロード

Learn & explore

動画近日公開

Definition

集団層別化とは、集団間の祖先の違いによって引き起こされる遺伝的関連研究における交絡であり、対立遺伝子頻度と疾患リスクの両方がサブポピュレーション間で異なる場合に生じる。混血とは、個人内に2つ以上の歴史的に異なる集団からの遺伝的祖先が存在することであり、関連する構造の源である。

Scope

このトピックは、集団構造がどのように生じるか、それが症例対照遺伝的関連研究をどのように交絡させるか、そしてそれを検出および調整するために使用される主要な方法を扱う。これは、研究の妥当性に関わる遺伝疫学における方法論的な主題として提示されており、ヒト集団グループの生物学やランキングに関する記述ではない。

Core questions

遺伝学的研究において比較されるグループは、同じ基礎集団から抽出されているか？
見かけのバリアントと疾患の関連は、因果関係ではなく祖先によって説明できるか？
遺伝子データから集団構造をどのように検出できるか？
集団構造が偽陽性を膨らませないように、関連検定をどのように調整できるか？

Key concepts

祖先による交絡
集団構造と下位構造
混血
対立遺伝子頻度の違い
ゲノム制御
祖先の主成分分析
血縁関係のための混合モデル

Mechanisms

関連研究において症例と対照の祖先が異なる場合、それらの祖先グループ間で頻度が異なるバリアントは、疾患リスクもグループ間で異なる場合に、そのバリアントに因果的役割がない場合でも、疾患と関連しているように見える。これは古典的な交絡であり、遺伝的祖先が交絡因子となる。この問題に対処する方法としては、祖先を測定し調整することが挙げられる。ゲノム制御は、多くのマーカーから推定されたインフレーションファクターを用いて検定統計量を再スケーリングする。主成分分析は、ゲノムワイドな遺伝子型から祖先を要約し、それらの主成分を共変量として含める。混合モデルは、広範な構造と隠れた血縁関係の両方を考慮する。個人が混合祖先を持つ混血は、局所的または全体的な祖先を推定する関連アプローチで処理できる。

Clinical relevance

集団構造を制御することは、慢性疾患リスクの理解を深める遺伝的関連エビデンスの妥当性にとって不可欠である。なぜなら、制御されていない層別化は、その後の研究を誤導する誤った関連を生み出す可能性があるからである。この項目は、参照トピックとして、研究の妥当性に対する脅威と、それに対処する方法を説明するものであり、個別の遺伝子検査や解釈に関するガイダンスを提供するものではない。

Epidemiology

集団層別化に関する懸念は、遺伝的関連研究が大規模化するにつれて高まった。なぜなら、症例と対照の間のわずかな祖先の違いでさえ、ゲノムワイド研究で検査される多数のバリアント全体で偽陽性率を膨らませる可能性があるからである。ゲノム制御、そしてその後の主成分分析および混合モデルによる調整の開発により、偽陽性率を制御しながら、大規模な多祖先関連研究が可能になった。

History

祖先が関連研究を交絡させる可能性があるという認識はゲノム時代以前からあったが、実用的な解決策は1990年代後半から2000年代にかけて現れた。PritchardとRosenbergは、層別化を検出するために非連鎖マーカーを使用することを提案し、DevlinとRoederは、膨張した検定統計量を補正するためにゲノム制御を導入した。そしてPriceらは2006年に、主成分分析がゲノムワイド関連研究における層別化を効率的に補正できることを示し、このアプローチが標準的な実践となった。

Debates

統計的調整は、祖先による交絡をどの程度完全に除去できるか？: ゲノム制御、主成分分析、および混合モデルは、集団構造によるインフレーションを低減するが、微細なスケールまたは最近の構造による残余交絡、およびこれらの補正が多様な混血集団にどの程度うまく適用されるかについて議論が続いている。

Key figures

Jonathan Pritchard
Noah Rosenberg
Bernie Devlin
Kathryn Roeder
Alkes Price
David Reich

Seminal works

pritchard-rosenberg-1999
devlin-roeder-1999
price-2006

Frequently asked questions

なぜ集団層別化は誤った関連を引き起こすのか？: 症例と対照の祖先が異なる場合、祖先グループ間で単純に頻度が異なるバリアントは、疾患リスクも祖先によって異なる場合に、疾患と関連しているように見えることがある。したがって、この関連はバリアントの因果的効果ではなく、祖先による交絡を反映している。
現代の研究では、集団構造をどのように補正しているのか？: 一般的なアプローチでは、ゲノムワイドデータから祖先を推定し、それを調整する。例えば、祖先の主成分を共変量として含めたり、検定統計量を再スケーリングするためにゲノム制御を適用したり、血縁関係と構造を考慮する混合モデルを使用したりする。