ScholarGate
ผู้ช่วย

การวิเคราะห์การเสริมคุณค่าวิถีและเครือข่าย

การทดลองทางจีโนมิกส์มักจะจบลงด้วยรายการยีนจำนวนหลายสิบหรือหลายร้อยยีน ซึ่งมากเกินกว่าที่จะตีความทีละยีนได้ การวิเคราะห์การเสริมคุณค่าวิถี (Pathway enrichment analysis) ตั้งคำถามที่เจาะจงมากขึ้นว่า: เมื่อพิจารณารายการยีนนี้ มีวิถีชีวภาพหรือกระบวนการใดที่เป็นที่รู้จักซึ่งมีการแสดงออกมากกว่าที่คาดการณ์ไว้โดยบังเอิญหรือไม่? นี่คือแนวทางมาตรฐานในการเปลี่ยนจากรายการยีนไปสู่การตีความทางชีวภาพ

ค้นหาหัวข้อด้วย PaperMindเร็ว ๆ นี้Find papers & topics
Tools & resources
ดาวน์โหลดสไลด์
Learn & explore
วิดีโอเร็ว ๆ นี้

Definition

การวิเคราะห์การเสริมคุณค่าวิถี (Pathway enrichment analysis) คือกลุ่มของวิธีการทางสถิติที่ทดสอบว่ายีนที่ถูกระบุในวิถีชีวภาพหรือชุดยีนที่กำหนดไว้ มีการแสดงออกเกิน (over-represented) ในกลุ่มยีนที่เกี่ยวข้องกับการทดลองหรือไม่ ไม่ว่าจะเป็นภายในรายการที่เลือก (การวิเคราะห์การแสดงออกเกิน) หรือตลอดรายการที่จัดอันดับอย่างต่อเนื่อง (การวิเคราะห์การเสริมคุณค่าชุดยีน)

Scope

หัวข้อนี้ครอบคลุมวิธีการเสริมคุณค่าหลักสองประเภท ได้แก่ การวิเคราะห์การแสดงออกเกิน (over-representation analysis) บนรายการยีนที่เลือก และการเสริมคุณค่าชุดยีน (gene set enrichment) ในรายการที่จัดอันดับทั้งหมด พร้อมด้วยแหล่งข้อมูลวิถีที่ได้รับการดูแลจัดการซึ่งวิธีการเหล่านี้ใช้ และข้อผิดพลาดทางสถิติที่ส่งผลต่อความถูกต้องของวิธีการเหล่านี้ นี่คือข้อมูลอ้างอิงทางระเบียบวิธีวิจัยและไม่ได้ให้การตีความผลลัพธ์ทางคลินิก

Core questions

  • เมื่อมีรายการยีน วิถีหรือกระบวนการใดที่มีการแสดงออกเกินทางสถิติ?
  • การเสริมคุณค่าแบบจัดอันดับแตกต่างจากการแสดงออกเกินแบบใช้เกณฑ์อย่างไร?
  • ควรประเมินการทดสอบเทียบกับชุดยีนพื้นหลัง (อ้างอิง) ใด?
  • มีการควบคุมการทดสอบหลายครั้งและอคติความยาวหรือการเลือกอย่างไร?

Key concepts

  • การวิเคราะห์การแสดงออกเกิน (Over-representation analysis (ORA))
  • การวิเคราะห์การเสริมคุณค่าชุดยีน (Gene set enrichment analysis (GSEA))
  • ชุดยีนและฐานข้อมูลวิถี (KEGG, Reactome, GO terms)
  • ชุดยีนพื้นหลังหรืออ้างอิง
  • การแก้ไขการทดสอบหลายครั้ง
  • อคติการเลือกและความยาวในการเสริมคุณค่า RNA-seq

Mechanisms

การวิเคราะห์การแสดงออกเกิน (Over-representation analysis) จะใช้รายการยีนที่ถูกเลือกไว้แล้วโดยใช้เกณฑ์ที่กำหนด เช่น ยีนที่แสดงออกแตกต่างกัน และตั้งคำถาม โดยทั่วไปจะใช้การทดสอบแบบ hypergeometric หรือ Fisher's exact test ว่าวิถีใดมีจำนวนยีนเหล่านั้นมากกว่าที่คาดไว้เมื่อเทียบกับพื้นหลัง (background) ในทางกลับกัน การวิเคราะห์การเสริมคุณค่าชุดยีน (Gene set enrichment analysis) จะใช้รายการยีนที่จัดอันดับทั้งหมด และทดสอบว่าสมาชิกของวิถีมีแนวโน้มที่จะรวมกลุ่มกันที่ส่วนบนหรือส่วนล่างของการจัดอันดับหรือไม่ ซึ่งช่วยหลีกเลี่ยงความจำเป็นในการเลือกเกณฑ์ที่ตายตัว ทั้งสองวิธีอาศัยชุดยีนที่ได้รับการดูแลจัดการจากแหล่งข้อมูล เช่น Gene Ontology, KEGG และ Reactome ความถูกต้องขึ้นอยู่กับการเลือกพื้นหลังที่เหมาะสมและการแก้ไขสำหรับวิถีจำนวนมากที่ถูกทดสอบ สำหรับข้อมูล RNA-seq วิธีการจะต้องคำนึงถึงแนวโน้มของยีนที่ยาวกว่าหรือมีการแสดงออกสูงกว่าที่จะถูกตรวจพบว่ามีนัยสำคัญ ซึ่งเป็นอคติในการเลือกที่การทดสอบการเสริมคุณค่าที่ไม่ได้แก้ไขอาจเข้าใจผิดว่าเป็นสัญญาณทางชีวภาพ

Clinical relevance

การเสริมคุณค่าวิถี (Pathway enrichment) เป็นขั้นตอนการตีความที่เปลี่ยนผลลัพธ์ของการแสดงออกที่แตกต่างกันหรือผลลัพธ์ของตัวแปรไปสู่ข้อความเกี่ยวกับกระบวนการทางชีวภาพ และมีการใช้อย่างแพร่หลายในจีโนมิกส์เชิงแปลเพื่อสร้างสมมติฐานเชิงกลไก มันอธิบายถึงวิธีการสรุปผลลัพธ์ระดับยีนในระดับวิถี และมีวัตถุประสงค์เพื่อเป็นแนวทางอ้างอิง ไม่ใช่เป็นพื้นฐานสำหรับการตัดสินใจในการวินิจฉัยหรือการรักษาเฉพาะบุคคล

History

การตีความการทำงานในยุคแรกเริ่มนับจำนวนยีนจากรายการที่อยู่ในแต่ละหมวดหมู่คำอธิบาย ซึ่งถูกทำให้เป็นทางการในเครื่องมือการแสดงออกเกิน เช่น DAVID การวิเคราะห์การเสริมคุณค่าชุดยีน (Gene set enrichment analysis) (2005) ได้ปรับกรอบปัญหาใหม่โดยใช้รายการยีนที่จัดอันดับทั้งหมด ซึ่งพิสูจน์แล้วว่ามีความไวต่อการเปลี่ยนแปลงที่ประสานกันและละเอียดอ่อนทั่วทั้งวิถีมากขึ้น เมื่อ RNA-seq เข้ามาแทนที่ไมโครอะเรย์ วิธีการเช่น GOseq (2010) ได้แก้ไขอคติความยาวและจำนวนที่เฉพาะเจาะจงสำหรับข้อมูลการจัดลำดับ และแหล่งข้อมูลวิถีที่ได้รับการดูแลจัดการรวมถึง KEGG และ Reactome ได้กลายเป็นข้อมูลนำเข้าชุดยีนมาตรฐาน

Debates

การแสดงออกเกินเทียบกับการเสริมคุณค่าแบบจัดอันดับ
การวิเคราะห์การแสดงออกเกินต้องใช้เกณฑ์นัยสำคัญจึงทำให้ข้อมูลที่ต่ำกว่าเกณฑ์ถูกละทิ้ง ในขณะที่การเสริมคุณค่าชุดยีนใช้การจัดอันดับทั้งหมด แต่ละวิธีมีความไวและข้อสมมติฐานที่แตกต่างกัน และการเลือกอาจเปลี่ยนวิถีที่ถูกรายงาน
อคติในการเสริมคุณค่าจากข้อมูลการจัดลำดับ
ใน RNA-seq ยีนที่ยาวกว่าและมีการแสดงออกสูงกว่ามีแนวโน้มที่จะถูกระบุว่ามีนัยสำคัญ ดังนั้นการทดสอบการเสริมคุณค่าแบบง่ายๆ อาจรายงานวิถีที่เสริมคุณค่าสำหรับยีนยาวแทนที่จะเป็นชีววิทยาที่แท้จริง เว้นแต่จะมีการแก้ไขอคติการเลือกนี้

Key figures

  • Aravind Subramanian
  • Jill Mesirov
  • Da Wei Huang
  • Minoru Kanehisa

Related topics

Seminal works

  • subramanian-2005
  • huang-2009
  • kanehisa-2000
  • young-2010

Frequently asked questions

การวิเคราะห์การแสดงออกเกิน (over-representation analysis) และการวิเคราะห์การเสริมคุณค่าชุดยีน (gene set enrichment analysis) แตกต่างกันอย่างไร?
การวิเคราะห์การแสดงออกเกินจะทดสอบรายการยีนที่เลือกไว้ล่วงหน้า (เช่น ยีนที่อยู่เหนือเกณฑ์นัยสำคัญ) เพื่อหาการแสดงออกเกินของวิถี ในขณะที่การวิเคราะห์การเสริมคุณค่าชุดยีนจะใช้รายการยีนที่จัดอันดับทั้งหมดและถามว่าสมาชิกของวิถีรวมกลุ่มกันที่ปลายสุดของการจัดอันดับหรือไม่ ซึ่งหลีกเลี่ยงการใช้เกณฑ์ที่ตายตัว
เหตุใดการเลือกชุดยีนพื้นหลังจึงมีความสำคัญ?
การเสริมคุณค่าจะถูกตัดสินโดยเทียบกับชุดยีนอ้างอิง การใช้พื้นหลังที่ไม่เหมาะสม (เช่น ยีนทั้งหมดในขณะที่ตรวจพบได้เพียงบางส่วน) อาจทำให้วิถีดูเหมือนมีการเสริมคุณค่าหรือลดลงด้วยเหตุผลทางสถิติมากกว่าเหตุผลทางชีวภาพ

Methods for this concept

Related concepts