การวิเคราะห์การเสริมคุณค่าวิถีและเครือข่าย
การทดลองทางจีโนมิกส์มักจะจบลงด้วยรายการยีนจำนวนหลายสิบหรือหลายร้อยยีน ซึ่งมากเกินกว่าที่จะตีความทีละยีนได้ การวิเคราะห์การเสริมคุณค่าวิถี (Pathway enrichment analysis) ตั้งคำถามที่เจาะจงมากขึ้นว่า: เมื่อพิจารณารายการยีนนี้ มีวิถีชีวภาพหรือกระบวนการใดที่เป็นที่รู้จักซึ่งมีการแสดงออกมากกว่าที่คาดการณ์ไว้โดยบังเอิญหรือไม่? นี่คือแนวทางมาตรฐานในการเปลี่ยนจากรายการยีนไปสู่การตีความทางชีวภาพ
Definition
การวิเคราะห์การเสริมคุณค่าวิถี (Pathway enrichment analysis) คือกลุ่มของวิธีการทางสถิติที่ทดสอบว่ายีนที่ถูกระบุในวิถีชีวภาพหรือชุดยีนที่กำหนดไว้ มีการแสดงออกเกิน (over-represented) ในกลุ่มยีนที่เกี่ยวข้องกับการทดลองหรือไม่ ไม่ว่าจะเป็นภายในรายการที่เลือก (การวิเคราะห์การแสดงออกเกิน) หรือตลอดรายการที่จัดอันดับอย่างต่อเนื่อง (การวิเคราะห์การเสริมคุณค่าชุดยีน)
Scope
หัวข้อนี้ครอบคลุมวิธีการเสริมคุณค่าหลักสองประเภท ได้แก่ การวิเคราะห์การแสดงออกเกิน (over-representation analysis) บนรายการยีนที่เลือก และการเสริมคุณค่าชุดยีน (gene set enrichment) ในรายการที่จัดอันดับทั้งหมด พร้อมด้วยแหล่งข้อมูลวิถีที่ได้รับการดูแลจัดการซึ่งวิธีการเหล่านี้ใช้ และข้อผิดพลาดทางสถิติที่ส่งผลต่อความถูกต้องของวิธีการเหล่านี้ นี่คือข้อมูลอ้างอิงทางระเบียบวิธีวิจัยและไม่ได้ให้การตีความผลลัพธ์ทางคลินิก
Core questions
- เมื่อมีรายการยีน วิถีหรือกระบวนการใดที่มีการแสดงออกเกินทางสถิติ?
- การเสริมคุณค่าแบบจัดอันดับแตกต่างจากการแสดงออกเกินแบบใช้เกณฑ์อย่างไร?
- ควรประเมินการทดสอบเทียบกับชุดยีนพื้นหลัง (อ้างอิง) ใด?
- มีการควบคุมการทดสอบหลายครั้งและอคติความยาวหรือการเลือกอย่างไร?
Key concepts
- การวิเคราะห์การแสดงออกเกิน (Over-representation analysis (ORA))
- การวิเคราะห์การเสริมคุณค่าชุดยีน (Gene set enrichment analysis (GSEA))
- ชุดยีนและฐานข้อมูลวิถี (KEGG, Reactome, GO terms)
- ชุดยีนพื้นหลังหรืออ้างอิง
- การแก้ไขการทดสอบหลายครั้ง
- อคติการเลือกและความยาวในการเสริมคุณค่า RNA-seq
Mechanisms
การวิเคราะห์การแสดงออกเกิน (Over-representation analysis) จะใช้รายการยีนที่ถูกเลือกไว้แล้วโดยใช้เกณฑ์ที่กำหนด เช่น ยีนที่แสดงออกแตกต่างกัน และตั้งคำถาม โดยทั่วไปจะใช้การทดสอบแบบ hypergeometric หรือ Fisher's exact test ว่าวิถีใดมีจำนวนยีนเหล่านั้นมากกว่าที่คาดไว้เมื่อเทียบกับพื้นหลัง (background) ในทางกลับกัน การวิเคราะห์การเสริมคุณค่าชุดยีน (Gene set enrichment analysis) จะใช้รายการยีนที่จัดอันดับทั้งหมด และทดสอบว่าสมาชิกของวิถีมีแนวโน้มที่จะรวมกลุ่มกันที่ส่วนบนหรือส่วนล่างของการจัดอันดับหรือไม่ ซึ่งช่วยหลีกเลี่ยงความจำเป็นในการเลือกเกณฑ์ที่ตายตัว ทั้งสองวิธีอาศัยชุดยีนที่ได้รับการดูแลจัดการจากแหล่งข้อมูล เช่น Gene Ontology, KEGG และ Reactome ความถูกต้องขึ้นอยู่กับการเลือกพื้นหลังที่เหมาะสมและการแก้ไขสำหรับวิถีจำนวนมากที่ถูกทดสอบ สำหรับข้อมูล RNA-seq วิธีการจะต้องคำนึงถึงแนวโน้มของยีนที่ยาวกว่าหรือมีการแสดงออกสูงกว่าที่จะถูกตรวจพบว่ามีนัยสำคัญ ซึ่งเป็นอคติในการเลือกที่การทดสอบการเสริมคุณค่าที่ไม่ได้แก้ไขอาจเข้าใจผิดว่าเป็นสัญญาณทางชีวภาพ
Clinical relevance
การเสริมคุณค่าวิถี (Pathway enrichment) เป็นขั้นตอนการตีความที่เปลี่ยนผลลัพธ์ของการแสดงออกที่แตกต่างกันหรือผลลัพธ์ของตัวแปรไปสู่ข้อความเกี่ยวกับกระบวนการทางชีวภาพ และมีการใช้อย่างแพร่หลายในจีโนมิกส์เชิงแปลเพื่อสร้างสมมติฐานเชิงกลไก มันอธิบายถึงวิธีการสรุปผลลัพธ์ระดับยีนในระดับวิถี และมีวัตถุประสงค์เพื่อเป็นแนวทางอ้างอิง ไม่ใช่เป็นพื้นฐานสำหรับการตัดสินใจในการวินิจฉัยหรือการรักษาเฉพาะบุคคล
History
การตีความการทำงานในยุคแรกเริ่มนับจำนวนยีนจากรายการที่อยู่ในแต่ละหมวดหมู่คำอธิบาย ซึ่งถูกทำให้เป็นทางการในเครื่องมือการแสดงออกเกิน เช่น DAVID การวิเคราะห์การเสริมคุณค่าชุดยีน (Gene set enrichment analysis) (2005) ได้ปรับกรอบปัญหาใหม่โดยใช้รายการยีนที่จัดอันดับทั้งหมด ซึ่งพิสูจน์แล้วว่ามีความไวต่อการเปลี่ยนแปลงที่ประสานกันและละเอียดอ่อนทั่วทั้งวิถีมากขึ้น เมื่อ RNA-seq เข้ามาแทนที่ไมโครอะเรย์ วิธีการเช่น GOseq (2010) ได้แก้ไขอคติความยาวและจำนวนที่เฉพาะเจาะจงสำหรับข้อมูลการจัดลำดับ และแหล่งข้อมูลวิถีที่ได้รับการดูแลจัดการรวมถึง KEGG และ Reactome ได้กลายเป็นข้อมูลนำเข้าชุดยีนมาตรฐาน
Debates
- การแสดงออกเกินเทียบกับการเสริมคุณค่าแบบจัดอันดับ
- การวิเคราะห์การแสดงออกเกินต้องใช้เกณฑ์นัยสำคัญจึงทำให้ข้อมูลที่ต่ำกว่าเกณฑ์ถูกละทิ้ง ในขณะที่การเสริมคุณค่าชุดยีนใช้การจัดอันดับทั้งหมด แต่ละวิธีมีความไวและข้อสมมติฐานที่แตกต่างกัน และการเลือกอาจเปลี่ยนวิถีที่ถูกรายงาน
- อคติในการเสริมคุณค่าจากข้อมูลการจัดลำดับ
- ใน RNA-seq ยีนที่ยาวกว่าและมีการแสดงออกสูงกว่ามีแนวโน้มที่จะถูกระบุว่ามีนัยสำคัญ ดังนั้นการทดสอบการเสริมคุณค่าแบบง่ายๆ อาจรายงานวิถีที่เสริมคุณค่าสำหรับยีนยาวแทนที่จะเป็นชีววิทยาที่แท้จริง เว้นแต่จะมีการแก้ไขอคติการเลือกนี้
Key figures
- Aravind Subramanian
- Jill Mesirov
- Da Wei Huang
- Minoru Kanehisa
Related topics
Seminal works
- subramanian-2005
- huang-2009
- kanehisa-2000
- young-2010
Frequently asked questions
- การวิเคราะห์การแสดงออกเกิน (over-representation analysis) และการวิเคราะห์การเสริมคุณค่าชุดยีน (gene set enrichment analysis) แตกต่างกันอย่างไร?
- การวิเคราะห์การแสดงออกเกินจะทดสอบรายการยีนที่เลือกไว้ล่วงหน้า (เช่น ยีนที่อยู่เหนือเกณฑ์นัยสำคัญ) เพื่อหาการแสดงออกเกินของวิถี ในขณะที่การวิเคราะห์การเสริมคุณค่าชุดยีนจะใช้รายการยีนที่จัดอันดับทั้งหมดและถามว่าสมาชิกของวิถีรวมกลุ่มกันที่ปลายสุดของการจัดอันดับหรือไม่ ซึ่งหลีกเลี่ยงการใช้เกณฑ์ที่ตายตัว
- เหตุใดการเลือกชุดยีนพื้นหลังจึงมีความสำคัญ?
- การเสริมคุณค่าจะถูกตัดสินโดยเทียบกับชุดยีนอ้างอิง การใช้พื้นหลังที่ไม่เหมาะสม (เช่น ยีนทั้งหมดในขณะที่ตรวจพบได้เพียงบางส่วน) อาจทำให้วิถีดูเหมือนมีการเสริมคุณค่าหรือลดลงด้วยเหตุผลทางสถิติมากกว่าเหตุผลทางชีวภาพ
Methods for this concept
- Pathway Enrichment Analysis
- Gene Set Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Network-based gene set enrichment analysis
- Differential pathway enrichment analysis
- Bayesian Gene Set Enrichment Analysis
- Network-based pathway enrichment analysis
- Machine learning-assisted pathway enrichment analysis