การระบุหน้าที่ของความแปรผันทางพันธุกรรม
การหาลำดับจีโนมทำให้ได้ข้อมูลความแปรผันจำนวนมากถึงล้านตำแหน่ง แต่ส่วนใหญ่ยังไม่ทราบผลกระทบ การระบุหน้าที่คือกระบวนการที่เชื่อมโยงความหมายทางชีววิทยาเข้ากับความแปรผันแต่ละตำแหน่ง — ว่าอยู่ตรงไหน มีผลต่อยีนหรือองค์ประกอบควบคุมใด และมีแนวโน้มที่จะเปลี่ยนแปลงการทำงานมากน้อยเพียงใด — เพื่อให้สามารถแยกความแปรผันที่สำคัญออกจากความแปรผันที่ไม่สำคัญจำนวนมากได้
Definition
การระบุหน้าที่ของความแปรผันทางพันธุกรรมคือการกำหนดบริบททางชีววิทยาและผลกระทบทางหน้าที่ที่คาดการณ์ไว้สำหรับความแปรผันของลำดับ รวมถึงตำแหน่งทางจีโนม ยีนหรือองค์ประกอบควบคุมที่ได้รับผลกระทบ ผลกระทบระดับโมเลกุล (เช่น missense, nonsense, splice-altering หรือ regulatory) และผลกระทบที่คาดการณ์ต่อการทำงาน
Scope
หัวข้อนี้ครอบคลุมการระบุหน้าที่ของความแปรผันแบบจุดเดียว การแทรก การลบ และการเปลี่ยนแปลงโครงสร้าง: การระบุตำแหน่งของความแปรผันที่สัมพันธ์กับยีนและบริเวณควบคุม การจำแนกผลกระทบระดับโมเลกุล และการทำนายความเสียหายสำหรับตำแหน่งที่เข้ารหัสและไม่เข้ารหัส โดยถือว่าการระบุหน้าที่เป็นระเบียบวิธีและหัวข้ออ้างอิง และไม่ได้ให้การตีความความแปรผันสำหรับกรณีทางคลินิกแต่ละราย
Core questions
- ความแปรผันอยู่ตรงไหนเมื่อเทียบกับยีน เอ็กซอน ตำแหน่งการเชื่อมต่อ และองค์ประกอบควบคุม?
- ผลกระทบระดับโมเลกุลคืออะไร — มันเปลี่ยนโปรตีน ขัดขวางการเชื่อมต่อ หรือมีผลต่อการควบคุมหรือไม่?
- ความแปรผันมีแนวโน้มที่จะเป็นอันตรายต่อการทำงานมากน้อยเพียงใด?
- จะตีความความแปรผันที่ไม่เข้ารหัสซึ่งไม่มีการเปลี่ยนแปลงโปรตีนที่ชัดเจนได้อย่างไร?
Key concepts
- ตำแหน่งของความแปรผันและการจำแนกผลกระทบ
- ความแปรผันแบบ Missense, nonsense, frameshift และ splice
- การทำนายความเสียหายสำหรับความแปรผันที่เข้ารหัส
- การระบุหน้าที่ของความแปรผันที่ไม่เข้ารหัสและควบคุม
- แหล่งข้อมูลการระบุหน้าที่อ้างอิง (แบบจำลองยีน, การอนุรักษ์, แผนที่องค์ประกอบการทำงาน)
- ตำแหน่งลักษณะเชิงปริมาณของการแสดงออกของยีน (eQTLs)
Mechanisms
ขั้นตอนแรกของกระบวนการระบุหน้าที่คือการจับคู่ความแปรผันแต่ละตำแหน่งเข้ากับจีโนมอ้างอิงและชุดแบบจำลองยีน เพื่อกำหนดตำแหน่งและผลกระทบพื้นฐาน — ว่าอยู่ในเอ็กซอนที่เข้ารหัส, ตำแหน่งการเชื่อมต่อ (splice site), บริเวณที่ไม่แปลรหัส หรือบริเวณระหว่างยีน — โดยใช้เครื่องมือเช่น ANNOVAR และ SnpEff สำหรับความแปรผันที่เข้ารหัสซึ่งเปลี่ยนกรดอะมิโน อัลกอริทึมการทำนายเช่น SIFT จะประเมินว่าการแทนที่นั้นยอมรับได้หรือก่อให้เกิดความเสียหาย โดยอาศัยการอนุรักษ์ลำดับข้ามสปีชีส์ ความแปรผันที่ไม่เข้ารหัสตีความได้ยากกว่าเนื่องจากไม่ได้เปลี่ยนโปรตีน ในกรณีนี้การระบุหน้าที่อาศัยแผนที่ขององค์ประกอบการทำงาน เช่นที่ได้จาก ENCODE และความเชื่อมโยงระหว่างความแปรผันทางพันธุกรรมกับการแสดงออกของยีน (eQTLs) ซึ่งจัดทำเป็นแคตตาล็อกโดยโครงการต่างๆ เช่น GTEx ผลลัพธ์ที่ได้คือคำอธิบายแบบหลายชั้นของความแปรผันแต่ละตำแหน่งที่สนับสนุนการจัดลำดับความสำคัญในขั้นตอนต่อไป
Clinical relevance
การระบุหน้าที่ของความแปรผันเป็นขั้นตอนพื้นฐานในการวิจัยจีโนมและในกระบวนการวิเคราะห์ที่ใช้ในการตีความข้อมูลการหาลำดับลำดับดีเอ็นเอ ซึ่งอธิบายถึงวิธีการระบุลักษณะและจัดลำดับความสำคัญของความแปรผันที่น่าสนใจ การทำนายที่ได้จากกระบวนการนี้เป็นสมมติฐานจากการคำนวณ และไม่ใช่การตัดสินความรุนแรงของโรคหรือพื้นฐานสำหรับการวินิจฉัยหรือการตัดสินใจในการรักษาแต่ละราย
History
เมื่อการหาลำดับแบบปริมาณมากทำให้ข้อมูล whole-exome และ whole-genome เป็นเรื่องปกติในช่วงปลายทศวรรษ 2000 คอขวดก็เปลี่ยนจากการสร้างความแปรผันไปสู่การตีความ ความสามารถในการทำนายโดยอาศัยการอนุรักษ์ เช่น SIFT (2009) ได้จัดการกับความแปรผันที่เข้ารหัส ในขณะที่กลไกการระบุหน้าที่ทั่วไป เช่น ANNOVAR (2010) และ SnpEff (2012) ได้จัดระบบการกำหนดผลกระทบในความแปรผันประเภทต่างๆ แคตตาล็อกองค์ประกอบการทำงานขนาดใหญ่ เช่น ENCODE (2012) และแหล่งข้อมูลการแสดงออกของยีน เช่น GTEx (2015) ได้ขยายการตีความไปยังจีโนมที่ไม่เข้ารหัส ซึ่งเป็นส่วนใหญ่ของความแปรผัน
Debates
- ควรตีความความแปรผันที่ไม่เข้ารหัสอย่างไร?
- ความแปรผันที่เข้ารหัสมีการอ่านค่าระดับโมเลกุลที่ค่อนข้างตีความได้ แต่ความแปรผันส่วนใหญ่ไม่เข้ารหัสและไม่มีผลกระทบโดยตรงต่อโปรตีน การตีความขึ้นอยู่กับแผนที่องค์ประกอบการทำงานและหลักฐาน eQTL ซึ่งความสมบูรณ์และความจำเพาะของเนื้อเยื่อยังคงเป็นข้อจำกัด
Key figures
- Kai Wang
- Pauline Ng
- Steven Henikoff
- Pablo Cingolani
Related topics
Seminal works
- kumar-2009
- wang-2010
- cingolani-2012
- encode-2012
Frequently asked questions
- การระบุหน้าที่ของความแปรผันหมายความว่าอย่างไร?
- หมายถึงการเชื่อมโยงบริบททางชีววิทยาเข้ากับความแปรผัน: ว่าอยู่ตรงไหนเมื่อเทียบกับยีนและองค์ประกอบควบคุม มีผลกระทบระดับโมเลกุลอย่างไร และมีแนวโน้มที่จะส่งผลต่อการทำงานมากน้อยเพียงใด — เพื่อให้สามารถแยกความแปรผันที่สำคัญออกจากความแปรผันที่เป็นกลางได้
- เหตุใดความแปรผันที่ไม่เข้ารหัสจึงระบุหน้าที่ได้ยากกว่าความแปรผันที่เข้ารหัส?
- ความแปรผันที่เข้ารหัสสามารถอ่านได้จากรหัสพันธุกรรมเพื่อทำนายการเปลี่ยนแปลงโปรตีน แต่ความแปรผันที่ไม่เข้ารหัสไม่มีการอ่านค่าโดยตรงเช่นนั้น การตีความอาศัยแผนที่ขององค์ประกอบควบคุมและความเชื่อมโยงระหว่างความแปรผันกับการแสดงออกของยีน ซึ่งยังไม่สมบูรณ์