การควบคุมคุณภาพและการแก้ไขข้อผิดพลาดในการจัดลำดับเบส
การจัดลำดับเบสแต่ละครั้งจะสร้างการระบุเบสที่มีความน่าเชื่อถือแตกต่างกันไป ดังนั้น การควบคุมคุณภาพและการแก้ไขข้อผิดพลาดจึงเป็นขั้นตอนที่ใช้ในการหาปริมาณความแม่นยำของเบสแต่ละตัว กรองหรือตัดข้อมูลคุณภาพต่ำ และแก้ไขสิ่งแปลกปลอมที่เป็นระบบ ก่อนที่จะนำลำดับเบสไปประกอบหรือใช้ในการระบุความแปรผัน หากไม่มีขั้นตอนเหล่านี้ ข้อสรุปทางจีโนมิกส์ที่ได้อาจถูกบิดเบือนด้วยสัญญาณรบกวนทางเทคนิคมากกว่าชีววิทยา
Definition
การควบคุมคุณภาพในการจัดลำดับเบสคือการประเมินและปรับปรุงความน่าเชื่อถือของลำดับเบส โดยใช้คะแนนคุณภาพเบสแต่ละตัว การตัดและกรอง และวิธีการแก้ไขข้อผิดพลาด เพื่อกำจัดหรือแก้ไขสิ่งแปลกปลอมทางเทคนิค เพื่อให้การประกอบลำดับเบสและการระบุความแปรผันสะท้อนลำดับเบสที่แท้จริงมากกว่าข้อผิดพลาดในการวัด
Scope
บทความนี้ครอบคลุมการให้คะแนนคุณภาพเบสแต่ละตัว (Phred) ชนิดของข้อผิดพลาดและอคติที่ส่งผลต่อลำดับเบส การตัดและกรองลำดับเบส และบทบาทของการครอบคลุมที่ซ้ำซ้อนในการแยกแยะสัญญาณจริงออกจากข้อผิดพลาด เป็นหัวข้อระเบียบวิธีเกี่ยวกับความน่าเชื่อถือของข้อมูล และไม่ได้ให้ระเบียบปฏิบัติทางคลินิกหรือห้องปฏิบัติการ
Core questions
- ความน่าเชื่อถือของการระบุเบสแต่ละตัวถูกวัดปริมาณได้อย่างไร?
- ข้อผิดพลาดและอคติประเภทใดบ้างที่ส่งผลต่อลำดับเบส?
- การตัด การกรอง และการครอบคลุมที่ซ้ำซ้อนช่วยลดผลกระทบของข้อผิดพลาดได้อย่างไร?
Key concepts
- คะแนนคุณภาพ Phred
- ความแม่นยำในการระบุเบส
- การตัดและกรองลำดับเบส
- โปรไฟล์ข้อผิดพลาดในการจัดลำดับเบส
- การครอบคลุมและการลดข้อผิดพลาดด้วยฉันทามติ
- การตัดอะแดปเตอร์และคุณภาพ
- การควบคุมความแปรผันที่เป็นผลบวกลวง
Mechanisms
แพลตฟอร์มการจัดลำดับเบสจะกำหนดคะแนนคุณภาพ Phred ให้กับการระบุเบสแต่ละตัว ซึ่งเป็นการประมาณค่าลอการิทึมของความน่าจะเป็นที่การระบุเบสนั้นผิดพลาด ทำให้สามารถระบุเบสที่มีความเชื่อมั่นต่ำได้ เครื่องมือควบคุมคุณภาพจะตัดอะแดปเตอร์และส่วนปลายที่มีคุณภาพต่ำ และกรองลำดับเบสที่ไม่น่าเชื่อถือก่อนการวิเคราะห์ เนื่องจากข้อผิดพลาดบางส่วนเป็นแบบสุ่มและบางส่วนเป็นแบบระบบ การจัดลำดับเบสแต่ละตำแหน่งหลายครั้งจะช่วยให้สามารถสร้างฉันทามติได้ เพื่อให้ข้อผิดพลาดที่แยกออกมาถูกปฏิเสธ ในขณะที่การระบุลักษณะโปรไฟล์ข้อผิดพลาดช่วยแยกแยะสิ่งแปลกปลอมที่เกิดขึ้นซ้ำๆ ออกจากความแปรผันความถี่ต่ำที่แท้จริง ขั้นตอนเหล่านี้ช่วยลดผลบวกลวงในการระบุความแปรผันในขั้นตอนถัดไป และปรับปรุงความแม่นยำในการประกอบลำดับเบส
Clinical relevance
การควบคุมคุณภาพและการแก้ไขข้อผิดพลาดเป็นตัวกำหนดว่าผลการวิจัยทางจีโนมิกส์สะท้อนลำดับเบสที่แท้จริงหรือสัญญาณรบกวนทางเทคนิค ซึ่งมีความสำคัญอย่างยิ่งในทุกกรณีที่การจัดลำดับเบสมีผลต่อการวิจัยหรือการตีความทางคลินิก บทความนี้เป็นเอกสารอ้างอิงทางการศึกษาเกี่ยวกับความน่าเชื่อถือของข้อมูล และไม่ถือเป็นแนวทางสำหรับ การทดสอบเฉพาะ หรือการตัดสินใจทางคลินิกใดๆ
Evidence & guidelines
วิธีการเหล่านี้ได้รับการบันทึกไว้ในเอกสารเครื่องมือหลักและเอกสารการวิเคราะห์มากกว่าแนวทางปฏิบัติทางคลินิก: Ewing et al. (1998) ได้กำหนดคะแนนคุณภาพ Phred ต่อเบส, Bolger et al. (2014) เป็นเครื่องมือตัดลำดับเบสที่ใช้กันอย่างแพร่หลาย, และ Ma et al. (2019) ได้ระบุลักษณะโปรไฟล์ข้อผิดพลาดในข้อมูลการจัดลำดับเบสเชิงลึก; บทวิจารณ์เช่น Sims et al. (2014) เชื่อมโยงการครอบคลุมกับการควบคุมข้อผิดพลาด
History
การให้คะแนนคุณภาพเบสแต่ละตัวได้รับการกำหนดอย่างเป็นทางการด้วยโปรแกรม Phred ในปี 1998 ซึ่งให้ข้อมูลการจัดลำดับเบสด้วยมาตรวัดมาตรฐานที่ตีความได้ของความเชื่อมั่นในการระบุเบสซึ่งกลายเป็นสากล เมื่อแพลตฟอร์มที่มีปริมาณงานสูงผลิตลำดับเบสจำนวนมาก เครื่องมือตัดและกรองเฉพาะทางได้เกิดขึ้นในช่วงปี 2010 และการวิเคราะห์โปรไฟล์ข้อผิดพลาดอย่างละเอียดได้ปรับปรุงวิธีการแยกความแปรผันความถี่ต่ำที่แท้จริงออกจากสิ่งแปลกปลอมในการจัดลำดับเบสที่เป็นระบบ
Key figures
- Phil Green
- Brent Ewing
- Björn Usadel
Related topics
Seminal works
- ewing-1998
- bolger-2014
- ma-2019
Frequently asked questions
- คะแนนคุณภาพ Phred คืออะไร?
- เป็นการวัดค่าลอการิทึมของความน่าจะเป็นโดยประมาณที่การระบุเบสไม่ถูกต้อง ตัวอย่างเช่น คะแนน Phred ที่ 30 สอดคล้องกับโอกาสเกิดข้อผิดพลาดประมาณ 1 ใน 1000 ดังนั้นคะแนนที่สูงขึ้นจึงบ่งชี้ถึงการระบุเบสที่น่าเชื่อถือมากขึ้น
- การจัดลำดับเบสตำแหน่งเดียวกันหลายครั้งช่วยลดข้อผิดพลาดได้อย่างไร?
- เมื่อตำแหน่งหนึ่งถูกครอบคลุมด้วยลำดับเบสอิสระหลายตัว ข้อผิดพลาดแบบสุ่มในลำดับเบสแต่ละตัวสามารถถูกปฏิเสธโดยเสียงข้างมาก ดังนั้นการสร้างฉันทามติจากลำดับเบสเหล่านั้นจะให้การระบุเบสที่แม่นยำกว่าลำดับเบสเดี่ยวๆ