تسلسل الجينوم وتجميعه ومعايير المرجع
يغطي هذا المجال كيفية قراءة ترتيب النيوكليوتيدات في الجينوم، وكيفية إعادة بناء الأجزاء الناتجة إلى تسلسلات متجاورة أطول، وكيفية بناء وصيانة الجينومات المرجعية المنسقة بحيث يمكن محاذاة البيانات الجديدة وتفسيرها وفقًا لمعيار مشترك. تشكل هذه الخطوات معًا الأساس التقني الذي تستند إليه جميع مجالات علم الجينوم تقريبًا.
Definition
تسلسل الجينوم هو تحديد ترتيب النيوكليوتيدات في الحمض النووي للكائن الحي؛ والتجميع هو إعادة البناء الحسابي لقراءات التسلسل المتداخلة إلى تسلسلات متجاورة أطول؛ والمعايير المرجعية هي تجميعات الجينوم المنسقة والمُحدّثة (ذات الإصدارات) والتدوينات التي يتم محاذاة بيانات التسلسل الجديدة ومقارنتها بها.
Scope
يمتد هذا المجال ليشمل كيمياء التسلسل من تسلسل سانغر ثنائي الديوكسي (Sanger dideoxy sequencing) وصولاً إلى منصات القراءة القصيرة والطويلة عالية الإنتاجية، والتجميع الحسابي للقراءات في قطع متجاورة (contigs) وسقالات (scaffolds)، وبناء وتدوين الجينومات المرجعية مثل GRCh38 وتجميع التيلومير إلى التيلومير (telomere-to-telomere assembly)، وخطوات مراقبة الجودة وتصحيح الأخطاء التي تحكم موثوقية البيانات. ويتعامل مع هذه المواضيع كمسائل منهجية وبنيوية، وليس كإجراءات سريرية.
Sub-topics
Core questions
- كيف يتم تحديد ترتيب النيوكليوتيدات في الجينوم، وكيف تطورت كيمياء التسلسل؟
- كيف يتم إعادة بناء قراءات التسلسل القصيرة أو الطويلة في جينوم كامل؟
- ما الذي يجعل تجميع الجينوم مرجعًا قابلاً للاستخدام، وكيف يتم تحديثه وتدوينه؟
- كيف يتم اكتشاف أخطاء التسلسل وقياسها وتصحيحها لضمان موثوقية التحليلات اللاحقة؟
Key concepts
- قراءة، قطعة متجاورة، وسقالة
- التغطية وعمق التسلسل
- تسلسل القراءة القصيرة مقابل تسلسل القراءة الطويلة
- التجميع من الصفر مقابل المحاذاة الموجهة بالمرجع
- الجينوم المرجعي وبناء الجينوم (مثل GRCh38)
- تدوين الجينوم
- درجة جودة كل قاعدة (Phred)
Mechanisms
تحول منصات التسلسل الحمض النووي الفيزيائي إلى قراءات قاعدية قابلة للقراءة آليًا، وكل منها مصحوب بتقدير للجودة. ولأن معظم المنصات تقرأ فقط أجزاء أقصر بكثير من الكروموسوم، يجب تجميع الأجزاء: يعيد التجميع من الصفر (de novo assembly) بناء الجينوم من تداخلات القراءات (تاريخيًا، تداخل-تخطيط-توافق، والآن غالبًا رسوم بيانية دي بروين للقراءات القصيرة)، بينما تقوم التحليلات الموجهة بالمرجع بمحاذاة القراءات مع تجميع موجود. الجينوم المرجعي هو تسلسل توافقي منسق، يتم تحديثه كبناءات متتالية ومغطى بالتدوين، ويوفر نظام الإحداثيات للمجال. تقع مراقبة الجودة وتصحيح الأخطاء عبر خط الأنابيب بأكمله، حيث تقدر الدقة لكل قاعدة وتزيل أو تصحح الأخطاء قبل تحديد المتغيرات.
Clinical relevance
تعتبر معايير التسلسل والتجميع والمرجع الموثوقة أساسًا لعلم الجينوم السريري والبحثي، حيث يعتمد تفسير المتغيرات على قراءات دقيقة محاذية لمرجع موصوف جيدًا. يصف هذا المجال البنية التحتية التي تولد الأدلة الجينومية؛ وهو مادة مرجعية وتعليمية وليس أساسًا لقرارات التشخيص أو العلاج الفردية.
Evidence & guidelines
يتم توثيق الأساليب هنا من خلال الدراسات الأولية البارزة وتقارير الكونسورتيوم بدلاً من الإرشادات السريرية: طريقة إنهاء السلسلة لسانغر (1977)، مسودة مشروع الجينوم البشري (2001)، مراجعات لمنصات الجيل التالي (ميتزكر، 2010)، والجينوم البشري الكامل من التيلومير إلى التيلومير (نورك وآخرون، 2022) تتبع مسار هذا المجال.
History
بدأ تسلسل الحمض النووي بكيمياء إنهاء السلسلة لسانغر في عام 1977، مما مكن من قراءة الجينومات الأولى ودعم مسودة تسلسل مشروع الجينوم البشري في عام 2001. أدى الارتفاع اللاحق لمنصات الإنتاجية العالية (الجيل التالي) إلى خفض التكاليف بمقادير كبيرة، ثم حلت تقنيات القراءة الطويلة لاحقًا المناطق المتكررة، وبلغت ذروتها في أول جينوم بشري كامل وخالٍ من الفجوات في عام 2022.
Key figures
- Frederick Sanger
- Eric Lander
- Michael Metzker
- Sergey Koren
- Adam Phillippy
Related topics
Seminal works
- sanger-1977
- ihgsc-2001
- metzker-2009
- nurk-2022
Frequently asked questions
- ما الفرق بين التسلسل والتجميع؟
- يقوم التسلسل بقراءة ترتيب النيوكليوتيدات في أجزاء الحمض النووي، بينما التجميع هو الخطوة الحسابية التي تعيد بناء تلك الأجزاء في تسلسلات أطول ومتجاورة مثل القطع المتجاورة، أو السقالات، أو الكروموسومات الكاملة.
- لماذا يحتاج هذا المجال إلى جينوم مرجعي؟
- يوفر الجينوم المرجعي نظام إحداثيات مشتركًا ومُحدّثًا (ذو إصدارات) بحيث يمكن محاذاة بيانات التسلسل الجديدة من الأفراد والمختبرات المختلفة ومقارنتها وتفسيرها بشكل متسق.