Genomics Chức năng và Phân tích Đường dẫn
Genomics chức năng không chỉ đặt câu hỏi về những gì được ghi trong bộ gen mà còn về chức năng của các trình tự đó — cách các gen, yếu tố điều hòa và sản phẩm của chúng đóng góp vào chức năng tế bào và cơ thể. Phân tích đường dẫn là lớp diễn giải đặt danh sách các gen hoặc biến thể vào ngữ cảnh của các đường dẫn sinh học, bản thể học và mạng lưới đã biết, biến các phát hiện bộ gen thô thành các giả thuyết sinh học có thể kiểm chứng.
Definition
Genomics chức năng là nghiên cứu về chức năng gen và bộ gen — các hoạt động và tương tác của các bản phiên mã, protein và các yếu tố điều hòa — ở quy mô bộ gen, trong khi phân tích đường dẫn là tập hợp các phương pháp tính toán diễn giải kết quả bộ gen theo các đường dẫn sinh học, bản thể học và mạng lưới phân tử được quản lý.
Scope
Lĩnh vực này định hướng người đọc qua các ngành giải thích dữ liệu bộ gen một cách sinh học: chú thích các hậu quả chức năng của các biến thể, kiểm tra xem các tập hợp gen có được làm giàu trong các đường dẫn xác định hay không, tổ chức chức năng gen thông qua các từ vựng được kiểm soát và cơ sở dữ liệu được quản lý, mô hình hóa gen và protein dưới dạng mạng lưới tương tác, và suy luận chức năng giữa các loài bằng quan hệ tương đồng. Đây là một tổng quan tham khảo và giáo dục, không phải là một giao thức hay hướng dẫn lâm sàng.
Sub-topics
Core questions
- Một gen, biến thể hoặc yếu tố bộ gen nhất định thực hiện chức năng sinh học nào?
- Khi một nghiên cứu đưa ra một danh sách các gen, những đường dẫn hoặc quá trình sinh học nào được biểu hiện quá mức?
- Làm thế nào để mô tả chức năng gen bằng một từ vựng nhất quán, có thể đọc được bằng máy?
- Các gen và protein tương tác như các hệ thống chứ không phải riêng lẻ như thế nào?
- Làm thế nào để chức năng được thiết lập ở một sinh vật có thể được chuyển sang một sinh vật khác bằng mối quan hệ tiến hóa?
Key concepts
- Diễn giải kiểu gen-kiểu hình
- Chú thích chức năng
- Làm giàu và biểu hiện quá mức tập hợp gen
- Từ vựng và bản thể học được kiểm soát
- Các đường dẫn sinh học và mạng lưới phản ứng
- Mạng lưới tương tác phân tử
- Quan hệ tương đồng và bảo tồn chức năng tiến hóa
Mechanisms
Diễn giải chức năng liên kết nhiều lớp. Chú thích cấp độ trình tự dự đoán hậu quả phân tử của một biến thể, ví dụ liệu nó có làm thay đổi một trình tự mã hóa protein hay một vùng điều hòa hay không, dựa trên các tài nguyên như danh mục các yếu tố chức năng trên toàn bộ gen được tạo ra bởi các tập đoàn lớn. Diễn giải cấp độ gen tổng hợp nhiều gen thành các đường dẫn và kiểm tra xem một kết quả có tập trung vào các quá trình sinh học cụ thể hay không, bằng cách biểu hiện quá mức trong một danh sách được chọn hoặc bằng cách làm giàu trên một danh sách gen được xếp hạng đầy đủ. Các từ vựng được kiểm soát như Gene Ontology cung cấp các thuật ngữ chung giúp các thử nghiệm này có thể tái tạo, và các cơ sở dữ liệu đường dẫn được quản lý cung cấp các bản đồ phản ứng và quá trình. Cuối cùng, các phương pháp mạng lưới và so sánh mô hình hóa các mối quan hệ giữa các gen — tương tác vật lý, liên kết chức năng và mối quan hệ tương đồng giữa các loài — để chức năng có thể được lan truyền và các cơ chế bệnh tật được hiểu là sự nhiễu loạn của các hệ thống được kết nối.
Clinical relevance
Genomics chức năng và phân tích đường dẫn là nền tảng cho cách các phát hiện bộ gen được diễn giải trong nghiên cứu và các thiết lập chuyển dịch: ưu tiên các biến thể ứng cử viên, giải thích tại sao một tập hợp các gen bị rối loạn chức năng lại chỉ ra một quá trình sinh học cụ thể, và định hình bệnh tật như một hiện tượng mạng lưới. Lĩnh vực này mô tả cách ý nghĩa sinh học được trích xuất từ dữ liệu bộ gen và được dùng làm tài liệu tham khảo định hướng, không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.
History
Genomics chức năng phát triển từ kỷ nguyên giải trình tự bộ gen vào cuối những năm 1990 và những năm 2000, khi các trình tự bộ gen hoàn chỉnh tạo ra nhu cầu diễn giải hàng ngàn gen cùng một lúc. Gene Ontology (2000) đã giới thiệu một từ vựng thống nhất cho chức năng gen, KEGG (2000) hệ thống hóa kiến thức đường dẫn, và phân tích làm giàu tập hợp gen (2005) cung cấp một khung thống kê để đọc toàn bộ hồ sơ biểu hiện. Các danh mục lớn các yếu tố chức năng như ENCODE (2012) đã mở rộng diễn giải sang các vùng không mã hóa, và y học mạng lưới (2011) đã định hình lại bệnh tật như là kết quả của các mạng lưới phân tử bị nhiễu loạn.
Key figures
- Michael Ashburner
- Minoru Kanehisa
- Aravind Subramanian
- Albert-László Barabási
Related topics
Seminal works
- ashburner-2000
- kanehisa-2000
- subramanian-2005
- encode-2012
Frequently asked questions
- Genomics chức năng khác với genomics cấu trúc hoặc giải trình tự như thế nào?
- Giải trình tự và genomics cấu trúc xác định những gì bộ gen chứa và cách nó được tổ chức; genomics chức năng đặt câu hỏi về chức năng của các trình tự đó — các hoạt động và tương tác của gen, yếu tố điều hòa và sản phẩm của chúng ở quy mô bộ gen.
- Phân tích đường dẫn được sử dụng để làm gì?
- Phân tích đường dẫn diễn giải một danh sách hoặc xếp hạng các gen hoặc biến thể bằng cách kiểm tra xem các đường dẫn sinh học, thuật ngữ bản thể học hoặc mạng lưới đã biết có được biểu hiện quá mức hay không, giúp biến một kết quả bộ gen thành một giả thuyết sinh học.
Methods for this concept
- Pathway Enrichment Analysis
- Network-based pathway enrichment analysis
- Machine learning-assisted pathway enrichment analysis
- Network-based gene set enrichment analysis
- Bayesian Pathway Enrichment Analysis
- Differential pathway enrichment analysis
- Multi-omics Pathway Enrichment Analysis
- Gene Set Enrichment Analysis