功能基因组学与通路分析
功能基因组学不仅探究基因组中“写了什么”,更关注这些序列“做了什么”——基因、调控元件及其产物如何促进细胞和有机体功能。通路分析是解释层,它将基因或变异列表置于已知生物学通路、本体和网络的背景中,将原始基因组发现转化为可检验的生物学假设。
Definition
功能基因组学是在基因组尺度上研究基因和基因组功能——转录本、蛋白质和调控元件的活动和相互作用;而通路分析是一套计算方法,用于根据精选的生物学通路、本体和分子网络来解释基因组结果。
Scope
本领域旨在引导读者了解生物学解释基因组数据的各个学科:注释变异的功能后果,测试基因集是否在特定通路中富集,通过受控词汇和精选数据库组织基因功能,将基因和蛋白质建模为相互作用的网络,以及通过直系同源性推断跨物种的功能。它是一个参考和教育性概述,而非协议或临床指南。
Sub-topics
Core questions
- 给定基因、变异或基因组元件执行何种生物学功能?
- 当一项研究产生基因列表时,哪些通路或生物学过程过度代表?
- 如何用一致的、机器可读的词汇描述基因功能?
- 基因和蛋白质如何作为系统而非孤立地相互作用?
- 如何通过进化关系将在一个生物体中确定的功能转移到另一个生物体?
Key concepts
- 基因型到表型解释
- 功能注释
- 基因集富集和过度代表性
- 受控词汇和本体论
- 生物学通路和反应网络
- 分子相互作用网络
- 直系同源性和功能的进化保守性
Mechanisms
功能解释涉及多个层面。序列层面的注释预测变异的分子后果,例如它是否改变蛋白质编码序列或调控区域,这依赖于大型联盟生成的全基因组功能元件目录等资源。基因层面的解释将许多基因聚合到通路中,并测试结果是否集中在特定的生物学过程中,这可以通过选定列表中的过度代表性或在完整排序基因列表中的富集来实现。基因本体论等受控词汇提供了使这些测试可重复的共享术语,而精选的通路数据库则提供了反应和过程图。最后,网络和比较方法对基因之间的关系进行建模——物理相互作用、功能关联以及跨物种的直系同源关系——从而可以传播功能,并将疾病机制理解为连接系统的扰动。
Clinical relevance
功能基因组学和通路分析是基因组发现如何在研究和转化环境中被解释的基础:优先排序候选变异,解释为什么一组失调基因指向特定的生物学过程,并将疾病构建为一种网络现象。本领域描述了如何从基因组数据中提取生物学意义,旨在作为参考导向,而非个体诊断或治疗决策的基础。
History
功能基因组学起源于20世纪90年代末和21世纪初的基因组测序时代,当时完整的基因组序列产生了同时解释数千个基因的需求。基因本体论(2000年)引入了统一的基因功能词汇,KEGG(2000年)系统化了通路知识,基因集富集分析(2005年)为解读整体表达谱提供了统计框架。ENCODE(2012年)等大型功能元件目录将解释扩展到非编码区域,网络医学(2011年)将疾病重新定义为分子网络扰动的结果。
Key figures
- Michael Ashburner
- Minoru Kanehisa
- Aravind Subramanian
- Albert-László Barabási
Related topics
Seminal works
- ashburner-2000
- kanehisa-2000
- subramanian-2005
- encode-2012
Frequently asked questions
- 功能基因组学与结构基因组学或测序有何不同?
- 测序和结构基因组学确定基因组包含什么以及它是如何组织的;功能基因组学则探究这些序列做了什么——在基因组尺度上基因、调控元件及其产物的活动和相互作用。
- 通路分析有什么用?
- 通路分析通过测试已知的生物学通路、本体术语或网络是否过度代表来解释基因或变异的列表或排序,有助于将基因组结果转化为生物学假设。
Methods for this concept
- Pathway Enrichment Analysis
- Network-based pathway enrichment analysis
- Machine learning-assisted pathway enrichment analysis
- Network-based gene set enrichment analysis
- Bayesian Pathway Enrichment Analysis
- Differential pathway enrichment analysis
- Multi-omics Pathway Enrichment Analysis
- Gene Set Enrichment Analysis