基因组的组织和内容
基因组远不止是基因的序列:蛋白质编码序列通常只占基因组的一小部分,散布在重复元件、调控区域以及大量功能仍在探索中的非编码区域之间。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
基因组组织和内容是对基因组所包含的序列类型及其排列方式的描述,包括编码基因、重复元件、调控区域和大部分非编码DNA。
Scope
本主题涵盖基因组的基因含量和基因密度、真核基因的外显子和内含子结构、重复DNA(包括转座元件和串联重复序列)的丰度和类型、非编码和调控DNA、染色体组织成常染色质和异染色质,以及生物体基因组大小的巨大差异。它探讨了基因组包含什么以及如何排列;其内容的测序方式和功能在相邻主题中有所涉及。
Core questions
- 基因组中通常有多少比例编码蛋白质,基因密度如何变化?
- 重复DNA的主要类别有哪些,转座元件如何塑造基因组?
- 为什么基因组大小差异如此之大,却与生物体复杂性无关?
- 染色质如何组织成转录活跃区和沉默区?
Key concepts
- 基因含量、基因密度和外显子-内含子结构
- 重复DNA和转座元件
- 非编码和调控DNA
- 常染色质和异染色质
- 基因组大小和C值悖论
Mechanisms
真核基因组主要通过转座元件的复制活动积累重复序列,而基因稀疏区域则凝缩成异染色质;由此产生的结构,即蛋白质编码外显子嵌入内含子中并被调控和重复DNA包围,反映了突变、选择和移动元件自我繁殖之间的平衡。
Clinical relevance
了解基因组组织对于解释变异至关重要:许多疾病相关变化发生在非编码调控区域,串联重复序列的扩增会导致亨廷顿病等疾病,而转座元件插入可能会破坏基因。
History
麦克林托克在玉米中发现转座元件揭示了基因组是动态的;1970年代的C值悖论表明基因组大小与复杂性无关;从2001年开始对人类和其他基因组的测序量化了大型基因组中重复和非编码部分的比例。
Key figures
- Barbara McClintock
- Susumu Ohno
- Eric Lander
Related topics
Seminal works
- lander2001
- brown2018
Frequently asked questions
- 为什么基因组的大小不能预测生物体的复杂程度?
- 大型基因组的大部分由重复和非编码DNA而非基因组成,因此总大小更多地反映了此类序列的积累,而非基因数量;这种不匹配被称为C值悖论。
- 什么是转座元件?
- 它们是可以在基因组中移动或复制到新位置的DNA序列;在进化过程中,它们的增殖占据了许多基因组的很大一部分,并且既可以破坏也可以重塑基因。