유전자 온톨로지 및 생물학 데이터베이스
대규모 유전체 해석을 위해서는 유전자가 수행하는 기능에 대한 공유되고 기계 판독 가능한 언어가 필요합니다. 유전자 온톨로지는 분자 기능, 생물학적 과정 및 세포 위치에 대한 구조화된 어휘를 제공하며, KEGG 및 Reactome와 같은 큐레이션된 데이터베이스는 유전체 결과가 해석되는 데 필요한 경로 및 반응 지식을 제공합니다.
Definition
유전자 온톨로지는 분자 기능, 생물학적 과정, 세포 구성 요소의 세 가지 영역에 걸쳐 유전자 산물의 속성을 설명하는 구조화되고 계층적인 통제된 어휘이며, 생물학 데이터베이스는 유전체 데이터를 주석화하고 해석하는 데 사용되는 기능, 경로 및 상호작용 지식을 저장하는 큐레이션된 저장소(예: KEGG, Reactome 및 단백질 연관 자원)입니다.
Scope
이 주제는 통제된 생물학적 어휘와 큐레이션된 기능 및 경로 정보를 저장하는 주요 지식 기반을 다룹니다. 여기에는 유전자 온톨로지의 구조와 사용법, 증거 코드를 사용하여 유전자가 온톨로지 용어에 어떻게 주석이 달리는지, 그리고 경로 및 상호작용 데이터베이스의 역할이 포함됩니다. 이는 참고 및 교육 목적의 주제이며 임상적 지침을 제공하지 않습니다.
Core questions
- 유전자 산물의 기능은 어떻게 일관되고 계산 가능한 방식으로 설명될 수 있습니까?
- 유전자 온톨로지의 세 가지 영역은 무엇을 포착하며, 어떻게 구성되어 있습니까?
- 주석의 강도는 예를 들어 증거 코드를 통해 어떻게 표시됩니까?
- 경로, 반응 및 상호작용 지식을 보유하는 데이터베이스는 무엇이며, 어떻게 다릅니까?
Key concepts
- 통제된 어휘 및 온톨로지
- 분자 기능, 생물학적 과정, 세포 구성 요소
- GO의 방향성 비순환 그래프(DAG) 구조
- 주석 및 증거 코드
- 경로 데이터베이스 (KEGG, Reactome)
- 단백질 상호작용 및 연관 데이터베이스 (STRING)
Mechanisms
유전자 온톨로지는 용어를 방향성 비순환 그래프로 구성하며, 이 그래프에서 특정 용어는 세 가지 독립적인 영역(분자 기능(유전자 산물의 생화학적 활동), 생물학적 과정(유전자 산물이 기여하는 더 큰 프로그램), 세포 구성 요소(유전자 산물이 작용하는 위치))에 걸쳐 더 일반적인 용어로부터 상속됩니다. 유전자는 주석을 통해 용어에 연결되며, 각 주석에는 증거 코드가 태그되어 지원이 실험적인지, 계산적인지, 또는 큐레이터가 추론한 것인지를 기록합니다. 보완적인 데이터베이스는 온톨로지가 다루지 않는 지식을 포착합니다. KEGG와 Reactome는 경로를 반응 및 관계의 네트워크로 인코딩하며, STRING과 같은 단백질 연관 자원은 단백질 간의 기능적 연결에 대한 증거를 집계합니다. 이러한 자원들은 함께 하류의 농축 및 네트워크 방법이 활용하는 큐레이션된 유전자 세트와 참조 주석을 제공합니다.
Clinical relevance
온톨로지와 큐레이션된 데이터베이스는 연구 전반에 걸쳐 유전체 해석의 재현성을 가능하게 하는 공유 인프라로서, 주석, 농축 및 네트워크 분석에 사용되는 어휘와 유전자 세트를 제공합니다. 이는 생물학적 지식이 계산을 위해 어떻게 조직되는지를 설명하며, 개별 진단 또는 치료 결정의 기반이 아닌 참조 자원 역할을 합니다.
History
유전자 온톨로지는 2000년에 모델 생물 데이터베이스 컨소시엄에 의해 종간 유전자 기능 설명 방식을 통합하기 위해 시작되었으며, 기능 유전체학의 사실상 표준 어휘가 되었습니다. 같은 해 KEGG는 경로 지식을 계산 가능한 지도로 공식화했으며, Reactome는 나중에 수동으로 큐레이션된 반응 수준 경로 지식 기반을 추가했습니다. STRING과 같은 단백질 연관 데이터베이스는 큐레이션을 기능적 및 물리적 상호작용으로 확장하여, 현재 대부분의 농축 및 네트워크 분석이 의존하는 자원 생태계를 완성했습니다.
Key figures
- Michael Ashburner
- Judith Blake
- Minoru Kanehisa
- Peter D'Eustachio
Related topics
Seminal works
- ashburner-2000
- kanehisa-2000
- jassal-2020
Frequently asked questions
- 유전자 온톨로지의 세 가지 영역은 무엇입니까?
- 분자 기능(유전자 산물의 생화학적 활동), 생물학적 과정(유전자 산물이 기여하는 더 넓은 프로그램), 세포 구성 요소(세포 내에서 작용하는 위치)입니다. 이 세 가지 영역은 독립적으로 구성됩니다.
- 유전자 온톨로지 주석에 증거 코드가 있는 이유는 무엇입니까?
- 증거 코드는 주석이 어떻게 뒷받침되었는지(예: 실험적 증거 대 계산적 추론)를 기록하여 사용자가 특정 유전자-용어 할당의 신뢰도를 판단할 수 있도록 합니다.
Methods for this concept
- Pathway Enrichment Analysis
- Bayesian Pathway Enrichment Analysis
- Machine learning-assisted pathway enrichment analysis
- Gene Set Enrichment Analysis
- Network-based gene set enrichment analysis
- Network-based pathway enrichment analysis
- Multi-omics Pathway Enrichment Analysis
- Differential pathway enrichment analysis