Phred 품질 점수란 무엇입니까?

이는 염기 호출이 잘못될 확률에 대한 로그 측정값입니다. 예를 들어, Phred 점수 30은 약 1000분의 1의 오류 확률에 해당하므로, 점수가 높을수록 염기 호출의 신뢰도가 높음을 나타냅니다.

동일한 위치를 여러 번 시퀀싱하는 것이 오류를 어떻게 줄입니까?

한 위치가 많은 독립적인 판독값으로 커버될 때, 개별 판독값의 무작위 오류는 다수에 의해 무효화될 수 있으므로, 판독값 전반에 걸쳐 합의를 도출하면 단일 판독값보다 더 정확한 염기 호출을 얻을 수 있습니다.

시퀀싱의 품질 관리 및 오류 수정

모든 시퀀싱 실행은 신뢰도가 다양한 염기 호출을 생성하므로, 품질 관리 및 오류 수정은 염기별 정확도를 정량화하고, 품질이 낮은 데이터를 필터링하거나 트리밍하며, 판독값을 어셈블하거나 변이 호출에 사용하기 전에 체계적인 인공물을 수정하는 단계입니다. 이러한 과정이 없으면, 하위 유전체 결론은 생물학적 요인보다는 기술적 노이즈에 의해 왜곡될 수 있습니다.

PaperMind(으)로 주제 찾기곧 제공Find papers & topics

Tools & resources

슬라이드 다운로드

Learn & explore

동영상곧 제공

Definition

시퀀싱의 품질 관리는 염기별 품질 점수, 트리밍 및 필터링, 오류 수정 방법을 사용하여 판독값의 신뢰성을 평가하고 개선하는 과정으로, 측정 오류가 아닌 실제 서열을 반영하도록 어셈블리 및 변이 호출을 위해 기술적 인공물을 제거하거나 수정합니다.

Scope

이 항목은 염기별 품질(Phred) 점수, 시퀀싱 판독값에 영향을 미치는 오류 및 편향의 종류, 판독값 트리밍 및 필터링, 그리고 참 신호와 오류를 구별하는 데 있어 중복 커버리지의 역할에 대해 다룹니다. 이는 데이터 신뢰성에 대한 방법론적 주제이며 임상 또는 실험실 프로토콜을 제공하지 않습니다.

Core questions

개별 염기 호출의 신뢰도는 어떻게 정량화됩니까?
시퀀싱 판독값에 어떤 종류의 오류와 편향이 영향을 미칩니까?
트리밍, 필터링 및 중복 커버리지는 오류의 영향을 어떻게 줄입니까?

Key concepts

Phred 품질 점수
염기 호출 정확도
판독값 트리밍 및 필터링
시퀀싱 오류 프로파일
커버리지 및 합의 오류 감소
어댑터 및 품질 트리밍
위양성 변이 제어

Mechanisms

시퀀싱 플랫폼은 각 염기 호출에 Phred 품질 점수를 할당하는데, 이는 해당 호출이 틀릴 확률에 대한 로그 추정치로, 신뢰도가 낮은 염기를 플래그할 수 있게 합니다. 품질 관리 도구는 분석 전에 어댑터와 품질이 낮은 끝 부분을 트리밍하고 신뢰할 수 없는 판독값을 필터링합니다. 오류는 부분적으로 무작위적이고 부분적으로 체계적이기 때문에, 각 위치를 여러 번 시퀀싱하면 합의를 도출하여 개별 오류가 다수에 의해 무효화될 수 있으며, 오류 프로파일을 특성화하면 반복적인 인공물과 실제 저빈도 변이를 구별하는 데 도움이 됩니다. 이러한 단계는 하위 변이 호출에서 위양성을 줄이고 어셈블리 정확도를 향상시킵니다.

Clinical relevance

품질 관리 및 오류 수정은 유전체 발견이 실제 서열을 반영하는지 아니면 기술적 노이즈를 반영하는지를 결정하며, 이는 시퀀싱이 연구 또는 임상 해석에 정보를 제공하는 모든 경우에 중요합니다. 이 항목은 데이터 신뢰성에 대한 교육적 참고 자료이며 특정 검사 또는 임상 결정에 대한 지침을 구성하지 않습니다.

Evidence & guidelines

이 방법들은 임상 지침보다는 주요 도구 및 분석 논문을 통해 문서화되어 있습니다. Ewing et al. (1998)은 Phred 염기별 품질 점수를 확립했고, Bolger et al. (2014)은 널리 사용되는 판독값 트리밍 도구이며, Ma et al. (2019)은 심층 시퀀싱 데이터의 오류 프로파일을 특성화합니다. Sims et al. (2014)과 같은 리뷰는 커버리지와 오류 제어를 연결합니다.

History

염기별 품질 점수화는 1998년 Phred 프로그램으로 공식화되어 시퀀싱 데이터에 염기 호출 신뢰도에 대한 표준화되고 해석 가능한 측정값을 제공했으며, 이는 보편화되었습니다. 고처리량 플랫폼이 방대한 판독량(read volume)을 생산함에 따라, 2010년대에는 전용 트리밍 및 필터링 도구가 등장했으며, 오류 프로파일에 대한 상세한 분석은 실제 저빈도 변이를 체계적인 시퀀싱 인공물로부터 분리하는 방법을 정교하게 만들었습니다.

Key figures

Phil Green
Brent Ewing
Björn Usadel

Seminal works

ewing-1998
bolger-2014
ma-2019

Frequently asked questions

Phred 품질 점수란 무엇입니까?: 이는 염기 호출이 잘못될 확률에 대한 로그 측정값입니다. 예를 들어, Phred 점수 30은 약 1000분의 1의 오류 확률에 해당하므로, 점수가 높을수록 염기 호출의 신뢰도가 높음을 나타냅니다.
동일한 위치를 여러 번 시퀀싱하는 것이 오류를 어떻게 줄입니까?: 한 위치가 많은 독립적인 판독값으로 커버될 때, 개별 판독값의 무작위 오류는 다수에 의해 무효화될 수 있으므로, 판독값 전반에 걸쳐 합의를 도출하면 단일 판독값보다 더 정확한 염기 호출을 얻을 수 있습니다.