Đồ thị có hướng không chu trình
Đồ thị có hướng không chu trình (DAG) là một sơ đồ gồm các nút và các mũi tên một chiều được sử dụng để mã hóa các giả định của nhà nghiên cứu về mối quan hệ nhân quả giữa các biến. Trong dịch tễ học, DAG làm cho những giả định đó trở nên rõ ràng và cung cấp các quy tắc chính thức để quyết định biến nào cần điều chỉnh để ước tính hiệu ứng nhân quả mà không gây ra sai lệch.
Definition
Đồ thị có hướng không chu trình là một đồ thị trong đó các nút đại diện cho các biến và các cạnh có hướng đại diện cho các hiệu ứng nhân quả trực tiếp giả định, không có đường dẫn nào quay trở lại nút bắt đầu của nó, được sử dụng để suy ra những điều chỉnh nào xác định một hiệu ứng nhân quả.
Scope
Chủ đề này bao gồm cấu trúc và cách đọc các DAG nhân quả, các khái niệm về yếu tố gây nhiễu (confounders), yếu tố trung gian (mediators) và yếu tố va chạm (colliders), cũng như các quy tắc đồ thị, đặc biệt là d-tách biệt (d-separation) và tiêu chí cửa sau (back-door criterion), liên kết một đồ thị được vẽ với một tập hợp điều chỉnh hợp lệ. Đây là một tài liệu tham khảo về phương pháp luận, không phải hướng dẫn lâm sàng.
Core questions
- Làm thế nào để các giả định về cấu trúc nhân quả có thể được biểu diễn một cách rõ ràng?
- Những biến nào phải được điều chỉnh, và những biến nào không được điều chỉnh, để ước tính một hiệu ứng nhân quả?
- Yếu tố gây nhiễu, yếu tố trung gian và yếu tố va chạm khác nhau như thế nào trong một đồ thị nhân quả?
Key concepts
- Các nút và các cạnh có hướng
- Yếu tố gây nhiễu, yếu tố trung gian và yếu tố va chạm
- Đường dẫn cửa sau và tiêu chí cửa sau
- d-tách biệt
- Sai lệch do yếu tố va chạm
- Tập hợp điều chỉnh đủ tối thiểu
Mechanisms
Trong một DAG, một mũi tên từ biến này sang biến khác mã hóa một hiệu ứng nhân quả trực tiếp giả định, và việc không có mũi tên mã hóa việc không có hiệu ứng trực tiếp giả định. Tiêu chí cửa sau của Pearl (pearl-1995) xác định một tập hợp các biến mà, khi được điều kiện hóa, chặn tất cả các đường dẫn không nhân quả (cửa sau) giữa phơi nhiễm và kết quả trong khi vẫn để đường dẫn nhân quả mở, tạo ra một tập hợp điều chỉnh không thiên vị. Greenland, Pearl, và Robins (greenland-pearl-robins-1999) đã dịch lý thuyết đồ thị này cho các nhà dịch tễ học, chỉ ra cách các yếu tố gây nhiễu nên được kiểm soát, các yếu tố trung gian nói chung không nên được kiểm soát khi ước tính tổng hiệu ứng, và các yếu tố va chạm không được điều kiện hóa vì làm như vậy sẽ mở ra một đường dẫn giả tạo (sai lệch do yếu tố va chạm). Do đó, việc điều chỉnh các biến sai có thể tạo ra sai lệch thay vì loại bỏ nó (schisterman-2009), và các phần mềm như dagitty vận hành các quy tắc này (textor-2016).
Clinical relevance
DAG hướng dẫn cách lập kế hoạch kiểm soát nhiễu trong các nghiên cứu cung cấp bằng chứng lâm sàng và y tế công cộng, giúp người đọc hiểu tại sao một điều chỉnh cụ thể được thực hiện hoặc không được thực hiện. Chúng mô tả lý luận phân tích và không phải là cơ sở cho các quyết định chẩn đoán hoặc điều trị cá nhân.
Epidemiology
Các DAG nhân quả hiện là một phần tiêu chuẩn trong việc thiết kế và báo cáo các nghiên cứu quan sát trong dịch tễ học, được sử dụng để biện minh cho việc lựa chọn biến đồng biến và để dự đoán sai lệch chọn lọc và sai lệch do yếu tố va chạm. Các công cụ như dagitty đã làm cho phân tích DAG chính thức trở thành thường lệ trong công việc ứng dụng (textor-2016).
History
Pearl đã giới thiệu các sơ đồ nhân quả và tiêu chí cửa sau để chính thức hóa suy luận nhân quả từ dữ liệu phi thực nghiệm (pearl-1995), và Greenland, Pearl, và Robins đã đưa khung này vào dịch tễ học vào năm 1999 (greenland-pearl-robins-1999). Các công trình ứng dụng tiếp theo đã làm rõ các cạm bẫy như điều chỉnh quá mức và sai lệch do yếu tố va chạm (schisterman-2009) và đã tạo ra phần mềm được sử dụng rộng rãi để phân tích DAG (textor-2016).
Debates
- Việc điều chỉnh nhiều biến đồng biến hơn có thể gây hại không?
- Lý thuyết DAG cho thấy rằng việc điều kiện hóa các yếu tố trung gian hoặc yếu tố va chạm có thể gây ra sai lệch, vì vậy việc thêm các biến đồng biến không tự động an toàn hơn; việc lựa chọn một tập hợp điều chỉnh đòi hỏi các giả định nhân quả rõ ràng thay vì sự tiện lợi về mặt thống kê.
Key figures
- Judea Pearl
- Sander Greenland
- James Robins
- Enrique Schisterman
Related topics
Seminal works
- pearl-1995
- greenland-pearl-robins-1999
Frequently asked questions
- Ý nghĩa của 'không chu trình' trong đồ thị có hướng không chu trình là gì?
- Nó có nghĩa là không có biến nào có thể, bằng cách đi theo hướng của các mũi tên, cuối cùng tự gây ra chính nó; các hiệu ứng chảy theo một hướng mà không có vòng lặp phản hồi.
- Tại sao việc điều chỉnh một yếu tố va chạm có thể tạo ra sai lệch?
- Yếu tố va chạm là một biến được gây ra bởi hai biến khác; việc điều kiện hóa nó mở ra một mối liên hệ giả tạo giữa các nguyên nhân của nó, vì vậy việc điều chỉnh nó có thể gây ra sai lệch thay vì loại bỏ nhiễu.