Pemeriksaan Titik dan Pemulihan
Pemeriksaan titik secara berkala menyimpan status sistem sehingga setelah kegagalan, sistem dapat kembali ke titik yang konsisten dan melanjutkan, daripada memulai ulang dari awal.
Definition
Pemeriksaan titik mencatat status satu atau lebih proses ke penyimpanan stabil; pemulihan pengembalian menggunakan titik pemeriksaan ini, mungkin dengan pesan yang dicatat, untuk mengembalikan sistem ke keadaan global yang konsisten—garis pemulihan—setelah kegagalan dan memutar ulang dari sana.
Scope
Topik ini mencakup pemulihan pengembalian berbasis titik pemeriksaan dan berbasis log: pemeriksaan titik yang tidak terkoordinasi, terkoordinasi, dan diinduksi komunikasi; efek domino yang dapat disebabkan oleh pemeriksaan titik yang tidak terkoordinasi; dan pencatatan pesan pesimistis, optimistis, dan kausal yang memungkinkan pemulihan melampaui titik pemeriksaan terakhir. Ini terhubung dengan teori potongan konsisten dari snapshot global.
Core questions
- Bagaimana titik pemeriksaan antar proses dapat digabungkan menjadi garis pemulihan yang konsisten?
- Apa itu efek domino dan bagaimana koordinasi mencegahnya?
- Kapan pencatatan pesan memungkinkan pemulihan melewati titik pemeriksaan terbaru?
Key theories
- Pemeriksaan titik terkoordinasi
- Proses-proses berkoordinasi sehingga titik pemeriksaan mereka bersama-sama membentuk keadaan global yang konsisten, menjamin garis pemulihan yang dapat digunakan dan menghindari pengembalian berjenjang dengan biaya overhead sinkronisasi.
- Pemeriksaan titik tidak terkoordinasi dan efek domino
- Jika proses-proses melakukan pemeriksaan titik secara independen, pemulihan mungkin memerlukan pengembalian masing-masing untuk menemukan set yang konsisten, berpotensi berjenjang hingga ke awal (efek domino), yang dirancang untuk dihindari oleh koordinasi atau pencatatan.
- Pencatatan pesan
- Mencatat pesan yang diterima suatu proses (secara pesimistis, optimistis, atau kausal) memungkinkan proses yang sedang memulihkan untuk memutar ulang pesan tersebut secara deterministik dan maju melewati titik pemeriksaan terakhirnya, memulihkan pekerjaan terbaru tanpa pengembalian global.
Clinical relevance
Pemeriksaan titik/mulai ulang menjaga komputasi kinerja tinggi dan ilmiah yang berjalan lama tetap tangguh terhadap kegagalan node, dan pemeriksaan titik asinkron memberikan jaminan pemulihan kesalahan yang tepat satu kali pada sistem pemrosesan aliran modern.
History
Berdasarkan teori snapshot konsisten Chandy dan Lamport, Koo dan Toueg memformalkan pemeriksaan titik terkoordinasi pada tahun 1987, dan puluhan tahun pekerjaan pada skema pencatatan dan tidak terkoordinasi dikonsolidasikan dalam survei Elnozahy dan rekan-rekannya tahun 2002, referensi standar tentang pemulihan pengembalian.
Debates
- Pemeriksaan titik terkoordinasi versus tidak terkoordinasi
- Pemeriksaan titik terkoordinasi menjamin garis pemulihan yang bersih tetapi menambah biaya sinkronisasi dan koordinasi global; pemeriksaan titik tidak terkoordinasi lebih murah pada saat pemeriksaan titik tetapi berisiko efek domino dan pemulihan yang kompleks, sehingga pilihan yang tepat bergantung pada tingkat kegagalan dan skala.
Key figures
- K. Mani Chandy
- Leslie Lamport
- Sam Toueg
- Lorenzo Alvisi
Related topics
Seminal works
- elnozahy2002
- koo1987
- chandy1985
Frequently asked questions
- Apa itu efek domino dalam pemulihan pengembalian?
- Ketika proses-proses melakukan pemeriksaan titik tanpa koordinasi, mengembalikan satu proses dapat memaksa proses dependen untuk kembali juga, yang dapat berjenjang mundur melalui seluruh komputasi—berpotensi hingga ke awal. Pemeriksaan titik terkoordinasi atau pencatatan pesan digunakan untuk mencegahnya.