Kemometrik dan Analisis Data
Kemometrik menerapkan metode statistik dan matematika untuk merancang eksperimen dan mengekstraksi informasi kimia dari data analitik, terutama data multivariat.
Definition
Kemometrik adalah disiplin ilmu yang menggunakan metode statistik dan matematika untuk merancang eksperimen kimia dan untuk mengekstraksi informasi kimia maksimal dari pengukuran analitik, khususnya data multivariat.
Scope
Topik ini mencakup analisis data analitik di luar statistik univariat sederhana: desain dan optimasi eksperimental, metode eksplorasi dan pengenalan pola seperti analisis komponen utama dan pengelompokan, klasifikasi, dan kalibrasi multivariat termasuk kuadrat terkecil parsial. Ini membahas bagaimana pengukuran berdimensi tinggi seperti spektrum penuh dimodelkan untuk mengklasifikasikan sampel dan memprediksi konsentrasi, dan bagaimana model divalidasi terhadap overfitting.
Core questions
- Bagaimana desain eksperimental membuat optimasi dan skrining menjadi efisien?
- Bagaimana metode seperti analisis komponen utama mengungkapkan struktur dalam data berdimensi tinggi?
- Bagaimana kalibrasi multivariat memprediksi konsentrasi dari spektrum penuh?
- Bagaimana model kemometrik divalidasi untuk menghindari overfitting?
Key theories
- Analisis komponen utama
- Analisis komponen utama mengekspresikan kembali banyak pengukuran yang berkorelasi sebagai beberapa komponen ortogonal yang menangkap sebagian besar varians, mengungkapkan pengelompokan dan tren serta menyediakan dasar untuk klasifikasi dan untuk mengompresi data spektral sebelum pemodelan.
- Kalibrasi multivariat
- Metode seperti kuadrat terkecil parsial menghubungkan seluruh profil terukur, seperti spektrum, ke satu atau lebih konsentrasi, memanfaatkan semua variabel sekaligus untuk memberikan prediksi yang kuat bahkan ketika sinyal individual tumpang tindih atau saling mengganggu.
Mechanisms
Kemometrik memperlakukan sekumpulan pengukuran sebagai matriks data dan menerapkan model matematika padanya. Metode eksplorasi seperti analisis komponen utama memproyeksikan data ke beberapa variabel laten yang menangkap strukturnya, mengungkap klaster dan outlier. Metode klasifikasi menetapkan sampel ke dalam kelompok, dan kalibrasi multivariat membangun model prediktif yang menghubungkan spektrum atau profil lain dengan konsentrasi. Model divalidasi dengan validasi silang atau set uji independen untuk memastikan bahwa model tersebut menggeneralisasi daripada hanya menyesuaikan dengan noise.
Clinical relevance
Metode kemometrik sangat penting untuk analisis instrumental modern: menafsirkan data spektroskopi dan kromatografi di laboratorium farmasi, makanan, dan lingkungan, memungkinkan pengujian non-destruktif cepat dengan spektroskopi inframerah dekat, dan mendukung analisis metabolomik serta analisis omics lainnya di mana setiap sampel menghasilkan ribuan variabel.
History
Kemometrik muncul sebagai disiplin ilmu yang dinamai pada tahun 1970-an, dengan Svante Wold menciptakan istilah tersebut dan Bruce Kowalski membantu membangunnya, karena data instrumental yang berkembang dan komputasi yang terjangkau menuntut metode multivariat. Regresi kuadrat terkecil parsial, yang dikembangkan oleh Wold dan Martens, menjadi alat yang menentukan, dan bidang ini berkembang dengan munculnya data spektroskopi dan omics berdimensi tinggi.
Key figures
- Svante Wold
- Bruce Kowalski
- Harald Martens
Related topics
Seminal works
- wold1987
- miller2018
- brereton2018
Frequently asked questions
- Masalah apa yang dipecahkan oleh kemometrik?
- Instrumen modern menghasilkan lebih banyak data daripada yang dapat ditangani oleh statistik sederhana, seperti spektrum penuh untuk setiap sampel; kemometrik menyediakan metode multivariat untuk menemukan pola, mengklasifikasikan sampel, dan memprediksi konsentrasi dari semua data tersebut sekaligus.
- Mengapa model kemometrik harus divalidasi?
- Dengan banyak variabel, model dapat menyesuaikan dengan noise daripada kimia nyata, tampak akurat pada data pelatihan tetapi gagal pada sampel baru; validasi dengan validasi silang atau set uji independen memeriksa bahwa model benar-benar menggeneralisasi.