Hóa lượng pháp và Phân tích dữ liệu
Hóa lượng pháp áp dụng các phương pháp thống kê và toán học để thiết kế thí nghiệm và trích xuất thông tin hóa học từ dữ liệu phân tích, đặc biệt là dữ liệu đa biến.
Definition
Hóa lượng pháp là một lĩnh vực sử dụng các phương pháp thống kê và toán học để thiết kế các thí nghiệm hóa học và trích xuất thông tin hóa học tối đa từ các phép đo phân tích, đặc biệt là dữ liệu đa biến.
Scope
Chủ đề này bao gồm phân tích dữ liệu phân tích vượt ra ngoài thống kê đơn biến đơn giản: thiết kế và tối ưu hóa thí nghiệm, các phương pháp khám phá và nhận dạng mẫu như phân tích thành phần chính và phân cụm, phân loại và hiệu chuẩn đa biến bao gồm bình phương tối thiểu từng phần. Nó đề cập đến cách các phép đo đa chiều như phổ đầy đủ được mô hình hóa để phân loại mẫu và dự đoán nồng độ, và cách các mô hình được xác nhận chống lại sự quá khớp.
Core questions
- Thiết kế thí nghiệm giúp tối ưu hóa và sàng lọc hiệu quả như thế nào?
- Các phương pháp như phân tích thành phần chính tiết lộ cấu trúc trong dữ liệu đa chiều như thế nào?
- Hiệu chuẩn đa biến dự đoán nồng độ từ phổ đầy đủ như thế nào?
- Các mô hình hóa lượng pháp được xác nhận như thế nào để tránh quá khớp?
Key theories
- Phân tích thành phần chính
- Phân tích thành phần chính diễn đạt lại nhiều phép đo tương quan thành một vài thành phần trực giao nắm bắt hầu hết phương sai, tiết lộ các nhóm và xu hướng, đồng thời cung cấp cơ sở để phân loại và nén dữ liệu phổ trước khi mô hình hóa.
- Hiệu chuẩn đa biến
- Các phương pháp như bình phương tối thiểu từng phần liên hệ toàn bộ hồ sơ đo được, như một phổ, với một hoặc nhiều nồng độ, khai thác tất cả các biến cùng một lúc để đưa ra các dự đoán mạnh mẽ ngay cả khi các tín hiệu riêng lẻ chồng chéo hoặc nhiễu.
Mechanisms
Hóa lượng pháp xử lý một tập hợp các phép đo dưới dạng ma trận dữ liệu và áp dụng các mô hình toán học cho nó. Các phương pháp khám phá như phân tích thành phần chính chiếu dữ liệu lên một vài biến tiềm ẩn nắm bắt cấu trúc của nó, làm lộ ra các cụm và các giá trị ngoại lai. Các phương pháp phân loại gán mẫu vào các nhóm, và hiệu chuẩn đa biến xây dựng các mô hình dự đoán liên kết phổ hoặc các hồ sơ khác với nồng độ. Các mô hình được xác nhận bằng cách kiểm định chéo hoặc các tập dữ liệu thử nghiệm độc lập để đảm bảo chúng tổng quát hóa thay vì chỉ phù hợp với nhiễu.
Clinical relevance
Các phương pháp hóa lượng pháp là trọng tâm của phân tích công cụ hiện đại: diễn giải dữ liệu quang phổ và sắc ký trong các phòng thí nghiệm dược phẩm, thực phẩm và môi trường, cho phép thử nghiệm không phá hủy nhanh chóng bằng quang phổ cận hồng ngoại, và hỗ trợ phân tích chuyển hóa và các phân tích omics khác, nơi mỗi mẫu tạo ra hàng nghìn biến số.
History
Hóa lượng pháp xuất hiện như một lĩnh vực được đặt tên vào những năm 1970, với Svante Wold đặt ra thuật ngữ này và Bruce Kowalski giúp thiết lập nó, khi dữ liệu công cụ ngày càng tăng và máy tính giá cả phải chăng đòi hỏi các phương pháp đa biến. Hồi quy bình phương tối thiểu từng phần, được phát triển bởi Wold và Martens, trở thành một công cụ định nghĩa, và lĩnh vực này mở rộng với sự gia tăng của dữ liệu quang phổ và omics đa chiều.
Key figures
- Svante Wold
- Bruce Kowalski
- Harald Martens
Related topics
Seminal works
- wold1987
- miller2018
- brereton2018
Frequently asked questions
- Hóa lượng pháp giải quyết vấn đề gì?
- Các thiết bị hiện đại tạo ra nhiều dữ liệu hơn mức thống kê đơn giản có thể xử lý, chẳng hạn như phổ đầy đủ cho mỗi mẫu; hóa lượng pháp cung cấp các phương pháp đa biến để tìm kiếm các mẫu, phân loại mẫu và dự đoán nồng độ từ tất cả dữ liệu đó cùng một lúc.
- Tại sao các mô hình hóa lượng pháp phải được xác nhận?
- Với nhiều biến, một mô hình có thể phù hợp với nhiễu hơn là hóa học thực sự, có vẻ chính xác trên dữ liệu huấn luyện nhưng thất bại trên các mẫu mới; xác nhận bằng kiểm định chéo hoặc các tập dữ liệu thử nghiệm độc lập kiểm tra xem mô hình có thực sự tổng quát hóa hay không.