QSAR และการสร้างแบบจำลองคุณสมบัติ
ความสัมพันธ์เชิงปริมาณระหว่างโครงสร้าง-กิจกรรม และโครงสร้าง-คุณสมบัติ สร้างแบบจำลองทางสถิติที่ทำนายกิจกรรมหรือคุณสมบัติของโมเลกุลจากตัวบ่งชี้เชิงตัวเลขของโครงสร้าง
Definition
แบบจำลองเชิงประจักษ์ที่ขับเคลื่อนด้วยข้อมูล ซึ่งเชื่อมโยงโครงสร้างโมเลกุลที่เข้ารหัสเป็นตัวบ่งชี้ เข้ากับคุณสมบัติที่วัดได้หรือกิจกรรมทางชีวภาพเพื่อวัตถุประสงค์ในการทำนาย
Scope
ครอบคลุมการสร้างแบบจำลอง QSAR และ QSPR ตัวบ่งชี้และอัลกอริทึมการเรียนรู้ที่ใช้ ความสำคัญของการตรวจสอบความถูกต้องและขอบเขตการใช้งาน และการประยุกต์ใช้กับกิจกรรมทางชีวภาพและคุณสมบัติทางกายภาพเคมีและ ADMET แยกแยะแบบจำลองคลาสสิกที่ตีความได้จากแบบจำลองที่เรียนรู้ด้วยเครื่องจักรที่ทันสมัย
Core questions
- กิจกรรมทางชีวภาพหรือคุณสมบัติมีความสัมพันธ์กับตัวบ่งชี้โมเลกุลอย่างไร?
- แบบจำลอง QSAR ได้รับการตรวจสอบความถูกต้องอย่างไรเพื่อให้แน่ใจว่ามีความสามารถในการทำนายที่แท้จริง?
- ขอบเขตการใช้งานคืออะไรและทำไมจึงมีความสำคัญ?
- แบบจำลอง QSAR แบบคลาสสิกและแบบจำลองการเรียนรู้ของเครื่องจักรที่ทันสมัยแตกต่างกันอย่างไร?
Key theories
- การวิเคราะห์ของ Hansch
- เชื่อมโยงกิจกรรมทางชีวภาพกับตัวบ่งชี้ทางกายภาพเคมี เช่น สภาพชอบไขมัน (lipophilicity) และพารามิเตอร์ทางอิเล็กทรอนิกส์และสเตอริก ซึ่งเป็นรากฐานของความสัมพันธ์เชิงปริมาณระหว่างโครงสร้าง-กิจกรรม
- การตรวจสอบความถูกต้องและขอบเขตการใช้งาน
- QSAR ที่เชื่อถือได้ต้องมีการตรวจสอบความถูกต้องภายนอกอย่างเข้มงวดและขอบเขตการใช้งานที่กำหนด เนื่องจากแบบจำลองมักจะคาดการณ์ได้ไม่ดีสำหรับโครงสร้างที่ไม่เหมือนกับข้อมูลการฝึกอบรม
Clinical relevance
แบบจำลอง QSAR และคุณสมบัติชี้นำการปรับปรุงสารนำ (lead optimization) จัดลำดับความสำคัญของสารประกอบสำหรับการสังเคราะห์และการทดสอบ และทำนายการดูดซึม การกระจาย การเผาผลาญ การขับถ่าย และความเป็นพิษ และให้ข้อมูลสำหรับการประเมินความปลอดภัยของสารเคมีโดยหน่วยงานกำกับดูแล
History
ก่อตั้งขึ้นโดยการวิเคราะห์ของ Hansch และ Fujita ในปี 1964 ที่เชื่อมโยงกิจกรรมกับพารามิเตอร์ทางกายภาพเคมี QSAR เติบโตผ่านรูปแบบสามมิติและรูปแบบการเรียนรู้ของเครื่องจักร โดย OECD ได้กำหนดหลักการตรวจสอบความถูกต้องสำหรับการใช้งานด้านกฎระเบียบในภายหลัง
Debates
- ความเข้มงวดของการตรวจสอบความถูกต้องและการเกิดภาวะโอเวอร์ฟิตติง (overfitting)
- สถิติความเหมาะสมภายในที่สูงอาจบดบังความสามารถในการทำนายจริงที่ไม่ดี ดังนั้นจึงมีการเน้นย้ำอย่างต่อเนื่องและมีการถกเถียงกันเกี่ยวกับการตรวจสอบความถูกต้องภายนอกและการกำหนดขอบเขตการใช้งานที่เหมาะสม
Key figures
- Corwin Hansch
- Toshio Fujita
- Alexander Tropsha
- Johann Gasteiger
Related topics
Seminal works
- hansch1964
- tropsha2010
Frequently asked questions
- ขอบเขตการใช้งานของแบบจำลอง QSAR คืออะไร?
- เป็นขอบเขตของพื้นที่ทางเคมี ซึ่งกำหนดโดยข้อมูลการฝึกอบรม ซึ่งการทำนายของแบบจำลองถือว่าเชื่อถือได้ การทำนายสำหรับโมเลกุลที่แตกต่างกันมากควรได้รับการพิจารณาด้วยความระมัดระวัง
- แบบจำลอง QSAR ได้รับการตรวจสอบความถูกต้องอย่างเหมาะสมได้อย่างไร?
- นอกเหนือจากการตรวจสอบความถูกต้องแบบไขว้ภายใน (internal cross-validation) แล้ว ควรทดสอบกับชุดสารประกอบภายนอกที่ไม่ได้ใช้ในการฝึกอบรม เนื่องจากสถิติภายในที่ดีเพียงอย่างเดียวไม่ได้รับประกันประสิทธิภาพในการทำนาย