QSAR и моделирование свойств
Количественные соотношения структура-активность и структура-свойство (QSAR и QSPR) строят статистические модели, которые предсказывают активность или свойство молекулы на основе численных дескрипторов ее структуры.
Definition
Эмпирические, основанные на данных модели, которые связывают молекулярную структуру, закодированную в виде дескрипторов, с измеренным свойством или биологической активностью для прогностических целей.
Scope
Охватывает построение моделей QSAR и QSPR, используемые ими дескрипторы и алгоритмы обучения, центральную важность валидации и области применимости, а также применение к биологической активности и к физико-химическим свойствам и свойствам ADMET. Различает интерпретируемые классические модели и современные модели, основанные на машинном обучении.
Core questions
- Как биологическая активность или свойство коррелируют с молекулярными дескрипторами?
- Как валидируются модели QSAR для обеспечения подлинной предсказательной способности?
- Что такое область применимости и почему она важна?
- Чем отличаются классические модели QSAR от современных моделей машинного обучения?
Key theories
- Анализ Ханша
- Коррелирует биологическую активность с физико-химическими дескрипторами, такими как липофильность, а также электронные и стерические параметры, заложив основу количественного соотношения структура-активность.
- Валидация и область применимости
- Надежные QSAR требуют строгой внешней валидации и определенной области применимости, поскольку модели плохо экстраполируются на структуры, отличные от их обучающих данных.
Clinical relevance
Модели QSAR и свойств направляют оптимизацию ведущих соединений, приоритизируют соединения для синтеза и тестирования, предсказывают абсорбцию, распределение, метаболизм, выведение и токсичность, а также информируют регуляторную оценку химической безопасности.
History
Основанная на анализе Ханша и Фудзиты 1964 года, коррелирующем активность с физико-химическими параметрами, QSAR развивалась через трехмерные варианты и варианты машинного обучения, при этом ОЭСР позднее кодифицировала принципы валидации для регуляторного использования.
Debates
- Строгость валидации и переобучение
- Высокие внутренние статистические показатели соответствия могут маскировать плохую реальную предсказательную способность, поэтому сохраняется акцент и дискуссии по поводу внешней валидации и правильного определения области применимости.
Key figures
- Corwin Hansch
- Toshio Fujita
- Alexander Tropsha
- Johann Gasteiger
Related topics
Seminal works
- hansch1964
- tropsha2010
Frequently asked questions
- Что такое область применимости модели QSAR?
- Это область химического пространства, определяемая обучающими данными, в пределах которой предсказания модели считаются надежными; предсказания для очень отличающихся молекул следует рассматривать с осторожностью.
- Как правильно валидируется модель QSAR?
- Помимо внутренней перекрестной валидации, она должна быть протестирована на внешнем наборе соединений, не использовавшихся при обучении, поскольку хорошие внутренние статистические данные сами по себе не гарантируют предсказательной эффективности.