QSAR与性质建模
定量构效关系和构性关系建立统计模型,通过分子结构的数值描述符预测分子的活性或性质。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
经验性的、数据驱动的模型,将编码为描述符的分子结构与测量的性质或生物活性相关联,以用于预测目的。
Scope
涵盖QSAR和QSPR模型的构建、它们使用的描述符和学习算法、验证和适用范围的核心重要性,以及在生物活性、理化性质和ADMET性质方面的应用。区分可解释的经典模型和现代机器学习模型。
Core questions
- 生物活性或性质如何与分子描述符相关联?
- QSAR模型如何验证以确保真正的预测性?
- 适用范围是什么?为什么它很重要?
- 经典QSAR模型和现代机器学习模型有何不同?
Key theories
- Hansch分析
- 将生物活性与亲脂性、电子和空间参数等理化描述符相关联,奠定了定量构效关系的基础。
- 验证和适用范围
- 可靠的QSAR需要严格的外部验证和明确的适用范围,因为模型对与其训练数据不同的结构外推能力较差。
Clinical relevance
QSAR和性质模型指导先导化合物优化,优先选择化合物进行合成和测试,并预测吸收、分布、代谢、排泄和毒性,同时为化学品安全的监管评估提供信息。
History
由Hansch和Fujita于1964年通过分析活性与理化参数的相关性而创立,QSAR通过三维和机器学习变体发展,OECD随后规范了用于监管的验证原则。
Debates
- 验证严谨性和过拟合
- 高内部拟合统计数据可能掩盖较差的真实预测性,因此持续强调并争论外部验证和适当的适用范围定义。
Key figures
- Corwin Hansch
- Toshio Fujita
- Alexander Tropsha
- Johann Gasteiger
Related topics
Seminal works
- hansch1964
- tropsha2010
Frequently asked questions
- QSAR模型的适用范围是什么?
- 它是化学空间的区域,由训练数据定义,在该区域内模型的预测被认为是可靠的;对于非常不同的分子的预测应谨慎对待。
- QSAR模型如何正确验证?
- 除了内部交叉验证,它还应该在未用于训练的外部化合物集上进行测试,因为仅凭良好的内部统计数据不能保证预测性能。