定量构效分析 (QSAR)
定量构效关系 (QSAR) 分析将结构影响活性的定性观察转化为数学模型:它将分子结构的数值描述符与测量的生物活性相关联,从而可以预测尚未测试的化合物的活性。它是药物化学中构效推理的定量核心。
Definition
定量构效关系是一种数学模型,它将化学结构的数值描述符(如理化、拓扑、电子或三维场性质)与生物活性的定量测量相关联,以解释构效趋势并预测未经测试化合物的活性。
Scope
本条目涵盖了分子数值描述的逻辑、基于理化参数的经典Hansch型分析、向三维和场方法的转变、模型的构建和验证方式,以及它们的使用方式及其可靠性的限制。它将QSAR视为一种建模方法,而非临床指导。
Core questions
- 化学结构如何以描述符的形式进行数值表示?
- 这些描述符与活性之间的关系如何拟合和解释?
- 三维和基于场的QSAR方法在经典基于参数的分析之上增加了什么?
- QSAR模型如何验证,以及什么定义了其可靠预测的领域?
Key concepts
- 分子描述符
- 同源系列
- Hansch分析和取代基参数
- Free-Wilson(加性基团贡献)分析
- 3D-QSAR和分子场
- 偏最小二乘回归
- 模型验证和适用域
- 过拟合和偶然相关
Key theories
- Hansch(线性自由能)QSAR
- 在同源系列中,生物活性可以表示为理化取代基参数的线性组合——通常是疏水项以及电子和空间项——基于线性自由能关系,从而提供可解释和可预测的活性模型。
- 三维基于场的QSAR (CoMFA)
- 比较分子场分析对齐一组分子,并计算它们周围网格点上的空间和静电相互作用场,然后通过偏最小二乘法将这些场值与活性相关联,捕获三维构效信息,并生成场变化影响活性的区域图。
Mechanisms
QSAR将每个分子编码为一组描述符——在经典Hansch分析中是理化参数,如亲脂性、电子和空间项;在Free-Wilson分析中是基团存在的指示变量;或者在三维方法中,是围绕对齐分子采样的空间和静电场值。然后,统计或机器学习方法拟合这些描述符与训练集测量活性之间的关系,生成一个模型,该模型被解释以识别哪些结构特征驱动活性,并用于预测新化合物的活性。可靠的使用取决于仔细的验证、对预测性能的诚实估计,以及尊重模型的适用域——训练数据所涵盖的化学空间区域——因为否则模型可能反映偶然相关性或在其构建所依据的数据之外失效。
Clinical relevance
QSAR是药物发现和化学安全评估中候选分子优先排序和优化以及某些性质和毒性预测生成的基础。内容是关于建模方法的教育背景;它描述了如何从结构预测活性,而不是任何化合物临床使用的指导。
Evidence & guidelines
QSAR方法论记录在引入基于参数和基于场分析的基础论文以及综述该领域发展、验证实践和最佳实践期望的综合评论中。这些是方法学设计和建模原则,而非临床实践指南;关于验证的正式指导存在于监管和化学信息学文献中,但在此仅在原则层面进行总结。
History
定量构效关系始于1964年,当时Hansch和Fujita通过线性自由能关系将生物活性与理化取代基参数相关联,而Free-Wilson方法则提供了一种并行的加性基团贡献模型。Leo和Hansch对分配数据的汇编为这项工作提供了描述符。1988年,Cramer及其同事引入了比较分子场分析,将QSAR扩展到三维。随后,该领域随着多种描述符类型和机器学习方法的发展而扩展,Cherkasov及其同事2014年的综述等评论总结了其发展、验证标准和未来方向。
Debates
- 预测性、验证和适用域
- QSAR模型必须经过多严格的验证才能被信任——包括过拟合、偶然相关和训练集外推的危险——一直是一个持续的关注点,该领域已趋向于外部验证和明确适用域的要求。
Key figures
- Corwin Hansch
- Toshio Fujita
- Spencer Free
- James Wilson
- Richard Cramer
- Alexander Tropsha
Related topics
Seminal works
- hansch-fujita-1964
- cramer-1988
- cherkasov-2014
Frequently asked questions
- 什么是QSAR?
- QSAR,即定量构效关系,是一种数学模型,它将分子结构的数值描述符与测量的生物活性相关联,从而可以预测未经测试化合物的活性并识别活性的结构驱动因素。
- 经典QSAR和3D-QSAR有什么区别?
- 经典QSAR(如Hansch分析)将活性与取代基或整个分子的理化或其他列表描述符相关联;3D-QSAR方法(如CoMFA)在三维空间中对齐分子,并使用它们周围的空间和静电场值,捕获空间构效信息,并生成变化影响活性的区域图。