分子表示与描述符
计算机需要可机器读取的分子编码;线表示法、化学图、指纹和数值描述符将化学结构转化为可存储、搜索和建模的形式。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
以数字形式表示分子结构的编码和计算特征,范围从规范字符串和图到指纹位向量和数值描述符。
Scope
涵盖分子的化学图视图、SMILES和InChI等线表示法、结构键和哈希指纹,以及将结构转化为用于相似性分析和预测建模的数值特征的广泛分子描述符家族。
Core questions
- 分子如何表示为图和规范字符串?
- 结构键、哈希指纹和数值描述符之间有什么区别?
- 唯一的规范标识符(如InChI)是如何生成的?
- 表示方法的选择如何影响下游的搜索和建模?
Key theories
- 化学图和线表示法
- 将分子表示为原子和键的标记图,并将其序列化为紧凑的线表示法(如SMILES),为存储、交换和规范化提供了基础。
- 描述符和指纹编码
- 将结构转换为定长数值描述符或二进制指纹,可以实现定量比较、相似性搜索和机器学习模型。
Clinical relevance
稳健的分子表示是每个化学信息学工作流程的基础,从数据库去重和搜索到指导药物和材料发现的定量构效模型。
History
从早期的连接表和摩根规范化开始,该领域在1988年获得了SMILES表示法,随后是开放的InChI标准,同时在参考著作中编目了大量描述符和指纹。
Key figures
- David Weininger
- Roberto Todeschini
- Peter Willett
- Stephen Heller
Related topics
Seminal works
- weininger1988
- todeschini2009
Frequently asked questions
- SMILES和InChI有什么区别?
- SMILES是一种灵活、易于人类阅读的线表示法,一个分子可以有多种有效形式,而InChI是一种标准化的规范标识符,旨在为每个结构提供一个唯一的字符串。
- 什么是分子指纹?
- 它是一种位向量,编码结构特征或片段的存在,通过简单的基于集合的度量,实现分子之间快速的相似性比较。