بازنمایی و توصیفگرهای مولکولی
رایانهها به رمزگذاریهای قابل خوانش ماشینی از مولکولها نیاز دارند؛ نمادگذاریهای خطی، گرافهای شیمیایی، اثرانگشتها و توصیفگرهای عددی، ساختار شیمیایی را به اشکالی تبدیل میکنند که میتوانند ذخیره، جستجو و مدلسازی شوند.
Definition
رمزگذاریها و ویژگیهای محاسبهشدهای که ساختار مولکولی را به صورت دیجیتالی نمایش میدهند، از رشتههای متعارف و گرافها گرفته تا بردارهای بیتی اثرانگشت و توصیفگرهای عددی.
Scope
این بخش به دیدگاه گراف شیمیایی از مولکولها، نمادگذاریهای خطی مانند SMILES و InChI، کلیدهای ساختاری و اثرانگشتهای هششده، و خانواده گستردهای از توصیفگرهای مولکولی میپردازد که ساختار را به ویژگیهای عددی برای شباهت و مدلسازی پیشبینانه تبدیل میکنند.
Core questions
- مولکولها چگونه به صورت گراف و رشتههای متعارف نمایش داده میشوند؟
- تفاوت بین کلیدهای ساختاری، اثرانگشتهای هششده و توصیفگرهای عددی چیست؟
- یک شناسه منحصر به فرد و متعارف مانند InChI چگونه تولید میشود؟
- انتخاب بازنمایی چگونه بر جستجو و مدلسازی بعدی تأثیر میگذارد؟
Key theories
- گراف شیمیایی و نمادگذاری خطی
- نمایش یک مولکول به عنوان یک گراف برچسبدار از اتمها و پیوندها، و سریالیسازی آن به یک نمادگذاری خطی فشرده مانند SMILES، مبنایی برای ذخیرهسازی، تبادل و استانداردسازی فراهم میکند.
- رمزگذاری توصیفگر و اثرانگشت
- تبدیل ساختار به توصیفگرهای عددی با طول ثابت یا اثرانگشتهای باینری، مقایسه کمی، جستجوی شباهت و مدلهای یادگیری ماشینی را امکانپذیر میسازد.
Clinical relevance
بازنماییهای مولکولی قوی، اساس هر گردش کار شیمیانفورماتیک هستند، از حذف موارد تکراری و جستجو در پایگاه داده تا مدلهای کمی ساختار-فعالیت که کشف دارو و مواد را هدایت میکنند.
History
از جداول اتصال اولیه و استانداردسازی مورگان، این حوزه در سال ۱۹۸۸ نمادگذاری SMILES و بعدها استاندارد باز InChI را به دست آورد، در کنار تکثیر توصیفگرها و اثرانگشتهای فهرستشده در آثار مرجع.
Key figures
- David Weininger
- Roberto Todeschini
- Peter Willett
- Stephen Heller
Related topics
Seminal works
- weininger1988
- todeschini2009
Frequently asked questions
- تفاوت بین SMILES و InChI چیست؟
- SMILES یک نمادگذاری خطی انعطافپذیر و قابل خوانش برای انسان است که میتواند چندین فرم معتبر برای یک مولکول داشته باشد، در حالی که InChI یک شناسه استاندارد و متعارف است که برای ارائه یک رشته منحصر به فرد برای هر ساختار طراحی شده است.
- اثرانگشت مولکولی چیست؟
- این یک رمزگذاری بردار بیتی است که حضور ویژگیها یا قطعات ساختاری را نشان میدهد و امکان مقایسههای سریع شباهت بین مولکولها را با استفاده از معیارهای ساده مبتنی بر مجموعه فراهم میکند.