การแสดงโมเลกุลและตัวบ่งชี้
คอมพิวเตอร์ต้องการการเข้ารหัสโมเลกุลที่เครื่องอ่านได้; สัญกรณ์แบบเส้น, กราฟเคมี, ลายนิ้วมือ และตัวบ่งชี้เชิงตัวเลข แปลงโครงสร้างทางเคมีให้อยู่ในรูปแบบที่สามารถจัดเก็บ, ค้นหา และสร้างแบบจำลองได้
Definition
การเข้ารหัสและคุณสมบัติที่คำนวณได้ซึ่งแสดงโครงสร้างโมเลกุลในรูปแบบดิจิทัล ตั้งแต่สตริงและกราฟแบบบัญญัติ ไปจนถึงเวกเตอร์บิตของลายนิ้วมือและตัวบ่งชี้เชิงตัวเลข
Scope
ครอบคลุมมุมมองกราฟเคมีของโมเลกุล, สัญกรณ์แบบเส้น เช่น SMILES และ InChI, คีย์โครงสร้างและลายนิ้วมือแบบแฮช, และกลุ่มใหญ่ของตัวบ่งชี้โมเลกุลที่แปลงโครงสร้างให้เป็นคุณสมบัติเชิงตัวเลขสำหรับการหาความคล้ายคลึงและการสร้างแบบจำลองเชิงพยากรณ์
Core questions
- โมเลกุลถูกแสดงเป็นกราฟและเป็นสตริงแบบบัญญัติได้อย่างไร?
- ความแตกต่างระหว่างคีย์โครงสร้าง, ลายนิ้วมือแบบแฮช และตัวบ่งชี้เชิงตัวเลขคืออะไร?
- ตัวระบุเฉพาะแบบบัญญัติ เช่น InChI ถูกสร้างขึ้นได้อย่างไร?
- การเลือกการแสดงผลมีผลต่อการค้นหาและการสร้างแบบจำลองในขั้นตอนต่อไปอย่างไร?
Key theories
- กราฟเคมีและสัญกรณ์แบบเส้น
- การแสดงโมเลกุลเป็นกราฟที่มีป้ายกำกับของอะตอมและพันธะ และการจัดเรียงเป็นสัญกรณ์แบบเส้นที่กระชับ เช่น SMILES เป็นพื้นฐานสำหรับการจัดเก็บ, การแลกเปลี่ยน และการกำหนดรูปแบบบัญญัติ
- การเข้ารหัสตัวบ่งชี้และลายนิ้วมือ
- การแปลงโครงสร้างเป็นตัวบ่งชี้เชิงตัวเลขที่มีความยาวคงที่ หรือลายนิ้วมือแบบไบนารี ช่วยให้สามารถเปรียบเทียบเชิงปริมาณ, การค้นหาความคล้ายคลึง และแบบจำลองการเรียนรู้ของเครื่องได้
Clinical relevance
การแสดงโมเลกุลที่แข็งแกร่งเป็นรากฐานของทุกขั้นตอนการทำงานของเคมีสารสนเทศ ตั้งแต่การลบข้อมูลซ้ำและการค้นหาในฐานข้อมูล ไปจนถึงแบบจำลองโครงสร้าง-กิจกรรมเชิงปริมาณที่ชี้นำการค้นพบยาและวัสดุ
History
จากการสร้างตารางการเชื่อมต่อและการกำหนดรูปแบบบัญญัติของ Morgan ในยุคแรกเริ่ม สาขาวิชานี้ได้รับสัญกรณ์ SMILES ในปี 1988 และต่อมาคือมาตรฐาน InChI แบบเปิด ควบคู่ไปกับการแพร่หลายของตัวบ่งชี้และลายนิ้วมือที่รวบรวมไว้ในงานอ้างอิง
Key figures
- David Weininger
- Roberto Todeschini
- Peter Willett
- Stephen Heller
Related topics
Seminal works
- weininger1988
- todeschini2009
Frequently asked questions
- ความแตกต่างระหว่าง SMILES และ InChI คืออะไร?
- SMILES เป็นสัญกรณ์แบบเส้นที่ยืดหยุ่นและมนุษย์อ่านได้ ซึ่งอาจมีหลายรูปแบบที่ถูกต้องสำหรับโมเลกุลหนึ่ง ในขณะที่ InChI เป็นตัวระบุแบบบัญญัติที่เป็นมาตรฐานซึ่งออกแบบมาเพื่อให้สตริงเดียวที่ไม่ซ้ำกันต่อโครงสร้าง
- ลายนิ้วมือโมเลกุลคืออะไร?
- เป็นเวกเตอร์บิตที่เข้ารหัสการมีอยู่ของคุณสมบัติโครงสร้างหรือส่วนย่อย ซึ่งช่วยให้สามารถเปรียบเทียบความคล้ายคลึงกันระหว่างโมเลกุลได้อย่างรวดเร็วโดยใช้มาตรวัดแบบเซตอย่างง่าย