ScholarGate
Trợ lý

Biểu diễn và Mô tả Phân tử

Máy tính cần các mã hóa phân tử có thể đọc được bằng máy; các ký hiệu dòng, đồ thị hóa học, dấu vân tay và các mô tả số chuyển đổi cấu trúc hóa học thành các dạng có thể được lưu trữ, tìm kiếm và mô hình hóa.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Các mã hóa và các đặc trưng được tính toán đại diện cho cấu trúc phân tử dưới dạng kỹ thuật số, từ các chuỗi và đồ thị chính tắc đến các vectơ bit dấu vân tay và các mô tả số.

Scope

Bao gồm cách nhìn đồ thị hóa học về phân tử, các ký hiệu dòng như SMILES và InChI, các khóa cấu trúc và dấu vân tay băm, và họ rộng lớn các mô tả phân tử biến cấu trúc thành các đặc trưng số để so sánh và mô hình dự đoán.

Core questions

  • Các phân tử được biểu diễn dưới dạng đồ thị và chuỗi chính tắc như thế nào?
  • Sự khác biệt giữa các khóa cấu trúc, dấu vân tay băm và các mô tả số là gì?
  • Một định danh duy nhất, chính tắc như InChI được tạo ra như thế nào?
  • Việc lựa chọn biểu diễn định hình quá trình tìm kiếm và mô hình hóa tiếp theo như thế nào?

Key theories

Đồ thị hóa học và ký hiệu dòng
Việc biểu diễn một phân tử dưới dạng đồ thị có nhãn gồm các nguyên tử và liên kết, và việc tuần tự hóa nó thành một ký hiệu dòng nhỏ gọn như SMILES, cung cấp cơ sở cho việc lưu trữ, trao đổi và chuẩn hóa.
Mã hóa mô tả và dấu vân tay
Việc chuyển đổi cấu trúc thành các mô tả số có độ dài cố định hoặc dấu vân tay nhị phân cho phép so sánh định lượng, tìm kiếm sự tương đồng và các mô hình học máy.

Clinical relevance

Các biểu diễn phân tử mạnh mẽ là nền tảng của mọi quy trình cheminformatics, từ việc loại bỏ trùng lặp và tìm kiếm cơ sở dữ liệu đến các mô hình định lượng cấu trúc-hoạt tính hướng dẫn việc khám phá thuốc và vật liệu.

History

Từ các bảng kết nối ban đầu và chuẩn hóa Morgan, lĩnh vực này đã có ký hiệu SMILES vào năm 1988 và sau đó là tiêu chuẩn mở InChI, cùng với sự gia tăng nhanh chóng của các mô tả và dấu vân tay được liệt kê trong các tài liệu tham khảo.

Key figures

  • David Weininger
  • Roberto Todeschini
  • Peter Willett
  • Stephen Heller

Related topics

Seminal works

  • weininger1988
  • todeschini2009

Frequently asked questions

Sự khác biệt giữa SMILES và InChI là gì?
SMILES là một ký hiệu dòng linh hoạt, dễ đọc đối với con người, có thể có nhiều dạng hợp lệ cho một phân tử, trong khi InChI là một định danh chuẩn hóa, chính tắc được thiết kế để cung cấp một chuỗi duy nhất cho mỗi cấu trúc.
Dấu vân tay phân tử là gì?
Đó là một vectơ bit mã hóa sự hiện diện của các đặc trưng cấu trúc hoặc các mảnh, cho phép so sánh nhanh chóng sự tương đồng giữa các phân tử bằng cách sử dụng các phép đo dựa trên tập hợp đơn giản.

Methods for this concept

Related concepts