شیمیسنجی و تحلیل دادهها
شیمیسنجی روشهای آماری و ریاضی را برای طراحی آزمایشها و استخراج اطلاعات شیمیایی از دادههای تحلیلی، به ویژه دادههای چندمتغیره، به کار میگیرد.
Definition
شیمیسنجی رشتهای است که از روشهای آماری و ریاضی برای طراحی آزمایشهای شیمیایی و استخراج حداکثر اطلاعات شیمیایی از اندازهگیریهای تحلیلی، به ویژه دادههای چندمتغیره، استفاده میکند.
Scope
این موضوع تحلیل دادههای تحلیلی فراتر از آمار تکمتغیره ساده را پوشش میدهد: طراحی و بهینهسازی آزمایش، روشهای اکتشافی و تشخیص الگو مانند تحلیل مؤلفههای اصلی و خوشهبندی، طبقهبندی، و کالیبراسیون چندمتغیره شامل حداقل مربعات جزئی. این مبحث به چگونگی مدلسازی اندازهگیریهای با ابعاد بالا مانند طیفهای کامل برای طبقهبندی نمونهها و پیشبینی غلظتها، و چگونگی اعتبارسنجی مدلها در برابر بیشبرازش میپردازد.
Core questions
- چگونه طراحی آزمایش، بهینهسازی و غربالگری را کارآمد میسازد؟
- چگونه روشهایی مانند تحلیل مؤلفههای اصلی ساختار را در دادههای با ابعاد بالا آشکار میکنند؟
- چگونه کالیبراسیون چندمتغیره غلظتها را از طیفهای کامل پیشبینی میکند؟
- چگونه مدلهای شیمیسنجی برای جلوگیری از بیشبرازش اعتبارسنجی میشوند؟
Key theories
- تحلیل مؤلفههای اصلی
- تحلیل مؤلفههای اصلی بسیاری از اندازهگیریهای همبسته را به چند مؤلفه متعامد که بیشتر واریانس را به خود اختصاص میدهند، بازبیان میکند و گروهبندیها و روندها را آشکار میسازد و مبنایی برای طبقهبندی و فشردهسازی دادههای طیفی قبل از مدلسازی فراهم میکند.
- کالیبراسیون چندمتغیره
- روشهایی مانند حداقل مربعات جزئی، یک پروفایل اندازهگیری شده کامل، مانند یک طیف، را به یک یا چند غلظت مرتبط میسازند و از تمام متغیرها به طور همزمان برای ارائه پیشبینیهای قوی حتی زمانی که سیگنالهای فردی همپوشانی یا تداخل دارند، بهره میبرند.
Mechanisms
شیمیسنجی مجموعهای از اندازهگیریها را به عنوان یک ماتریس داده در نظر میگیرد و مدلهای ریاضی را بر روی آن اعمال میکند. روشهای اکتشافی مانند تحلیل مؤلفههای اصلی، دادهها را بر روی چند متغیر پنهان که ساختار آن را به تصویر میکشند، فرافکنی میکنند و خوشهها و نقاط پرت را آشکار میسازند. روشهای طبقهبندی، نمونهها را به گروهها اختصاص میدهند، و کالیبراسیون چندمتغیره مدلهای پیشبینیکنندهای را ایجاد میکند که طیفها یا سایر پروفایلها را به غلظتها مرتبط میسازد. مدلها با استفاده از اعتبارسنجی متقابل یا مجموعههای آزمایشی مستقل اعتبارسنجی میشوند تا اطمینان حاصل شود که به جای برازش نویز، تعمیمپذیری دارند.
Clinical relevance
روشهای شیمیسنجی در تحلیل ابزاری مدرن نقش محوری دارند: تفسیر دادههای طیفسنجی و کروماتوگرافی در آزمایشگاههای دارویی، غذایی و محیط زیستی، امکان آزمایش سریع و غیرمخرب با طیفسنجی فروسرخ نزدیک، و پشتیبانی از تحلیلهای متابولومیک و سایر تحلیلهای اومیکس که در آنها هر نمونه هزاران متغیر را تولید میکند.
History
شیمیسنجی به عنوان یک رشته نامگذاری شده در دهه ۱۹۷۰ ظهور کرد، با ابداع این اصطلاح توسط سوانته وولد و کمک بروس کوالسکی به تثبیت آن، زیرا دادههای ابزاری رو به رشد و محاسبات مقرون به صرفه نیاز به روشهای چندمتغیره را ایجاب میکردند. رگرسیون حداقل مربعات جزئی، که توسط وولد و مارتنز توسعه یافت، به ابزاری تعیینکننده تبدیل شد و این حوزه با ظهور دادههای طیفسنجی و اومیکس با ابعاد بالا گسترش یافت.
Key figures
- Svante Wold
- Bruce Kowalski
- Harald Martens
Related topics
Seminal works
- wold1987
- miller2018
- brereton2018
Frequently asked questions
- شیمیسنجی چه مشکلی را حل میکند؟
- ابزارهای مدرن دادههای بسیار بیشتری از آنچه آمار ساده میتواند مدیریت کند، تولید میکنند، مانند طیفهای کامل برای هر نمونه؛ شیمیسنجی روشهای چندمتغیره را برای یافتن الگوها، طبقهبندی نمونهها و پیشبینی غلظتها از تمام این دادهها به طور همزمان فراهم میکند.
- چرا مدلهای شیمیسنجی باید اعتبارسنجی شوند؟
- با متغیرهای زیاد، یک مدل میتواند به جای شیمی واقعی، نویز را برازش کند و در دادههای آموزشی دقیق به نظر برسد اما در نمونههای جدید شکست بخورد؛ اعتبارسنجی با اعتبارسنجی متقابل یا مجموعههای آزمایشی مستقل بررسی میکند که مدل واقعاً تعمیمپذیری دارد.