تجزیه وابستگی (Dependency Parsing)
تحلیل ساختار جمله به عنوان روابط سر-وابسته (head-dependent) برچسبگذاری شده بین کلمات، با استفاده از الگوریتمهای مبتنی بر انتقال و مبتنی بر گراف، که به طور فزایندهای تحت استاندارد جهانی وابستگیها (Universal Dependencies) انجام میشود.
Definition
تجزیه وابستگی به یک جمله یک گراف جهتدار اختصاص میدهد که در آن هر کلمه توسط یک رابطه گرامری برچسبگذاری شده به سر نحوی خود متصل میشود.
Scope
این موضوع شامل نمایشهای نحوی وابستگی، تجزیه مبتنی بر انتقال (شیفت-کاهش با یک اوراکل)، تجزیه مبتنی بر گراف (درخت پوشای ماکسیمم)، پروژکتیویته، و طرح حاشیهنویسی وابستگیهای جهانی است که امکان ایجاد درختبانکهای (treebanks) سازگار بین زبانی را فراهم میکند. همچنین به ارزیابی با نمره اتصال (attachment score) میپردازد. تجزیه سازهای (constituency parsing) و فرمالیسمهای گستردهتر در موضوعات مرتبط پوشش داده شدهاند.
Core questions
- چگونه تجزیهکنندههای مبتنی بر انتقال یک درخت وابستگی را به صورت افزایشی میسازند؟
- چگونه تجزیه مبتنی بر گراف درخت بهینه را به عنوان یک درخت پوشای ماکسیمم پیدا میکند؟
- پروژکتیویته چیست و چرا تجزیه را پیچیده میکند؟
- چگونه وابستگیهای جهانی حاشیهنویسیها را در زبانهای مختلف قابل مقایسه میکند؟
Key concepts
- رابطه وابستگی
- سر و وابسته
- تجزیه مبتنی بر انتقال
- تجزیه مبتنی بر گراف
- پروژکتیویته
- درخت پوشای ماکسیمم
- وابستگیهای جهانی
- نمره اتصال
Key theories
- تجزیه وابستگی مبتنی بر انتقال
- ساخت یک درخت وابستگی با دنبالهای از عملیات شیفت و کاهش که توسط یک طبقهبندیکننده آموزشدیده انتخاب میشوند و به تجزیه در زمان خطی دست مییابند.
- وابستگیهای جهانی
- فهرستی سازگار بین زبانی از روابط وابستگی و دستورالعملهای حاشیهنویسی که امکان مقایسه و انتقال درختبانکها و تجزیهکنندهها را در زبانهای مختلف فراهم میکند.
History
گرامر وابستگی به کار تسنیر (Tesnière) در اواسط قرن بیستم بازمیگردد، اما شکل محاسباتی آن در دهه 2000 با تجزیهکنندههای مبتنی بر انتقال نیور (Nivre) و تجزیهکنندههای مبتنی بر گراف مکدونالد (McDonald) به بلوغ رسید. پروژه وابستگیهای جهانی که در اواسط دهه 2010 آغاز شد، حاشیهنویسی را در بیش از صد زبان یکپارچه کرد.
Debates
- تجزیه مبتنی بر انتقال در مقابل تجزیه مبتنی بر گراف
- تجزیهکنندههای مبتنی بر انتقال سریع هستند اما ممکن است خطاهای محلی ایجاد کنند، در حالی که تجزیهکنندههای مبتنی بر گراف به صورت سراسری با هزینه بالاتر بهینهسازی میکنند؛ روشهای عصبی این بدهبستان را کاهش دادهاند اما آن را به طور کامل از بین نبردهاند.
Key figures
- Joakim Nivre
- Ryan McDonald
- Marie-Catherine de Marneffe
- Lucien Tesnière
Related topics
Seminal works
- nivre2008
- demarneffe2021
- kubler2009
Frequently asked questions
- پروژکتیویته به چه معناست؟
- یک درخت وابستگی زمانی پروژکتیو است که کمانهای آن را بتوان بدون تقاطع بالای جمله رسم کرد. ساختارهای غیرپروژکتیو، که در زبانهای با ترتیب کلمات آزاد رایج هستند، به الگوریتمهای تجزیهای نیاز دارند که امکان وابستگیهای متقاطع را فراهم کنند.