Semantik Leksikal dan Disambiguasi Makna Kata
Studi komputasi tentang makna kata: menentukan makna yang terkandung dalam suatu kata berdasarkan konteks, mengukur kemiripan semantik, dan memodelkan hubungan antar makna kata.
Definition
Semantik leksikal dalam linguistik komputasi adalah representasi, perbandingan, dan disambiguasi makna kata oleh mesin.
Scope
Mencakup makna kata-kata individual dan hubungannya — inventaris makna, disambiguasi makna kata, kemiripan dan keterkaitan semantik, serta model distribusi makna leksikal. Ini membahas metode berbasis pengetahuan yang menggunakan sumber daya seperti WordNet dan metode berbasis korpus serta saraf. Makna kalimat komposisional dibahas dalam topik terkait.
Core questions
- Bagaimana makna suatu kata ditentukan dari konteksnya?
- Bagaimana kemiripan semantik antar kata dikuantifikasi?
- Bagaimana perbedaan antara metode berbasis pengetahuan dan berbasis korpus terhadap makna leksikal?
- Bagaimana polisemi dan metafora ditangani secara komputasi?
Key concepts
- makna kata
- polisemi
- inventaris makna
- disambiguasi makna kata
- kemiripan semantik
- semantik distributif
- model ruang vektor
- hubungan leksikal
Key theories
- Disambiguasi makna kata
- Memilih makna kata ambigu yang sesuai secara kontekstual dari inventaris makna menggunakan konteks sekitarnya, sumber daya pengetahuan, atau pengklasifikasi yang dipelajari.
- Makna leksikal distributif
- Merepresentasikan makna kata dengan statistik kemunculan bersama dan ukuran asosiasi, sehingga kata-kata yang berhubungan secara semantik memiliki profil kontekstual yang serupa.
History
Disambiguasi makna kata telah menjadi tantangan yang telah lama ada, yang ditinjau secara komprehensif oleh Navigli pada tahun 2009. Pendekatan distributif, yang berakar pada hipotesis Harris dan dikembangkan oleh ukuran asosiasi Church dan Hanks, secara bertahap menyediakan model kemiripan berbasis data yang kini mendominasi semantik leksikal.
Debates
- Makna diskrit versus makna kontinu
- Apakah makna kata paling baik dimodelkan sebagai inventaris tetap dari makna diskrit atau sebagai ruang kontinu, sebuah ketegangan yang dipertajam oleh penyematan kontekstual yang mengaburkan batas-batas makna.
Key figures
- Roberto Navigli
- Kenneth Church
- Hinrich Schütze
- Zellig Harris
Related topics
Seminal works
- navigli2009
- church1989
Frequently asked questions
- Mengapa disambiguasi makna kata sulit?
- Banyak kata memiliki beberapa makna, dan memilih makna yang tepat seringkali membutuhkan pengetahuan dunia yang luas dan isyarat kontekstual yang halus yang sulit untuk dikodekan, itulah sebabnya hal ini tetap menjadi tantangan tolok ukur selama beberapa dekade.