Basis Data Leksikal dan Ontologi
Inventaris makna kata dan hubungannya yang dapat dibaca mesin — WordNet, FrameNet, dan ontologi terkait — yang memberikan akses terstruktur kepada sistem komputasi terhadap semantik leksikal.
Definition
Basis data atau ontologi leksikal adalah sumber daya terstruktur yang mencatat makna kata dan hubungan semantik di antara mereka dalam bentuk yang dapat digunakan oleh program komputer.
Scope
Mencakup desain dan penggunaan sumber daya leksikal-semantik: synset dan hubungan hierarkis WordNet, kerangka dan peran semantik FrameNet, serta ontologi komputasi yang lebih luas. Ini membahas bagaimana sumber daya tersebut mengkodekan sinonimitas, hipernimitas, dan struktur predikat-argumen serta bagaimana mereka mendukung disambiguasi dan inferensi. Semantik leksikal distributif dan neural dibahas dalam semantik komputasi.
Core questions
- Bagaimana WordNet mengorganisir makna ke dalam synset yang dihubungkan oleh relasi leksikal?
- Bagaimana FrameNet merepresentasikan makna dalam bentuk kerangka dan peran?
- Bagaimana sumber daya ini digunakan untuk disambiguasi dan kesamaan makna kata?
- Apa batasan ontologi leksikal yang dibangun secara manual?
Key concepts
- synset
- hipernimitas dan hiponimitas
- meronimi
- kerangka semantik
- elemen kerangka
- disambiguasi makna kata
- ontologi leksikal
- struktur predikat-argumen
Key theories
- Organisasi leksikal berbasis Synset
- Memodelkan leksikon sebagai kumpulan sinonim (synset) yang dihubungkan oleh relasi seperti hipernimitas dan meronimi, seperti dalam WordNet, memberikan struktur grafik pada makna kata.
- Semantik kerangka
- Merepresentasikan makna kata melalui situasi (kerangka) yang ditimbulkannya dan peran partisipan di dalamnya, dioperasionalkan sebagai sumber daya leksikal dalam FrameNet.
History
WordNet, yang dimulai oleh kelompok George Miller pada tahun 1980-an dan didokumentasikan pada tahun 1995 dan 1998, menjadi sumber daya leksikal yang paling banyak digunakan dalam linguistik komputasi. Semantik kerangka Fillmore dioperasionalkan sebagai FrameNet pada akhir 1990-an, melengkapi WordNet dengan struktur predikat-argumen yang eksplisit.
Debates
- Sumber daya yang dibangun secara manual versus representasi yang dipelajari
- Apakah basis data leksikal yang dikurasi tetap berharga di era embedding yang dipelajari; banyak yang berpendapat bahwa mereka masih menyediakan struktur yang dapat diinterpretasikan dan kebenaran dasar yang tidak dimiliki oleh model distributif.
Key figures
- George Miller
- Christiane Fellbaum
- Charles Fillmore
- Collin Baker
Related topics
Seminal works
- miller1995
- fellbaum1998
- baker1998
Frequently asked questions
- Apa itu synset dalam WordNet?
- Synset adalah sekumpulan kata yang dapat saling dipertukarkan dalam beberapa konteks — sinonim — dikelompokkan sebagai satu konsep dan dihubungkan ke synset lain oleh relasi seperti 'adalah-a' dan 'bagian-dari'.