Sözcüksel Veritabanları ve Ontolojiler
Sözcük anlamlarının ve aralarındaki ilişkilerin makine tarafından okunabilir envanterleri — WordNet, FrameNet ve ilgili ontolojiler — hesaplamalı sistemlere sözcüksel anlambilime yapılandırılmış erişim sağlamaktadır.
Tanım
Sözcüksel bir veritabanı veya ontoloji, sözcük anlamlarını ve aralarındaki anlamsal ilişkileri bilgisayar programları tarafından kullanılabilecek bir biçimde kaydeden yapılandırılmış bir kaynaktır.
Kapsam
Sözcüksel-anlamsal kaynakların tasarımını ve kullanımını kapsamaktadır: WordNet'in eşanlamlı kümeleri (synset) ve hiyerarşik ilişkileri, FrameNet'in anlamsal çerçeveleri ve rolleri ile daha geniş hesaplamalı ontolojiler. Bu kaynakların eşanlamlılık (synonymy), üst terimlik (hypernymy) ve yüklem-argüman yapısını nasıl kodladığı ve anlam belirsizliğini giderme ile çıkarımı nasıl desteklediği ele alınmaktadır. Dağılımsal ve sinirsel sözcüksel anlambilim, hesaplamalı anlambilim altında incelenmektedir.
Temel sorular
- WordNet, anlamları sözcüksel ilişkilerle birbirine bağlanan eşanlamlı kümeler (synset) halinde nasıl düzenlemektedir?
- FrameNet, anlamı çerçeveler ve roller açısından nasıl temsil etmektedir?
- Bu kaynaklar, sözcük anlamı belirsizliğini giderme ve benzerlik için nasıl kullanılmaktadır?
- Elle oluşturulan sözcüksel ontolojilerin sınırları nelerdir?
Anahtar kavramlar
- eşanlamlı küme (synset)
- üst terimlik (hypernymy) ve alt terimlik (hyponymy)
- parça-bütün ilişkisi (meronymy)
- anlamsal çerçeve
- çerçeve öğesi
- sözcük anlamı belirsizliğini giderme
- sözcüksel ontoloji
- yüklem-argüman yapısı
Temel kuramlar
- Eşanlamlı küme (synset) tabanlı sözcüksel organizasyon
- Sözlüğü, WordNet'te olduğu gibi, üst terimlik (hypernymy) ve parça-bütün ilişkisi (meronymy) gibi ilişkilerle birbirine bağlanan eşanlamlı kümeler (synset) olarak modelleyerek sözcük anlamına bir grafik yapısı kazandırmaktadır.
- Çerçeve anlambilimi (Frame semantics)
- Sözcük anlamını, çağrıştırdığı durumlar (çerçeveler) ve bunların içindeki katılımcı roller aracılığıyla temsil etme; FrameNet'te sözcüksel bir kaynak olarak işlevselleştirilmiştir.
Tarihçe
George Miller'ın grubu tarafından 1980'lerde başlatılan ve 1995 ile 1998'de belgelenen WordNet, hesaplamalı dilbilimde en yaygın kullanılan sözcüksel kaynak haline gelmiştir. Fillmore'un çerçeve anlambilimi (frame semantics), 1990'ların sonlarında FrameNet olarak işlevselleştirilmiş ve WordNet'i açık yüklem-argüman yapısı ile tamamlamıştır.
Tartışmalar
- Elle oluşturulan kaynaklar ile öğrenilmiş temsiller
- Öğrenilmiş gömme (embedding) çağında derlenmiş sözcüksel veritabanlarının hala değerli olup olmadığı tartışılmaktadır; birçok kişi, bu veritabanlarının dağılımsal modellerin eksik olduğu yorumlanabilir yapı ve temel gerçekliği sağlamaya devam ettiğini savunmaktadır.
Öne çıkan isimler
- George Miller
- Christiane Fellbaum
- Charles Fillmore
- Collin Baker
İlgili konular
Temel eserler
- miller1995
- fellbaum1998
- baker1998
Sıkça sorulan sorular
- WordNet'te eşanlamlı küme (synset) nedir?
- Eşanlamlı küme (synset), belirli bir bağlamda birbirinin yerine geçebilen — eşanlamlı — sözcüklerin tek bir kavram olarak gruplandığı ve 'bir türüdür' (is-a) ve 'bir parçasıdır' (part-of) gibi ilişkilerle diğer eşanlamlı kümelere bağlandığı bir kümedir.