Soru Cevaplama ve Diyalog Sistemleri
Doğal dildeki soruları yanıtlayan ve sohbetler gerçekleştiren sistemlerdir; bilgi erişimine dayalı ve okuduğunu anlama tabanlı soru cevaplamayı, ayrıca görev odaklı ve açık alan diyalog ajanlarını kapsamaktadır.
Tanım
Soru cevaplama, doğal dildeki bir soruya doğrudan bir yanıt döndürürken, bir diyalog sistemi ise bir kullanıcıyı bilgilendirmek veya ona yardımcı olmak amacıyla çok turlu bir sohbeti sürdürmektedir.
Kapsam
Soru cevaplama — olgusal (factoid), bilgi erişimine dayalı ve okuduğunu anlama yaklaşımları — ile diyalog sistemlerini, yani diyalog durumu takibi (dialogue-state tracking) yapan görev odaklı ajanları ve açık alan sohbet modellerini kapsamaktadır. Önceden eğitilmiş modellerin rolünü ve doğruluk ile tutarlılığın değerlendirilmesini ele almaktadır. Temelindeki transformer mimarileri istatistiksel ve nöral alanında incelenmektedir.
Temel sorular
- Bilgi erişimine dayalı ve okuduğunu anlama tabanlı soru cevaplama nasıl farklılık göstermektedir?
- Görev odaklı diyalog sistemleri durumu nasıl takip eder ve eylemleri nasıl seçer?
- Açık alan sohbet ajanlarını ayıran özellikler nelerdir?
- Yanıtlar ve sohbetler kalite açısından nasıl değerlendirilmektedir?
Anahtar kavramlar
- olgusal soru cevaplama
- okuduğunu anlama
- bilgi erişimi
- görev odaklı diyalog
- diyalog durumu takibi
- açık alan diyalogu
- sohbet ajanı
- değerlendirme
Temel kuramlar
- Okuduğunu anlama tabanlı soru cevaplama
- Bir metinden yanıtı bularak veya üreterek soruları cevaplama; bu görev, anlama veri kümeleri üzerinde ince ayar yapılmış önceden eğitilmiş transformer'lar tarafından dönüştürülmüştür.
- Diyalog durumu takibi
- Görev odaklı bir sistemin ne soracağını, neyi onaylayacağını veya neyi yürüteceğini belirleyebilmesi için kullanıcının hedeflerinin turlar boyunca yapılandırılmış bir temsilini sürdürmektir.
Tarihçe
Sohbet sistemleri, basit örüntü eşleştirme kullanan Weizenbaum'ın ELIZA'sına (1966) dayanmaktadır. Soru cevaplama, değerlendirme kampanyaları aracılığıyla olgunlaşmış ve BERT gibi büyük önceden eğitilmiş modellerin ve sonraki üretken modellerin ortaya çıkışı, okuduğunu anlama ve açık alan diyalogunu önemli ölçüde geliştirmiştir.
Tartışmalar
- Gerçek anlama ile örüntü eşleştirme karşıtlığı
- Akıcı sohbet sistemlerinin dili anlayıp anlamadığı veya ELIZA gibi yüzeysel örüntüleri kullanıp kullanmadığı; büyük modellerin ikna edici ancak bazen temelsiz yanıtlar üretmesiyle bu soru aciliyet kazanmaktadır.
Öne çıkan isimler
- Joseph Weizenbaum
- Daniel Jurafsky
- Jacob Devlin
İlgili konular
Temel eserler
- weizenbaum1966
- devlin2019
Sıkça sorulan sorular
- Görev odaklı diyalog ile açık alan diyalogu arasındaki fark nedir?
- Görev odaklı sistemler, bir uçuş rezervasyonu yapmak gibi belirli bir amacı gerçekleştirmesi için kullanıcıya yardımcı olur ve yapılandırılmış durumu takip eder. Açık alan sistemleri ise tanımlanmış bir görevi tamamlamaktan ziyade tutarlılık ve etkileşimi önceliklendirerek her konuda sohbet etmeyi amaçlamaktadır.