Applications du traitement de la parole et du langage
La dimension appliquée de la linguistique computationnelle : conversion entre la parole et le texte, extraction d'informations structurées à partir de documents, et développement de systèmes capables de répondre à des questions et de tenir des conversations.
Definition
Les applications du traitement de la parole et du langage sont des systèmes destinés aux utilisateurs finaux qui perçoivent, comprennent ou produisent le langage humain, construits en combinant les méthodes de la linguistique computationnelle.
Scope
Couvre les principaux domaines d'application des technologies de la parole et du langage — reconnaissance automatique de la parole, synthèse vocale, extraction d'informations, et systèmes de questions-réponses et de dialogue. Ces domaines sont présentés comme des tâches intégratives qui combinent les fondements de la discipline, l'analyse syntaxique (parsing), la sémantique et les méthodes d'apprentissage. Les techniques composantes sont abordées dans leurs domaines respectifs.
Sub-topics
Core questions
- Comment le langage parlé est-il converti en texte et vice-versa ?
- Comment les informations structurées sont-elles extraites de documents non structurés ?
- Comment les systèmes répondent-ils aux questions en langage naturel et maintiennent-ils un dialogue ?
- Comment les systèmes applicatifs sont-ils évalués pour une utilisation dans le monde réel ?
Key concepts
- reconnaissance automatique de la parole
- synthèse vocale
- extraction d'informations
- reconnaissance d'entités nommées
- systèmes de questions-réponses
- système de dialogue
- modèle acoustique
- évaluation
Key theories
- Reconnaissance vocale par canal bruité
- Formuler la reconnaissance comme la récupération de la séquence de mots la plus probable étant donné un signal acoustique, en combinant un modèle acoustique et un modèle de langage.
- Pipeline de compréhension du langage
- Les applications composent la tokenisation, l'analyse syntaxique (parsing), la sémantique et la récupération d'informations en pipelines ou en modèles de bout en bout qui associent l'entrée utilisateur à des réponses utiles.
History
La reconnaissance vocale a été un moteur essentiel d'une grande partie du traitement automatique du langage naturel (TALN) statistique précoce, avec des corpus partagés tels que la collection du Wall Street Journal permettant des comparaisons rigoureuses. L'extraction d'informations et les systèmes de questions-réponses se sont développés grâce à des campagnes d'évaluation dans les années 1990 et 2000, et les systèmes de dialogue sont devenus des produits de consommation à mesure que les méthodes neuronales et les grands modèles de langage ont mûri.
Debates
- Pipelines versus systèmes de bout en bout
- Faut-il construire des applications à partir de composants linguistiques modulaires ou entraîner des systèmes neuronaux de bout en bout ? Les approches de bout en bout dominent là où les données sont abondantes, mais offrent moins d'interprétabilité.
Key figures
- Daniel Jurafsky
- James H. Martin
- Frederick Jelinek
- Janet Baker
Related topics
Seminal works
- paul1992
- manning1999
- jurafsky2025
Frequently asked questions
- Pourquoi regrouper les applications de la parole et du texte ?
- Elles partagent les mêmes fondements probabilistes et neuronaux — modèles de langage, modélisation de séquences et évaluation — de sorte que les techniques développées pour l'une, comme la modélisation du langage en reconnaissance vocale, se transfèrent facilement à l'autre.