Perception de la parole et intelligibilité
La perception de la parole est le processus par lequel les auditeurs récupèrent les unités linguistiques, les mots et le sens à partir du signal acoustique de la parole, qui varie rapidement. L'intelligibilité est le degré auquel la parole est correctement comprise, et elle dépend du matériel de parole, de l'auditeur et des conditions d'écoute, en particulier du bruit de fond. Ce sujet aborde les indices acoustiques qui distinguent les sons de la parole, la manière dont les auditeurs les catégorisent, et comment l'intelligibilité est mesurée et prédite.
Definition
La perception de la parole est le processus auditif et cognitif qui consiste à mapper le signal acoustique de la parole sur des catégories linguistiques telles que les phonèmes et les mots, et l'intelligibilité est une mesure de la précision avec laquelle un auditeur récupère la parole intentionnelle.
Scope
Ce sujet couvre les indices acoustiques des voyelles et des consonnes, la perception catégorielle des phonèmes, la robustesse de la parole à la dégradation et au bruit, ainsi que la mesure et la prédiction de l'intelligibilité. Il s'agit d'un matériel de référence et éducatif sur la perception auditive et de la parole, et non d'un guide clinique.
Core questions
- Quels indices acoustiques distinguent un son de la parole d'un autre ?
- Comment les auditeurs mappent-ils un signal variant continuellement sur des phonèmes discrets ?
- Quelle proportion du signal de parole peut être dégradée avant que l'intelligibilité ne soit compromise ?
- Comment l'intelligibilité de la parole est-elle mesurée et prédite dans différentes conditions d'écoute ?
Key concepts
- Formants et identité vocalique
- Temps d'établissement du voisement (voice onset time) et indices consonantiques
- Perception catégorielle
- Seuil de réception de la parole (speech reception threshold)
- Indice d'intelligibilité de la parole (Speech Intelligibility Index)
- Indices d'enveloppe versus de structure fine
- Parole dans le bruit et masquage informationnel
Key theories
- Perception catégorielle de la parole
- Les auditeurs ont tendance à partitionner les continua de sons de la parole, tels qu'une série variant en temps d'établissement du voisement (voice onset time), en catégories phonémiques discrètes, discriminant les paires qui chevauchent une frontière de catégorie bien mieux que les paires également espacées au sein d'une catégorie.
- Distribution de l'information de la parole à travers les bandes de fréquences
- L'intelligibilité peut être prédite en pondérant l'audibilité de la parole à travers les bandes de fréquences, ce qui constitue la base de l'indice d'articulation et de l'indice d'intelligibilité de la parole (speech intelligibility index), qui quantifient la quantité d'informations de parole utilisables atteignant l'auditeur.
Mechanisms
Les voyelles sont largement identifiées par les fréquences de leurs formants, les résonances du conduit vocal, tandis que les consonnes sont signalées par des transitions spectrales rapides, des explosions (bursts) et des indices temporels tels que le temps d'établissement du voisement (voice onset time). Le système auditif extrait ces motifs spectraux et temporels, et les niveaux de traitement supérieurs les mappent sur des catégories de phonèmes et de mots, en s'appuyant sur le contexte et les connaissances linguistiques. La parole est très redondante, elle reste donc intelligible même lorsqu'elle est considérablement dégradée ; des expériences remplaçant les détails spectraux fins par quelques bandes de bruit modulé en amplitude montrent que la lente enveloppe temporelle seule peut soutenir une bonne reconnaissance dans le silence, un principe pertinent pour le codage des implants cochléaires.
Clinical relevance
La difficulté à comprendre la parole, en particulier dans le bruit, est l'une des conséquences les plus courantes et les plus invalidantes de la perte auditive, et elle peut dépasser ce que les seuils de sons purs (pure-tone thresholds) prédisent, car une sélectivité fréquentielle et un codage temporel réduits dégradent les indices sur lesquels les auditeurs s'appuient. Les mesures de perception de la parole complètent donc l'audiogramme pour décrire l'audition fonctionnelle. Ce matériel explique pourquoi la compréhension de la parole est testée et ne constitue pas une base pour un diagnostic ou un traitement individuel.
Evidence & guidelines
La base acoustique des voyelles et des consonnes a été cartographiée dans des études classiques par Peterson et Barney (1952) et Miller et Nicely (1955), et la perception catégorielle a été établie par Liberman et ses collègues (1957). La prédiction de l'intelligibilité à partir de l'audibilité des bandes est standardisée sous la forme de l'indice d'intelligibilité de la parole (Speech Intelligibility Index) dans la norme ANSI S3.5-1997, et la suffisance des indices d'enveloppe temporelle a été démontrée par Shannon et ses collègues (1995).
History
Les travaux de guerre et d'après-guerre aux Bell Laboratories sur l'articulation de la parole téléphonique ont produit l'indice d'articulation et des études détaillées de l'acoustique des consonnes et des voyelles. Liberman et ses collègues des Haskins Laboratories ont établi la perception catégorielle dans les années 1950 et ont développé des théories influentes de la parole. Des travaux ultérieurs, y compris des études de vocodeur à bandes par Shannon et ses collègues, ont clarifié les rôles relatifs du détail spectral et de l'enveloppe temporelle et ont éclairé le traitement du signal des implants cochléaires.
Debates
- La parole est-elle perçue par des mécanismes spécialisés ou par des processus auditifs généraux ?
- Les théories divergent quant à savoir si la parole recrute un mode perceptif dédié lié à l'articulation ou si elle est traitée par des processus auditifs et d'apprentissage à usage général ; les deux points de vue expliquent des parties des preuves et la question reste controversée.
Key figures
- George A. Miller
- Gordon Peterson
- Alvin Liberman
- Robert Shannon
- Harvey Fletcher
Related topics
Seminal works
- peterson-barney-1952
- miller-nicely-1955
- liberman-1957
- shannon-1995
Frequently asked questions
- Pourquoi la perte auditive peut-elle rendre la parole difficile à comprendre même lorsque les sons sont audibles ?
- L'audibilité rétablit la détection mais pas la résolution fine en fréquence et en temps sur laquelle la parole s'appuie. Une sélectivité cochléaire et un codage temporel réduits estompent les indices qui distinguent les sons de la parole, de sorte que la compréhension, en particulier dans le bruit, peut rester médiocre même lorsque les sons sont suffisamment forts pour être entendus.
- Comment l'intelligibilité de la parole est-elle mesurée ?
- Elle est couramment mesurée de manière comportementale comme le pourcentage de mots ou de phrases correctement identifiés à un niveau ou un rapport signal/bruit donné, parfois résumé comme un seuil de réception de la parole (speech reception threshold). Elle peut également être prédite à partir de l'audibilité de la parole à travers les bandes de fréquences en utilisant des indices tels que l'indice d'intelligibilité de la parole (Speech Intelligibility Index).