ScholarGate
助手

语音和语言应用

计算语言学的应用层面:在语音和文本之间进行转换,从文档中提取结构化信息,以及构建能够回答问题和进行对话的系统。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

语音和语言应用是感知、理解或生成人类语言的终端用户系统,通过组合计算语言学方法构建而成。

Scope

涵盖语音和语言技术的主要应用领域——自动语音识别、文本到语音合成、信息提取以及问答和对话系统。它将这些视为结合了该领域基础、解析、语义和学习方法的综合性任务。组件技术在其各自领域中有所涵盖。

Sub-topics

Core questions

  • 口语如何转换为文本,文本又如何转换为口语?
  • 如何从非结构化文档中提取结构化信息?
  • 系统如何回答自然语言问题并维持对话?
  • 如何评估应用系统以适应实际使用?

Key concepts

  • 自动语音识别
  • 文本到语音
  • 信息提取
  • 命名实体识别
  • 问答
  • 对话系统
  • 声学模型
  • 评估

Key theories

噪声信道语音识别
通过结合声学模型和语言模型,将识别视为在给定声学信号的情况下恢复最可能的词序列。
语言理解流水线
应用程序将分词、解析、语义和检索组合成流水线或端到端模型,将用户输入映射到有用的响应。

History

语音识别推动了早期统计自然语言处理的很大一部分发展,共享语料库(如《华尔街日报》语料库)使得严格的比较成为可能。信息提取和问答通过1990年代和2000年代的评估活动而发展,随着神经方法和大型语言模型的成熟,对话系统成为消费产品。

Debates

流水线与端到端系统
是使用模块化语言组件构建应用程序,还是训练端到端神经网络系统;在数据充足的情况下,端到端方法占据主导地位,但可解释性较低。

Key figures

  • Daniel Jurafsky
  • James H. Martin
  • Frederick Jelinek
  • Janet Baker

Related topics

Seminal works

  • paul1992
  • manning1999
  • jurafsky2025

Frequently asked questions

为什么将语音和文本应用归为一类?
它们共享相同的概率和神经基础——语言模型、序列建模和评估——因此为其中一个领域开发的技术,例如语音识别中的语言建模,可以很容易地转移到另一个领域。

Methods for this concept

Related concepts