语音和语言应用
计算语言学的应用层面:在语音和文本之间进行转换,从文档中提取结构化信息,以及构建能够回答问题和进行对话的系统。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
语音和语言应用是感知、理解或生成人类语言的终端用户系统,通过组合计算语言学方法构建而成。
Scope
涵盖语音和语言技术的主要应用领域——自动语音识别、文本到语音合成、信息提取以及问答和对话系统。它将这些视为结合了该领域基础、解析、语义和学习方法的综合性任务。组件技术在其各自领域中有所涵盖。
Sub-topics
Core questions
- 口语如何转换为文本,文本又如何转换为口语?
- 如何从非结构化文档中提取结构化信息?
- 系统如何回答自然语言问题并维持对话?
- 如何评估应用系统以适应实际使用?
Key concepts
- 自动语音识别
- 文本到语音
- 信息提取
- 命名实体识别
- 问答
- 对话系统
- 声学模型
- 评估
Key theories
- 噪声信道语音识别
- 通过结合声学模型和语言模型,将识别视为在给定声学信号的情况下恢复最可能的词序列。
- 语言理解流水线
- 应用程序将分词、解析、语义和检索组合成流水线或端到端模型,将用户输入映射到有用的响应。
History
语音识别推动了早期统计自然语言处理的很大一部分发展,共享语料库(如《华尔街日报》语料库)使得严格的比较成为可能。信息提取和问答通过1990年代和2000年代的评估活动而发展,随着神经方法和大型语言模型的成熟,对话系统成为消费产品。
Debates
- 流水线与端到端系统
- 是使用模块化语言组件构建应用程序,还是训练端到端神经网络系统;在数据充足的情况下,端到端方法占据主导地位,但可解释性较低。
Key figures
- Daniel Jurafsky
- James H. Martin
- Frederick Jelinek
- Janet Baker
Related topics
Seminal works
- paul1992
- manning1999
- jurafsky2025
Frequently asked questions
- 为什么将语音和文本应用归为一类?
- 它们共享相同的概率和神经基础——语言模型、序列建模和评估——因此为其中一个领域开发的技术,例如语音识别中的语言建模,可以很容易地转移到另一个领域。