为什么将语音和文本应用归为一类？

它们共享相同的概率和神经基础——语言模型、序列建模和评估——因此为其中一个领域开发的技术，例如语音识别中的语言建模，可以很容易地转移到另一个领域。

语音和语言应用

计算语言学的应用层面：在语音和文本之间进行转换，从文档中提取结构化信息，以及构建能够回答问题和进行对话的系统。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

语音和语言应用是感知、理解或生成人类语言的终端用户系统，通过组合计算语言学方法构建而成。

涵盖语音和语言技术的主要应用领域——自动语音识别、文本到语音合成、信息提取以及问答和对话系统。它将这些视为结合了该领域基础、解析、语义和学习方法的综合性任务。组件技术在其各自领域中有所涵盖。

语音识别推动了早期统计自然语言处理的很大一部分发展，共享语料库（如《华尔街日报》语料库）使得严格的比较成为可能。信息提取和问答通过1990年代和2000年代的评估活动而发展，随着神经方法和大型语言模型的成熟，对话系统成为消费产品。

为什么将语音和文本应用归为一类？: 它们共享相同的概率和神经基础——语言模型、序列建模和评估——因此为其中一个领域开发的技术，例如语音识别中的语言建模，可以很容易地转移到另一个领域。