既然有了神经模型，统计自然语言处理是否已经过时？

并非如此。神经自然语言处理建立在相同的统计基础之上——概率、估计和评估——并且许多概念，如平滑、分类和语言建模，都直接延续到神经环境中。

统计与神经自然语言处理

现代计算语言学的核心数据驱动方法：从文本中学习的机器学习方法，涵盖统计分类器、词嵌入到基于Transformer的神经网络和大型语言模型。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

统计与神经自然语言处理是机器学习方法的主体，这些方法从数据而非手写规则中推断出语言处理能力。

涵盖主导当代自然语言处理的学习型方法——监督文本分类、分布式词表示和神经语言模型、序列到序列和Transformer架构，以及作为标志性应用的机器翻译。它将20世纪90年代的统计学革命和21世纪10年代的神经科学革命视为一个连续的轨迹。语言表征和应用在相邻领域中有所涵盖。

20世纪90年代的统计学革命用从语料库中估计的概率模型取代了手工构建的规则。21世纪10年代初的词嵌入和循环网络，随后是2017年的Transformer和大型预训练模型，在几乎所有任务中都取得了快速进展，并围绕学习到的表征重塑了该学科。

既然有了神经模型，统计自然语言处理是否已经过时？: 并非如此。神经自然语言处理建立在相同的统计基础之上——概率、估计和评估——并且许多概念，如平滑、分类和语言建模，都直接延续到神经环境中。