搭配是指习惯性地共同出现的词对或词组，其共现频率高于偶然性，例如“浓茶”（strong tea）而非“强力茶”（powerful tea）。关联度量有助于自动检测它们。

语料库语言学与网络语料库

通过大量真实文本样本研究语言：构建和查询语料库，测量搭配和频率，以及利用网络作为巨大的语言资源。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

Learn & explore

视频即将推出

Definition

语料库语言学是基于自然发生文本的系统性集合，通过频率、索引和关联度量进行分析的语言实证研究。

涵盖文本语料库的设计、编纂和分析——抽样和平衡、索引和关键词分析、频率和搭配统计（如互信息），以及将网络用作语料库。它涉及描述性语料库语言学和为计算系统提供数据。标注方案和树库在相关主题中涵盖。

语料库语言学起源于辛克莱的词典编纂项目和平衡语料库的构建，而丘奇和汉克斯1989年关于互信息的工作将统计关联度量引入主流。Kilgarriff和Grefenstette后来确立了网络作为一种合法（尽管有噪音）且规模空前的语料库。

什么是搭配？: 搭配是指习惯性地共同出现的词对或词组，其共现频率高于偶然性，例如“浓茶”（strong tea）而非“强力茶”（powerful tea）。关联度量有助于自动检测它们。