言语-语言样本分析与非正式评估
言语-语言样本分析与非正式评估是对个人在对话、叙述或游戏中进行的交流进行描述性评估,而非在标准化测试的固定条件下进行。记录、转录和分析具有代表性的言语和语言样本,以获取诸如话语长度、语法准确性、词汇多样性、可懂度以及叙事组织等方面的衡量指标,从而描绘出功能性语言使用的情况。
Definition
语言样本分析是指引出、转录和系统分析个人自发性言语和语言的代表性样本,以使用诸如平均话语长度、语法和词汇指标以及叙事结构等测量方法来描述其交流能力。
Scope
本主题涵盖了自然交流采样的基本原理、样本的引出、转录、切分和编码程序、从中得出的常见定量和描述性测量,以及非正式评估相对于标准化测试的优势和局限性。本文旨在作为一种方法的参考性描述,而非评估个体的具体程序。
Core questions
- 如何使样本具有代表性,以反映一个人的日常交流?
- 从样本中得出的哪些测量最可靠地反映语言能力,以及可靠性如何受样本长度的影响?
- 描述性采样能揭示哪些标准化测试不能揭示的,反之亦然?
- 如何保持转录和编码决策的一致性,以支持随时间推移的比较?
Key concepts
- 自然交流的代表性采样
- 引出情境(对话、叙事、游戏、说明)
- 转录和话语切分
- 平均话语长度(MLU)
- 词汇多样性和语法测量
- 叙事宏观结构和微观结构
- 可懂度分析
- 用于描述性比较的参考数据库
Mechanisms
临床医生在一个或多个情境中引出连贯的言语,进行记录,并将其转录为分段的话语。从转录文本中,计算定量指标(例如,平均话语长度、词汇多样性测量和语法结构计数)和描述性分析(例如,叙事宏观结构),并可与参考数据库进行比较。这些测量的有效性取决于样本的代表性和足够的长度;较短的转录文本会使某些测量的估计值稳定性较差,因此长度本身就是一个方法学变量(Heilmann, Nockerts, & Miller, 2010)。叙事评分方案将采样范围从句子层面的指标扩展到语篇组织(Heilmann, Miller, Nockerts, & Dunaway, 2010)。
Clinical relevance
语言采样提供了功能性、情境丰富的信息,补充了标准化分数,并且在缺乏常模参照测试或其不适合个人背景时,尤其具有信息价值。本条目描述了如何收集和分析此类样本,以及它们能显示什么和不能显示什么;它是一个参考性导向,而非评估个体的协议。
Evidence & guidelines
语言样本测量的研究表明,其稳定性取决于转录文本的长度以及转录和编码的一致性,并且参考数据库允许在没有正式规范限制的情况下进行描述性比较(Heilmann, Nockerts, & Miller, 2010; Heilmann, Miller, Nockerts, & Dunaway, 2010)。采样通常被推荐作为标准化测试的补充,特别是考虑到一些正式测试已有的心理测量学局限性(McCauley & Swisher, 1984)。
History
对儿童自发语言的描述性分析在发展研究中有着悠久的传统,临床语言样本分析在20世纪后期通过结构化转录和编码约定,以及后来的计算机辅助转录分析和参考数据库而系统化。此后,研究已经完善了哪些测量是可靠的,以及采样条件(包括转录文本长度)如何影响它们(Heilmann, Nockerts, & Miller, 2010)。
Debates
- 样本需要多长才能产生稳定的测量结果?
- 从语言样本中得出的一些指标只有在足够长的转录文本下才能稳定,因此非常短的样本可能会错误地代表能力;可行性与测量稳定性之间的权衡是一个活跃的方法学考量。
Key figures
- Jon Miller
- John Heilmann
- Ann Nockerts
- Robin Chapman
Related topics
Seminal works
- heilmann-2010-length
- heilmann-2010-databases
Frequently asked questions
- 语言采样与标准化测试有何不同?
- 标准化测试在受控条件下将固定反应与常模进行比较,而语言样本则描述一个人在自然情境中实际交流的方式,捕捉结构化测试可能遗漏的功能性使用。
- 为什么强调转录文本长度和编码一致性?
- 因为一些基于样本的测量只有在足够长度下才能稳定,并且转录和编码选择会影响数值,因此控制这些因素对于测量的可靠性和随时间推移的可比性是必要的。