음성 및 텍스트 응용 프로그램을 함께 그룹화하는 이유는 무엇입니까?

이들은 언어 모델, 시퀀스 모델링 및 평가와 같은 동일한 확률적 및 신경망 기반을 공유하므로 음성 인식의 언어 모델링과 같이 한 분야를 위해 개발된 기술은 다른 분야로 쉽게 이전될 수 있습니다.

음성 및 언어 응용

계산 언어학의 응용 분야: 음성과 텍스트 간 변환, 문서에서 구조화된 정보 추출, 질문에 답하고 대화를 수행하는 시스템 구축.

PaperMind(으)로 주제 찾기곧 제공Find papers & topics

Tools & resources

슬라이드 다운로드

Learn & explore

동영상곧 제공

Definition

음성 및 언어 응용은 계산 언어학의 방법을 조합하여 구축된, 인간 언어를 인지, 이해 또는 생성하는 최종 사용자 시스템입니다.

Scope

음성 및 언어 기술의 주요 응용 분야인 자동 음성 인식, 텍스트 음성 변환 합성, 정보 추출, 질의응답 및 대화 시스템을 다룹니다. 이러한 분야를 해당 분야의 기초, 구문 분석, 의미론 및 학습 방법을 결합하는 통합 작업으로 설명합니다. 구성 요소 기술은 각 해당 영역에서 다루어집니다.

Sub-topics

Core questions

음성 언어는 어떻게 텍스트로 변환되고 텍스트에서 음성으로 변환됩니까?
비정형 문서에서 구조화된 정보는 어떻게 추출됩니까?
시스템은 자연어 질문에 어떻게 답하고 대화를 유지합니까?
실제 사용을 위해 응용 시스템은 어떻게 평가됩니까?

Key concepts

자동 음성 인식
텍스트 음성 변환
정보 추출
개체명 인식
질의응답
대화 시스템
음향 모델
평가

Key theories

잡음 채널 음성 인식: 음향 모델과 언어 모델을 결합하여 음향 신호가 주어졌을 때 가장 가능성 있는 단어 시퀀스를 복구하는 것으로 인식을 구성하는 방식입니다.
언어 이해 파이프라인: 응용 프로그램은 토큰화, 구문 분석, 의미론 및 검색을 파이프라인 또는 종단 간 모델로 구성하여 사용자 입력을 유용한 응답으로 매핑합니다.

History

음성 인식은 초기 통계적 자연어 처리(NLP)의 많은 부분을 주도했으며, Wall Street Journal 컬렉션과 같은 공유 코퍼스는 엄격한 비교를 가능하게 했습니다. 정보 추출 및 질의응답은 1990년대와 2000년대의 평가 캠페인을 통해 성장했으며, 신경망 방법과 대규모 언어 모델이 성숙함에 따라 대화 시스템은 소비자 제품이 되었습니다.

Debates

파이프라인 대 종단 간 시스템: 모듈식 언어 구성 요소로 응용 프로그램을 구축할지 아니면 종단 간 신경망 시스템을 훈련할지에 대한 논쟁입니다. 데이터가 풍부한 곳에서는 종단 간 접근 방식이 지배적이지만, 해석 가능성이 떨어집니다.

Key figures

Daniel Jurafsky
James H. Martin
Frederick Jelinek
Janet Baker

Seminal works

paul1992
manning1999
jurafsky2025

Frequently asked questions

음성 및 텍스트 응용 프로그램을 함께 그룹화하는 이유는 무엇입니까?: 이들은 언어 모델, 시퀀스 모델링 및 평가와 같은 동일한 확률적 및 신경망 기반을 공유하므로 음성 인식의 언어 모델링과 같이 한 분야를 위해 개발된 기술은 다른 분야로 쉽게 이전될 수 있습니다.