음성 및 언어 응용
계산 언어학의 응용 분야: 음성과 텍스트 간 변환, 문서에서 구조화된 정보 추출, 질문에 답하고 대화를 수행하는 시스템 구축.
PaperMind(으)로 주제 찾기곧 제공Find papers & topics
Tools & resources
Learn & explore
동영상곧 제공
Definition
음성 및 언어 응용은 계산 언어학의 방법을 조합하여 구축된, 인간 언어를 인지, 이해 또는 생성하는 최종 사용자 시스템입니다.
Scope
음성 및 언어 기술의 주요 응용 분야인 자동 음성 인식, 텍스트 음성 변환 합성, 정보 추출, 질의응답 및 대화 시스템을 다룹니다. 이러한 분야를 해당 분야의 기초, 구문 분석, 의미론 및 학습 방법을 결합하는 통합 작업으로 설명합니다. 구성 요소 기술은 각 해당 영역에서 다루어집니다.
Sub-topics
Core questions
- 음성 언어는 어떻게 텍스트로 변환되고 텍스트에서 음성으로 변환됩니까?
- 비정형 문서에서 구조화된 정보는 어떻게 추출됩니까?
- 시스템은 자연어 질문에 어떻게 답하고 대화를 유지합니까?
- 실제 사용을 위해 응용 시스템은 어떻게 평가됩니까?
Key concepts
- 자동 음성 인식
- 텍스트 음성 변환
- 정보 추출
- 개체명 인식
- 질의응답
- 대화 시스템
- 음향 모델
- 평가
Key theories
- 잡음 채널 음성 인식
- 음향 모델과 언어 모델을 결합하여 음향 신호가 주어졌을 때 가장 가능성 있는 단어 시퀀스를 복구하는 것으로 인식을 구성하는 방식입니다.
- 언어 이해 파이프라인
- 응용 프로그램은 토큰화, 구문 분석, 의미론 및 검색을 파이프라인 또는 종단 간 모델로 구성하여 사용자 입력을 유용한 응답으로 매핑합니다.
History
음성 인식은 초기 통계적 자연어 처리(NLP)의 많은 부분을 주도했으며, Wall Street Journal 컬렉션과 같은 공유 코퍼스는 엄격한 비교를 가능하게 했습니다. 정보 추출 및 질의응답은 1990년대와 2000년대의 평가 캠페인을 통해 성장했으며, 신경망 방법과 대규모 언어 모델이 성숙함에 따라 대화 시스템은 소비자 제품이 되었습니다.
Debates
- 파이프라인 대 종단 간 시스템
- 모듈식 언어 구성 요소로 응용 프로그램을 구축할지 아니면 종단 간 신경망 시스템을 훈련할지에 대한 논쟁입니다. 데이터가 풍부한 곳에서는 종단 간 접근 방식이 지배적이지만, 해석 가능성이 떨어집니다.
Key figures
- Daniel Jurafsky
- James H. Martin
- Frederick Jelinek
- Janet Baker
Related topics
Seminal works
- paul1992
- manning1999
- jurafsky2025
Frequently asked questions
- 음성 및 텍스트 응용 프로그램을 함께 그룹화하는 이유는 무엇입니까?
- 이들은 언어 모델, 시퀀스 모델링 및 평가와 같은 동일한 확률적 및 신경망 기반을 공유하므로 음성 인식의 언어 모델링과 같이 한 분야를 위해 개발된 기술은 다른 분야로 쉽게 이전될 수 있습니다.