Ngữ liệu lịch sử và các ghi chép được chứng thực
Các ghi chép và ngữ liệu được tập hợp cung cấp bằng chứng sơ cấp đã được chứng thực về lịch sử của các ngôn ngữ, cùng với các phương pháp sử dụng chúng một cách có trách nhiệm.
Definition
Ngữ liệu lịch sử và các ghi chép được chứng thực là tập hợp các bằng chứng viết còn sót lại về các giai đoạn trước đó của một ngôn ngữ, bao gồm các bản khắc, bản thảo và các bộ sưu tập điện tử có cấu trúc, được sử dụng làm dữ liệu sơ cấp để nghiên cứu lịch sử ngôn ngữ.
Scope
Chủ đề này bao gồm cơ sở tài liệu của ngôn ngữ học lịch sử: các bản khắc, bản thảo, văn bản in và các ngữ liệu điện tử có cấu trúc được xây dựng từ chúng. Nó đề cập đến việc xác định niên đại và giải thích các chứng thực, những khoảng trống và sai lệch của các ghi chép còn sót lại, sự phân biệt giữa bằng chứng được chứng thực và bằng chứng được tái tạo, cũng như vai trò của các phương pháp ngữ liệu trong việc theo dõi sự thay đổi về mặt định lượng.
Core questions
- Điều gì được coi là bằng chứng được chứng thực cho một giai đoạn trước đó của một ngôn ngữ?
- Các ghi chép được xác định niên đại và địa phương hóa như thế nào?
- Những sai lệch và khoảng trống nào ảnh hưởng đến các ghi chép tài liệu còn sót lại?
- Các ngữ liệu lịch sử có cấu trúc cho phép nghiên cứu định lượng về sự thay đổi như thế nào?
- Bằng chứng được chứng thực được cân nhắc như thế nào so với bằng chứng được tái tạo?
Key theories
- Nghiên cứu sự thay đổi ngôn ngữ dựa trên ngữ liệu
- Các ngữ liệu lịch sử có cấu trúc, được chú thích cho phép theo dõi sự thay đổi về mặt định lượng theo thời gian, thể loại và khu vực, đồng thời đòi hỏi sự chú ý cẩn thận đến tính đại diện và những sai lệch của các ghi chép còn sót lại.
History
Ngôn ngữ học lịch sử luôn phụ thuộc vào các ghi chép được chứng thực, từ các bản khắc cổ đại đến các bản thảo thời trung cổ. Sự phát triển của các ngữ liệu lịch sử điện tử từ cuối thế kỷ XX, chẳng hạn như Helsinki Corpus of English Texts, đã làm thay đổi lĩnh vực này bằng cách cho phép nghiên cứu định lượng có hệ thống về sự thay đổi, bổ sung cho việc đọc ngữ văn truyền thống.
Debates
- Tính đại diện của các ghi chép còn sót lại
- Vì các văn bản còn sót lại thường có xu hướng thiên về một số thể loại, khu vực và các văn phong học thuật nhất định, nên có một cuộc tranh luận về mức độ mà các phát hiện từ ngữ liệu phản ánh ngôn ngữ nói và cách sử dụng thông thường trong quá khứ.
Key figures
- Merja Kyto
- Paivi Pahta
- Lyle Campbell
Related topics
Seminal works
- kytoPahta2016
- campbell2013
Frequently asked questions
- Sự khác biệt giữa các hình thức được chứng thực và được tái tạo là gì?
- Các hình thức được chứng thực thực sự được ghi lại trong các văn bản hoặc bản khắc còn sót lại, trong khi các hình thức được tái tạo được suy ra từ sự so sánh và được đánh dấu bằng dấu hoa thị; bằng chứng được chứng thực thường được ưu tiên khi nó tồn tại.
- Tại sao các ngữ liệu lịch sử lại hữu ích?
- Chúng cho phép các nhà nghiên cứu đo lường cách các đặc điểm thay đổi về tần suất theo thời gian và giữa các thể loại và khu vực, biến bằng chứng văn bản rời rạc thành dữ liệu có hệ thống, định lượng về sự thay đổi ngôn ngữ.