Phong cách học và Gán quyền tác giả
Các nhà văn để lại những dấu vân tay thống kê. Tần suất của các từ nhỏ, vô thức — the, of, and — ít thay đổi trong tác phẩm của một tác giả nhưng lại khác nhau giữa các tác giả, và phong cách học khai thác điều này để giải quyết các tranh chấp về quyền tác giả và nghiên cứu phong cách một cách định lượng.
Definition
Phân tích thống kê các đặc điểm có thể đo lường được của phong cách viết để mô tả tác giả và gán các văn bản có quyền tác giả không chắc chắn hoặc đang tranh chấp.
Scope
Bao gồm việc đo lường định lượng phong cách văn học và việc sử dụng nó trong việc gán văn bản cho tác giả: lựa chọn các đặc điểm phong cách, các biện pháp khoảng cách và phân loại như Burrows's Delta, và việc xác nhận các tuyên bố gán quyền tác giả. Bao gồm lịch sử của lĩnh vực này từ Federalist Papers đến các phương pháp học máy hiện đại, và các ứng dụng pháp y của nó.
Core questions
- Những đặc điểm văn bản nào thể hiện rõ nhất phong cách đặc trưng của một tác giả?
- Làm thế nào để kiểm tra và xác nhận các tuyên bố gán quyền tác giả?
- Tại sao tần suất từ chức năng lại hiệu quả đến vậy trong việc gán quyền tác giả?
- Giới hạn của phong cách học qua các thể loại, thời kỳ và bản dịch là gì?
Key concepts
- Từ chức năng
- Burrows's Delta
- Lựa chọn đặc trưng
- Phân loại
- Kiểm định chéo
Key theories
- Tần suất từ chức năng như một tín hiệu tác giả
- Mosteller và Wallace đã chỉ ra rằng tần suất của các từ chức năng phổ biến có thể phân biệt các tác giả, sử dụng suy luận Bayes để gán quyền tác giả cho các Federalist Papers đang tranh chấp.
- Burrows's Delta
- Burrows đã giới thiệu Delta, một thước đo khoảng cách trên các từ thường xuyên nhất đã trở thành một phương pháp tiêu chuẩn, mạnh mẽ để xếp hạng các tác giả tiềm năng.
- Gán quyền tác giả hiện đại như phân loại
- Stamatatos đã khảo sát cách gán quyền tác giả được định hình như một vấn đề phân loại văn bản, so sánh các tập đặc trưng và các phương pháp học máy.
History
Nghiên cứu định lượng về quyền tác giả có từ thế kỷ XIX, nhưng nghiên cứu của Mosteller và Wallace năm 1964 về Federalist Papers đã thiết lập phương pháp thống kê hiện đại. Burrows's Delta (2002) đã mang lại cho lĩnh vực này một thước đo được áp dụng rộng rãi, và các khảo sát như của Stamatatos (2009) đã ghi nhận sự chuyển dịch sang phân loại học máy và sử dụng trong pháp y.
Debates
- Độ tin cậy và sự tự tin của các gán quyền tác giả
- Các phương pháp phong cách học có thể mạnh mẽ nhưng lại nhạy cảm với kích thước ngữ liệu, thể loại và tiền xử lý, đặt ra câu hỏi về mức độ tin cậy mà các gán quyền tác giả xứng đáng có được, đặc biệt trong các bối cảnh pháp y.
Key figures
- Frederick Mosteller
- David Wallace
- John Burrows
- Efstathios Stamatatos
Related topics
Seminal works
- mosteller1964
- burrows2002
- stamatatos2009
Frequently asked questions
- Tại sao lại tập trung vào những từ nhỏ như 'the' thay vì từ vựng đặc trưng?
- Từ vựng đặc trưng thường phản ánh chủ đề của văn bản hơn là tác giả của nó. Các từ chức năng phổ biến được sử dụng một cách vô thức và với tần suất ổn định trong tác phẩm của một tác giả nhưng lại khác nhau giữa các tác giả, khiến chúng trở thành một tín hiệu phong cách đáng tin cậy, độc lập với chủ đề.