ScholarGate
Trợ lý
Machine learningdocument-image-recognition

Handwritten Text Recognition for Archives

Handwritten text recognition for archives converts digital images of manuscript pages into searchable, machine-readable text, unlocking the vast holdings of handwritten material that optical character recognition, designed for print, cannot read. Exemplified by platforms such as Transkribus, developed in the READ project, modern HTR uses deep neural networks trained on transcribed examples to recognize the highly variable scripts of letters, registers, charters, and notebooks across centuries and languages. The pipeline first analyzes page layout and segments the image into text regions and lines, then a recurrent or transformer-based recognizer decodes each line into characters, typically using connectionist temporal classification to align pixels with text without needing character-level segmentation. Crucially, recognition models are trained and improved on ground-truth transcriptions supplied by scholars, so accuracy rises as more material is annotated. By making manuscripts machine-readable at scale, HTR is the gateway technology of digital archival history, feeding full-text search, named-entity recognition, and large-corpus text mining of sources that were previously legible only page by page.

Mở trong MethodMindSắp ra mắtÁp dụng, so sánh, nhận hướng dẫn
Công cụ & tài nguyên
Tải xuống bản trình chiếu
Học hỏi & khám phá
VideoSắp ra mắt

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Bản đồ phương pháp

Lân cận của các phương pháp liên quan — chọn một nút để khám phá.

Nguồn tài liệu

  1. Muehlberger, G., Seaward, L., Terras, M., et al. (2019). Transforming scholarship in the archives through handwritten text recognition: Transkribus as a case study. Journal of Documentation, 75(5), 954-976. DOI: 10.1108/JD-07-2018-0114
  2. Moretti, F. (2013). Distant Reading. Verso. ISBN: 9781781680841

Cách trích dẫn trang này

ScholarGate. (2026, June 23). Handwritten Text Recognition for Archival Manuscripts. ScholarGate. https://scholargate.app/vi/digital-history/handwritten-text-recognition-archives

Phương pháp nào?

Đặt phương pháp này bên cạnh những phương pháp gần gũi nhất với nó và đọc chúng song song — thư viện bày sách lên bàn; lựa chọn là của bạn.

So sánh song song

Được tham chiếu bởi

ScholarGateHandwritten Text Recognition for Archives (Handwritten Text Recognition for Archival Manuscripts). Truy cập ngày 2026-06-24 từ https://scholargate.app/vi/digital-history/handwritten-text-recognition-archives · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026