Thu thập dữ liệu web theo chiều dọc — Thu thập dữ liệu web tự động lặp lại theo thời gian
Thu thập dữ liệu web theo chiều dọc (longitudinal web scraping) là một kỹ thuật thu thập dữ liệu sử dụng các tập lệnh tự động để trích xuất nội dung từ các trang web tại nhiều thời điểm được xác định trước. Bằng cách truy cập lại cùng một nguồn web nhiều lần, các nhà nghiên cứu xây dựng một tập dữ liệu chuỗi thời gian ghi lại cách nội dung trực tuyến, giá cả, diễn ngôn hoặc hành vi phát triển. Kỹ thuật này được sử dụng rộng rãi trong khoa học xã hội tính toán, kinh tế học, khoa học chính trị, nghiên cứu sức khỏe và nhân văn số để nghiên cứu sự thay đổi mà không cần dựa vào báo cáo tự thuật hồi cứu.
Đọc toàn bộ phương pháp
Đăng nhập bằng tài khoản miễn phí để đọc phần này.
Bản đồ phương pháp
Lân cận của các phương pháp liên quan — chọn một nút để khám phá.
Nguồn tài liệu
- Salganik, M. J. (2018). Bit by Bit: Social Research in the Digital Age. Princeton University Press. ISBN: 978-0691158648
- Luscombe, A., Dick, K., & Walby, K. (2022). Algorithmic thinking in the public interest: navigating technical, legal, and ethical challenges in government web scraping. Quality & Quantity, 56(3), 1781–1802. DOI: 10.1007/s11135-021-01164-0 ↗
Cách trích dẫn trang này
ScholarGate. (2026, June 3). Longitudinal Web Scraping for Research. ScholarGate. https://scholargate.app/vi/survey-methodology/longitudinal-web-scraping
Phương pháp nào?
Đặt phương pháp này bên cạnh những phương pháp gần gũi nhất với nó và đọc chúng song song — thư viện bày sách lên bàn; lựa chọn là của bạn.
- Thu thập dữ liệu dựa trên APIPhương pháp luận khảo sát↔ so sánh
- Phân tích nội dungĐịnh tính↔ so sánh
- Khảo sát dọcPhương pháp luận khảo sát↔ so sánh
- Thu thập dữ liệu cảm biếnPhương pháp luận khảo sát↔ so sánh
- Web ScrapingPhương pháp luận khảo sát↔ so sánh
Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →