Machine learningDeep learning / NLP / CV

Transformer bán giám sát

Học bán giám sát với các kiến trúc Transformer tận dụng lượng lớn dữ liệu không nhãn cùng với một tập nhỏ dữ liệu có nhãn để huấn luyện các mô hình chuỗi mạnh mẽ. Mẫu hình chủ đạo — được minh họa bởi BERT — trước tiên tiền huấn luyện Transformer trên dữ liệu không nhãn bằng các mục tiêu tự giám sát như dự đoán token bị che, sau đó tinh chỉnh nó trên tác vụ có nhãn. Cách tiếp cận hai giai đoạn này giảm đáng kể lượng dữ liệu có nhãn cần thiết để đạt được hiệu suất mạnh mẽ.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

+5 more

Nguồn tài liệu

  1. Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423
  2. Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link

Cách trích dẫn trang này

ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/vi/deep-learning/semi-supervised-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Được tham chiếu bởi

ScholarGateSemi-supervised Transformer (Semi-supervised Learning with Transformer Architectures). Truy cập ngày 2026-06-15 từ https://scholargate.app/vi/deep-learning/semi-supervised-transformer · Bộ dữ liệu: https://doi.org/10.5281/zenodo.20539026