Machine learning

Tự chú ý đa đầu

Cơ chế tự chú ý đa đầu, được Vaswani và cộng sự giới thiệu vào năm 2017, cho phép mọi vị trí trong một chuỗi tính toán mối quan hệ của nó với tất cả các vị trí khác một cách song song. Đây là cốt lõi của kiến trúc Transformer và là nền tảng của BERT, GPT và T5.

Mở trong MethodMindSắp ra mắtVideoSắp ra mắtDownload slides

Đọc toàn bộ phương pháp

Chỉ dành cho thành viên

Đăng nhập bằng tài khoản miễn phí để đọc phần này.

Đăng nhập

Method map

The neighbourhood of related methods — select a node to explore.

Tự chú ý đa đầu

Tinh chỉnh BERT Tinh chỉnh GPT LoRA và PEFT Rừng ngẫu nhiên XGBoost Cơ chế chú ý (Attention…RNN hai chiều Sinh Tăng Cường Truy Xuấ…Mô hình Sequence-to-Sequ…

Nguồn tài liệu

Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. link ↗
Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL. link ↗

Cách trích dẫn trang này

ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/vi/deep-learning/self-attention-transformer

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side →

Được tham chiếu bởi

Cơ chế chú ý (Attention Mechanism)RNN hai chiều Sinh Tăng Cường Truy Xuất (RAG)Mô hình Sequence-to-Sequence (Seq2Seq)

Phát hiện lỗi trên trang này? Báo cáo hoặc đề xuất chỉnh sửa →

Đọc toàn bộ phương pháp

Method map

Nguồn tài liệu

Cách trích dẫn trang này

Phương pháp liên quan

Which method?

Được tham chiếu bởi