Machine learning
다중 헤드 셀프 어텐션
2017년 Vaswani와 동료들이 소개한 다중 헤드 셀프 어텐션은 시퀀스의 모든 위치가 병렬적으로 다른 모든 위치와의 관계를 계산할 수 있게 해주는 메커니즘입니다. 이는 트랜스포머 아키텍처의 핵심이며 BERT, GPT, T5의 기반이 됩니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
이 페이지 인용 방법
ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/ko/deep-learning/self-attention-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT 미세 조정딥러닝↔ compare
- GPT 파인튜닝딥러닝↔ compare
- LoRA 및 PEFT딥러닝↔ compare
- 랜덤 포레스트머신러닝↔ compare
- XGBoost머신러닝↔ compare