Machine learning
Longformer / BigBird
Longformer (Beltagy, Peters & Cohan, 2020) 및 BigBird (Zaheer et al., 2020)와 같은 긴 시퀀스 트랜스포머는 표준 트랜스포머의 O(n²) 어텐션을 시퀀스 길이에 선형적으로 O(n) 확장되는 희소 어텐션 패턴으로 대체합니다. 이를 통해 단일 모델이 기존 트랜스포머에는 맞지 않는 수천 개의 토큰(전체 문서, 법률 텍스트 또는 유전체 서열)을 어텐션할 수 있습니다.
방법 전문 읽기
회원 전용
로그인무료 계정으로 로그인하면 이 섹션을 읽을 수 있습니다.
Method map
The neighbourhood of related methods — select a node to explore.
출처
이 페이지 인용 방법
ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/ko/deep-learning/longformer-bigbird
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
Compare side by side →