Longformer / BigBird
Transformers para sequências longas, como Longformer (Beltagy, Peters & Cohan, 2020) e BigBird (Zaheer et al., 2020), substituem a atenção O(n²) padrão do Transformer por padrões de atenção esparsa que escalam linearmente, O(n), com o comprimento da sequência. Isso permite que um único modelo atenda a milhares de tokens — documentos completos, textos jurídicos ou sequências genômicas — que não caberiam em um Transformer convencional.
Leia o método completo
Entre com uma conta gratuita para ler esta seção.
Method map
The neighbourhood of related methods — select a node to explore.
Fontes
Como citar esta página
ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/pt/deep-learning/longformer-bigbird
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Graph Attention NetworkAprendizado profundo↔ compare
- Mistura de EspecialistasAprendizado profundo↔ compare
- Random ForestAprendizado de máquina↔ compare
- XGBoostAprendizado de máquina↔ compare
Referenciado por
Encontrou um problema nesta página? Relate ou sugira uma correção →