ScholarGate
Assistent
Machine learning

Longformer / BigBird

Lange-sequentie Transformers zoals Longformer (Beltagy, Peters & Cohan, 2020) en BigBird (Zaheer et al., 2020) vervangen de standaard O(n²) aandacht van de Transformer door ijle aandachtspatronen die lineair, O(n), schalen met de sequentielengte. Dit stelt een enkel model in staat om duizenden tokens te verwerken — volledige documenten, juridische teksten of genomische sequenties — die niet in een conventionele Transformer zouden passen.

Openen in MethodMindBinnenkortVideoBinnenkortDownload slides

Lees de volledige methode

Alleen voor leden

Log in met een gratis account om dit onderdeel te lezen.

Inloggen

Method map

The neighbourhood of related methods — select a node to explore.

Bronnen

  1. Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link
  2. Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link

Deze pagina citeren

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/nl/deep-learning/longformer-bigbird

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Geciteerd door

ScholarGateLongformer / BigBird (Long-Sequence Transformers with Sparse Attention (Longformer / BigBird)). Geraadpleegd op 2026-06-15 via https://scholargate.app/nl/deep-learning/longformer-bigbird · Gegevensset: https://doi.org/10.5281/zenodo.20539026