ScholarGate
Asszisztens
Machine learning

Longformer / BigBird

Az olyan hosszú szekvenciákat feldolgozó Transformer-modellek, mint a Longformer (Beltagy, Peters & Cohan, 2020) és a BigBird (Zaheer et al., 2020) a standard Transformer O(n²) komplexitású figyelmi mechanizmusát egy ritka (sparse) figyelmi mintázattal helyettesítik, amely a szekvenciahosszúsággal lineárisan, O(n) módon skálázódik. Ez lehetővé teszi egyetlen modell számára, hogy több ezer tokent – teljes dokumentumokat, jogi szövegeket vagy genomikai szekvenciákat – dolgozzon fel, amelyek egy hagyományos Transformerbe nem férnének bele.

Megnyitás itt: MethodMindHamarosanVideóHamarosanDownload slides

A teljes módszer elolvasása

Csak tagoknak

Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.

Bejelentkezés

Method map

The neighbourhood of related methods — select a node to explore.

Források

  1. Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link
  2. Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link

Hogyan hivatkozzon erre az oldalra

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/hu/deep-learning/longformer-bigbird

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Hivatkozik rá

ScholarGateLongformer / BigBird (Long-Sequence Transformers with Sparse Attention (Longformer / BigBird)). Letöltve 2026-06-15, forrás: https://scholargate.app/hu/deep-learning/longformer-bigbird · Adatkészlet: https://doi.org/10.5281/zenodo.20539026