Machine learning

Longformer / BigBird

Az olyan hosszú szekvenciákat feldolgozó Transformer-modellek, mint a Longformer (Beltagy, Peters & Cohan, 2020) és a BigBird (Zaheer et al., 2020) a standard Transformer O(n²) komplexitású figyelmi mechanizmusát egy ritka (sparse) figyelmi mintázattal helyettesítik, amely a szekvenciahosszúsággal lineárisan, O(n) módon skálázódik. Ez lehetővé teszi egyetlen modell számára, hogy több ezer tokent – teljes dokumentumokat, jogi szövegeket vagy genomikai szekvenciákat – dolgozzon fel, amelyek egy hagyományos Transformerbe nem férnének bele.

Megnyitás itt: MethodMindHamarosanVideóHamarosanDownload slides

A teljes módszer elolvasása

Csak tagoknak

Jelentkezzen be ingyenes fiókkal a szakasz elolvasásához.

Bejelentkezés

Method map

The neighbourhood of related methods — select a node to explore.

Longformer / BigBird

Gráfon alapuló figyelmi…Szakértők keveréke Véletlen erdő XGBoost A tudásdesztilláció Neuronális Architektúra…Vizuális kontrasztív tan…

Források

Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link ↗
Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link ↗

Hogyan hivatkozzon erre az oldalra

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/hu/deep-learning/longformer-bigbird

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Gráfon alapuló figyelmi hálózatMélytanulás↔ compare
Szakértők keverékeMélytanulás↔ compare
Véletlen erdőGépi tanulás↔ compare
XGBoostGépi tanulás↔ compare

Compare side by side →

Hivatkozik rá

A tudásdesztilláció Neuronális Architektúra Keresés Vizuális kontrasztív tanulás

Hibát talált ezen az oldalon? Jelentse, vagy javasoljon javítást →