ScholarGate
Asistents
Machine learning

Longformer / BigBird

Gar Pārliecības modeļi, piemēram, Longformer (Beltagy, Peters & Cohan, 2020) un BigBird (Zaheer et al., 2020), aizstāj standarta Transformer arhitektūras O(n²) uzmanības mehānismu ar izkliedētu (sparse) uzmanības modeli, kas secības garumam (n) pieaug lineāri, O(n). Tas ļauj vienam modelim apstrādāt tūkstošiem ievietojumu (tokens) — pilnus dokumentus, juridiskus tekstus vai genoma sekvences — kas nebūtu iespējams ar parastu Transformer modeli.

Atvērt MethodMindDrīzumāVideoDrīzumāLejupielādēt slaidus

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Metožu karte

Saistīto metožu apkaime — atlasiet mezglu, lai izpētītu.

Avoti

  1. Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link
  2. Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link

Kā citēt šo lapu

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/lv/deep-learning/longformer-bigbird

Kura metode?

Novietojiet šo metodi blakus tās tuvākajām radniecīgajām metodēm un lasiet tās līdzās — bibliotēka noliek grāmatas uz galda; izvēle ir jūsu.

Salīdzināt blakus

Uz to atsaucas

ScholarGateLongformer / BigBird (Long-Sequence Transformers with Sparse Attention (Longformer / BigBird)). Izgūts 2026-06-15 no https://scholargate.app/lv/deep-learning/longformer-bigbird · Datu kopa: https://doi.org/10.5281/zenodo.20539026