Machine learning

Longformer / BigBird

Gar Pārliecības modeļi, piemēram, Longformer (Beltagy, Peters & Cohan, 2020) un BigBird (Zaheer et al., 2020), aizstāj standarta Transformer arhitektūras O(n²) uzmanības mehānismu ar izkliedētu (sparse) uzmanības modeli, kas secības garumam (n) pieaug lineāri, O(n). Tas ļauj vienam modelim apstrādāt tūkstošiem ievietojumu (tokens) — pilnus dokumentus, juridiskus tekstus vai genoma sekvences — kas nebūtu iespējams ar parastu Transformer modeli.

Atvērt MethodMindDrīzumāVideoDrīzumāLejupielādēt slaidus

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Metožu karte

Saistīto metožu apkaime — atlasiet mezglu, lai izpētītu.

Longformer / BigBird

Grafu uzmanības tīkls (G…Ekspertu maisījums Random Forest XGBoost Zināšanu destilācija Neirālā arhitektūras mek…Vizualā kontrastīvā apgu…

Avoti

Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link ↗
Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link ↗

Kā citēt šo lapu

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/lv/deep-learning/longformer-bigbird

Kura metode?

Novietojiet šo metodi blakus tās tuvākajām radniecīgajām metodēm un lasiet tās līdzās — bibliotēka noliek grāmatas uz galda; izvēle ir jūsu.

Grafu uzmanības tīkls (Graph Attention Network, GAT)Dziļā mācīšanās↔ salīdzināt
Ekspertu maisījumsDziļā mācīšanās↔ salīdzināt
Random ForestMašīnmācīšanās↔ salīdzināt
XGBoostMašīnmācīšanās↔ salīdzināt

Salīdzināt blakus →

Uz to atsaucas

Zināšanu destilācija Neirālā arhitektūras meklēšana Vizualā kontrastīvā apguve

Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →