Longformer / BigBird
Transformer urutan panjang seperti Longformer (Beltagy, Peters & Cohan, 2020) dan BigBird (Zaheer et al., 2020) mengganti perhatian O(n²) standar Transformer dengan pola perhatian jarang yang berskala linier, O(n), dengan panjang urutan. Hal ini memungkinkan satu model untuk memperhatikan ribuan token — dokumen lengkap, teks hukum, atau urutan genomik — yang tidak muat dalam Transformer konvensional.
Baca metode selengkapnya
Masuk dengan akun gratis untuk membaca bagian ini.
Method map
The neighbourhood of related methods — select a node to explore.
Sumber
Cara menyitasi halaman ini
ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/id/deep-learning/longformer-bigbird
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Jaringan Perhatian GrafPembelajaran Mendalam↔ compare
- Campuran PakarPembelajaran Mendalam↔ compare
- Random ForestPembelajaran Mesin↔ compare
- XGBoostPembelajaran Mesin↔ compare
Dirujuk oleh
Menemukan masalah di halaman ini? Laporkan atau usulkan perbaikan →