Machine learning

Longformer / BigBird

Transfoma za mawimbi marefu kama vile Longformer (Beltagy, Peters & Cohan, 2020) na BigBird (Zaheer et al., 2020) huchukua nafasi ya umakini wa O(n²) wa Transfoma sanifu na ruwaza za umakini zilizotawanyika ambazo huongezeka kwa mstari, O(n), kulingana na urefu wa mfuatano. Hii huwezesha modeli moja kushughulikia maelfu ya tokeni — hati kamili, maandishi ya kisheria, au mfuatano wa vinasaba — ambazo hazingefaa Transfoma ya kawaida.

Fungua katika MethodMindHivi karibuniVideoHivi karibuniDownload slides

Soma mbinu kamili

Kwa wanachama pekee

Ingia kwa akaunti ya bure ili kusoma sehemu hii.

Ingia

Method map

The neighbourhood of related methods — select a node to explore.

Longformer / BigBird

Mtandao wa Makini wa Gra…Mchanganyiko wa Wataalamu Msitu Nasibu XGBoost Ufumbuzi wa Maarifa Utafutaji wa Usanifu wa…Ujifunzaji wa Kulinganis…

Vyanzo

Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link ↗
Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link ↗

Jinsi ya kunukuu ukurasa huu

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/sw/deep-learning/longformer-bigbird

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Mtandao wa Makini wa GrafuUjifunzaji wa Kina↔ compare
Mchanganyiko wa WataalamuUjifunzaji wa Kina↔ compare
Msitu NasibuUjifunzaji wa Mashine↔ compare
XGBoostUjifunzaji wa Mashine↔ compare

Compare side by side →

Imerejelewa na

Ufumbuzi wa Maarifa Utafutaji wa Usanifu wa Neural Ujifunzaji wa Kulinganisha wa Kuona

Umeona tatizo kwenye ukurasa huu? Ripoti au pendekeza marekebisho →