Machine learning

Longformer / BigBird

Οι Μετασχηματιστές μεγάλων ακολουθιών, όπως οι Longformer (Beltagy, Peters & Cohan, 2020) και BigBird (Zaheer et al., 2020), αντικαθιστούν την τυπική προσοχή O(n²) του Μετασχηματιστή με αραιά μοτίβα προσοχής που κλιμακώνονται γραμμικά, O(n), με το μήκος της ακολουθίας. Αυτό επιτρέπει σε ένα μόνο μοντέλο να εστιάζει σε χιλιάδες διακριτικά – πλήρη έγγραφα, νομικά κείμενα ή γονιδιωματικές ακολουθίες – που δεν θα χωρούσαν σε έναν συμβατικό Μετασχηματιστή.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Πηγές

  1. Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link
  2. Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/el/deep-learning/longformer-bigbird

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Αναφέρεται από

ScholarGateLongformer / BigBird (Long-Sequence Transformers with Sparse Attention (Longformer / BigBird)). Ανακτήθηκε στις 2026-06-15 από https://scholargate.app/el/deep-learning/longformer-bigbird · Σύνολο δεδομένων: https://doi.org/10.5281/zenodo.20539026