Longformer / BigBird
Οι Μετασχηματιστές μεγάλων ακολουθιών, όπως οι Longformer (Beltagy, Peters & Cohan, 2020) και BigBird (Zaheer et al., 2020), αντικαθιστούν την τυπική προσοχή O(n²) του Μετασχηματιστή με αραιά μοτίβα προσοχής που κλιμακώνονται γραμμικά, O(n), με το μήκος της ακολουθίας. Αυτό επιτρέπει σε ένα μόνο μοντέλο να εστιάζει σε χιλιάδες διακριτικά – πλήρη έγγραφα, νομικά κείμενα ή γονιδιωματικές ακολουθίες – που δεν θα χωρούσαν σε έναν συμβατικό Μετασχηματιστή.
Διαβάστε ολόκληρη τη μέθοδο
Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.
Method map
The neighbourhood of related methods — select a node to explore.
Πηγές
Πώς να παραπέμψετε σε αυτή τη σελίδα
ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/el/deep-learning/longformer-bigbird
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- Δίκτυο Προσοχής ΓραφήματοςΒαθιά Μάθηση↔ compare
- Μείγμα ΕμπειρογνωμόνωνΒαθιά Μάθηση↔ compare
- Τυχαίο ΔάσοςΜηχανική Μάθηση↔ compare
- XGBoostΜηχανική Μάθηση↔ compare
Αναφέρεται από
Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →