Machine learning

Longformer / BigBird

Οι Μετασχηματιστές μεγάλων ακολουθιών, όπως οι Longformer (Beltagy, Peters & Cohan, 2020) και BigBird (Zaheer et al., 2020), αντικαθιστούν την τυπική προσοχή O(n²) του Μετασχηματιστή με αραιά μοτίβα προσοχής που κλιμακώνονται γραμμικά, O(n), με το μήκος της ακολουθίας. Αυτό επιτρέπει σε ένα μόνο μοντέλο να εστιάζει σε χιλιάδες διακριτικά – πλήρη έγγραφα, νομικά κείμενα ή γονιδιωματικές ακολουθίες – που δεν θα χωρούσαν σε έναν συμβατικό Μετασχηματιστή.

Άνοιγμα στο MethodMindΣύντομαΒίντεοΣύντομαDownload slides

Διαβάστε ολόκληρη τη μέθοδο

Μόνο για μέλη

Συνδεθείτε με δωρεάν λογαριασμό για να διαβάσετε αυτή την ενότητα.

Σύνδεση

Method map

The neighbourhood of related methods — select a node to explore.

Longformer / BigBird

Δίκτυο Προσοχής Γραφήματ…Μείγμα Εμπειρογνωμόνων Τυχαίο Δάσος XGBoost Απόσταξη Γνώσης Αναζήτηση Νευρωνικής Αρχ…Οπτική Συγκριτική Μάθηση

Πηγές

Beltagy, I., Peters, M. E. & Cohan, A. (2020). Longformer: The Long-Document Transformer. arXiv. link ↗
Zaheer, M. et al. (2020). Big Bird: Transformers for Longer Sequences. NeurIPS. link ↗

Πώς να παραπέμψετε σε αυτή τη σελίδα

ScholarGate. (2026, June 1). Long-Sequence Transformers with Sparse Attention (Longformer / BigBird). ScholarGate. https://scholargate.app/el/deep-learning/longformer-bigbird

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Δίκτυο Προσοχής ΓραφήματοςΒαθιά Μάθηση↔ compare
Μείγμα ΕμπειρογνωμόνωνΒαθιά Μάθηση↔ compare
Τυχαίο ΔάσοςΜηχανική Μάθηση↔ compare
XGBoostΜηχανική Μάθηση↔ compare

Compare side by side →

Αναφέρεται από

Απόσταξη Γνώσης Αναζήτηση Νευρωνικής Αρχιτεκτονικής Οπτική Συγκριτική Μάθηση

Εντοπίσατε πρόβλημα σε αυτή τη σελίδα; Αναφέρετέ το ή προτείνετε διόρθωση →