Machine learning

Daudzgalvu paše-uzmanība

Daudzgalvu paše-uzmanība, ko ieviesa Vaswani un kolēģi 2017. gadā, ir mehānisms, kas ļauj katrai pozīcijai sekvencē paralēli aprēķināt tās attiecības ar visām citām pozīcijām. Tā ir Transformeru arhitektūras galvenā sastāvdaļa un pamats BERT, GPT un T5.

Atvērt MethodMindDrīzumāVideoDrīzumāLejupielādēt slaidus

Lasīt pilno metodes aprakstu

Tikai dalībniekiem

Piesakieties ar bezmaksas kontu, lai lasītu šo sadaļu.

Pieteikties

Metožu karte

Saistīto metožu apkaime — atlasiet mezglu, lai izpētītu.

Daudzgalvu paše-uzmanība

BERT Fine-Tuning GPT smalkoregulēšana LoRA un PEFT Random Forest XGBoost Attention mechanism Dкновеirziena atkārtojoš…Iegūšanā balstīta ģenerē…Sekvences-sekvences mode…

Avoti

Vaswani, A. et al. (2017). Attention Is All You Need. NeurIPS. link ↗
Devlin, J. et al. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL. link ↗

Kā citēt šo lapu

ScholarGate. (2026, June 1). Multi-Head Self-Attention (Transformer Core). ScholarGate. https://scholargate.app/lv/deep-learning/self-attention-transformer

Kura metode?

Novietojiet šo metodi blakus tās tuvākajām radniecīgajām metodēm un lasiet tās līdzās — bibliotēka noliek grāmatas uz galda; izvēle ir jūsu.

BERT Fine-TuningDziļā mācīšanās↔ salīdzināt
GPT smalkoregulēšanaDziļā mācīšanās↔ salīdzināt
LoRA un PEFTDziļā mācīšanās↔ salīdzināt
Random ForestMašīnmācīšanās↔ salīdzināt
XGBoostMašīnmācīšanās↔ salīdzināt

Salīdzināt blakus →

Uz to atsaucas

Attention mechanism Dкновеirziena atkārtojošais neironu tīkls Iegūšanā balstīta ģenerēšana (RAG)Sekvences-sekvences modelis

Pamanījāt kļūdu šajā lapā? Ziņojiet vai ierosiniet labojumu →

Lasīt pilno metodes aprakstu

Metožu karte

Avoti

Kā citēt šo lapu

Saistītās metodes

Kura metode?

Uz to atsaucas