Semisupervidierter Transformer
Semisupervidiertes Lernen mit Transformer-Architekturen nutzt große Mengen unbeschrifteter Daten neben einem kleinen beschrifteten Datensatz, um leistungsstarke Sequenzmodelle zu trainieren. Das dominierende Muster – beispielhaft dargestellt durch BERT – trainiert den Transformer zunächst auf unbeschrifteten Daten unter Verwendung selbstüberwachter Ziele wie der Masked-Token-Vorhersage und passt ihn dann für die beschriftete Aufgabe an. Dieser zweistufige Ansatz reduziert die benötigten beschrifteten Daten zur Erzielung starker Leistungen drastisch.
Die vollständige Methode lesen
Melden Sie sich mit einem kostenlosen Konto an, um diesen Abschnitt zu lesen.
Method map
The neighbourhood of related methods — select a node to explore.
+5 more
Quellen
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. DOI: 10.18653/v1/N19-1423 ↗
- Zoph, B., Ghiasi, G., Lin, T.-Y., Cui, Y., Liu, H., Cubuk, E. D., & Le, Q. V. (2020). Rethinking Pre-training and Self-training. Advances in Neural Information Processing Systems (NeurIPS), 33, 3833–3845. link ↗
So zitieren Sie diese Seite
ScholarGate. (2026, June 3). Semi-supervised Learning with Transformer Architectures. ScholarGate. https://scholargate.app/de/deep-learning/semi-supervised-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- BERT-basierte KlassifikationDeep Learning↔ compare
- Fine-Tuned TransformerDeep Learning↔ compare
- RoBERTa-basierte KlassifikationDeep Learning↔ compare
- Selbstüberwachter TransformerDeep Learning↔ compare
- Semi-überwachtes Faltungsneuronales NetzDeep Learning↔ compare
Referenziert von
Einen Fehler auf dieser Seite entdeckt? Melden oder Korrektur vorschlagen →