เปรียบเทียบวิธี
ดูวิธีที่เลือกเทียบกันแบบเคียงข้าง แถวที่ต่างกันจะถูกเน้นไว้
| การปรับจูนทรานส์ฟอร์มเมอร์ (Fine-Tuned Transformer)× | เครือข่ายประสาทเทียมแบบวนซ้ำที่ปรับละเอียด (Fine-Tuned Recurrent Neural Network)× | |
|---|---|---|
| สาขาวิชา | การเรียนรู้เชิงลึก | การเรียนรู้เชิงลึก |
| ตระกูล | Machine learning | Machine learning |
| ปีกำเนิด≠ | 2017–2019 | 2015–2018 |
| ผู้ริเริ่ม≠ | Vaswani et al. (architecture); fine-tuning paradigm popularised by Howard & Ruder, Devlin et al. | Popularised by Howard & Ruder (ULMFiT, 2018); RNN fine-tuning concept developed iteratively in the NLP community from ~2015 |
| ประเภท≠ | Transfer learning / supervised fine-tuning | Transfer learning / sequential model adaptation |
| แหล่งต้นตำรับ≠ | Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, L., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30. link ↗ | Howard, J. & Ruder, S. (2018). Universal Language Model Fine-Tuning for Text Classification. Proceedings of ACL 2018, 328–339. DOI ↗ |
| ชื่อเรียกอื่น | Transformer fine-tuning, pre-trained transformer fine-tuning, task-adaptive transformer, downstream-tuned transformer | Fine-Tuned RNN, RNN Fine-Tuning, domain-adapted RNN, pre-trained RNN with downstream adaptation |
| ที่เกี่ยวข้อง≠ | 4 | 6 |
| สรุป≠ | Fine-tuning a Transformer adapts a large pre-trained model — such as BERT, GPT, or ViT — to a specific downstream task by continuing gradient-based training on a labelled target dataset. This two-stage paradigm (pre-train then fine-tune) consistently achieves state-of-the-art results across NLP and computer vision tasks with far less task-specific data than training from scratch. | A Fine-Tuned Recurrent Neural Network (RNN) starts from a model pre-trained on large corpora or time-series data and adapts its weights to a specific downstream task through controlled gradient updates. The approach dramatically cuts the labeled data needed for strong sequence modeling performance in text classification, named entity recognition, sentiment analysis, and related tasks. |
| ScholarGateชุดข้อมูล ↗ |
|
|