T5 (Text-to-Text Transfer Transformer)
T5 เป็นเฟรมเวิร์กการเรียนรู้เชิงลึกแบบลำดับต่อลำดับ (sequence-to-sequence) แบบรวมศูนย์ ซึ่งนำเสนอโดย Raffel และคณะ ที่ Google Brain ในปี 2020 ตีพิมพ์ในวารสาร Journal of Machine Learning Research (เล่มที่ 21 ฉบับที่ 140) โดยปรับเปลี่ยนทุกงานของ NLP — การจำแนกประเภท การแปล การสรุป การตอบคำถาม และอื่นๆ — ให้เป็นปัญหาแบบข้อความต่อข้อความ (text-to-text) กล่าวคือ ทั้งอินพุตและเอาต์พุตเป็นสตริงอักขระเสมอ ทำให้ Transformer แบบเข้ารหัส-ถอดรหัส (encoder-decoder) เพียงตัวเดียวสามารถฝึกฝนล่วงหน้า (pre-trained) ครั้งเดียว และปรับละเอียด (fine-tuned) สำหรับงานต่างๆ ด้วยอินเทอร์เฟซที่สอดคล้องกัน T5 ได้นำเสนอการฝึกฝนล่วงหน้าแบบ span-corruption และคลังข้อมูล C4 และรูปแบบที่ใหญ่ที่สุด (พารามิเตอร์ 11 พันล้านตัว) ได้บรรลุผลลัพธ์ระดับสถานะศิลป์ (state-of-the-art) ในชุดเกณฑ์มาตรฐาน NLP ที่หลากหลาย ณ เวลาที่ตีพิมพ์
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
- Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., Zhou, Y., Li, W., & Liu, P. J. (2020). Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer. Journal of Machine Learning Research, 21(140), 1–67. link ↗
- Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is All You Need. Advances in Neural Information Processing Systems, 30. link ↗
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Proceedings of NAACL-HLT 2019, 4171–4186. link ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 3). T5: Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer. ScholarGate. https://scholargate.app/th/deep-learning/t5
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- กลไกการใส่ใจ (Attention Mechanism)การเรียนรู้เชิงลึก↔ compare
- การเรียนรู้แบบถ่ายโอนการเรียนรู้ของเครื่อง↔ compare