การจำแนกประเภทแบบเรียนรู้ด้วยตนเองโดยใช้ BERT
การจำแนกประเภทแบบเรียนรู้ด้วยตนเองโดยใช้ BERT (Self-supervised BERT-based classification) ใช้ Bidirectional Encoder Representations from Transformers (BERT) ของ Google ซึ่งได้รับการฝึกฝนล่วงหน้า (pretrained) บนข้อความจำนวนมหาศาลที่ไม่มีป้ายกำกับ (unlabelled text) ผ่านการสร้างแบบจำลองภาษาแบบปิดบัง (masked-language modelling) จากนั้นจึงปรับแต่ง (fine-tune) ด้วยข้อมูลตัวอย่างที่มีป้ายกำกับ (labelled examples) เพื่อจัดประเภทข้อความออกเป็นหมวดหมู่ต่างๆ วิธีการนี้ให้ความแม่นยำระดับ state-of-the-art อย่างสม่ำเสมอในการวิเคราะห์ความรู้สึก (sentiment analysis) การจำแนกหัวข้อ (topic classification) การตรวจจับเจตนา (intent detection) และงานประมวลผลภาษาธรรมชาติ (NLP) ที่คล้ายคลึงกัน แม้จะมีข้อมูลที่มีป้ายกำกับจำกัดก็ตาม
อ่านวิธีฉบับเต็ม
เข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
แหล่งอ้างอิง
- Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. In Proceedings of NAACL-HLT 2019, 4171–4186. Association for Computational Linguistics. DOI: 10.18653/v1/N19-1423 ↗
- Sun, C., Qiu, X., Xu, Y., & Huang, X. (2019). How to Fine-Tune BERT for Text Classification? In China National Conference on Chinese Computational Linguistics (CCL 2019), LNCS 11856, 194–206. Springer. DOI: 10.1007/978-3-030-32381-3_16 ↗
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 3). Self-supervised BERT-based Text Classification (Pretrain then Fine-tune). ScholarGate. https://scholargate.app/th/deep-learning/self-supervised-bert-based-classification