Machine learning
วิชันทรานส์ฟอร์มเมอร์
วิชันทรานส์ฟอร์มเมอร์ (ViT) ซึ่งนำเสนอโดย Dosovitskiy และคณะในปี 2021 ได้แบ่งภาพออกเป็นแพตช์ที่มีขนาดคงที่ ถือว่าแพตช์เหล่านั้นเป็นลำดับ และใช้กลไกการใส่ใจตนเอง (self-attention) ของทรานส์ฟอร์มเมอร์สำหรับการจำแนกประเภทภาพ เมื่อมีข้อมูลการฝึกเพียงพอ จะมีประสิทธิภาพเหนือกว่าโครงข่ายประสาทเทียมแบบสังวัตนาการ (CNNs)
อ่านวิธีฉบับเต็ม
สำหรับสมาชิกเท่านั้น
เข้าสู่ระบบเข้าสู่ระบบด้วยบัญชีฟรีเพื่ออ่านส่วนนี้
Method map
The neighbourhood of related methods — select a node to explore.
+27 more
แหล่งอ้างอิง
วิธีอ้างอิงหน้านี้
ScholarGate. (2026, June 1). Vision Transformer (ViT). ScholarGate. https://scholargate.app/th/deep-learning/vision-transformer
Which method?
Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.
- แบบจำลองการแพร่ (Diffusion Model)การเรียนรู้เชิงลึก↔ compare
- โครงข่ายปฏิปักษ์เชิงกำเนิดการเรียนรู้เชิงลึก↔ compare
- Random Forestการเรียนรู้ของเครื่อง↔ compare
- Support Vector Machineการเรียนรู้ของเครื่อง↔ compare
- ตัวเข้ารหัสอัตโนมัติแบบแปรผันการเรียนรู้เชิงลึก↔ compare
ถูกอ้างอิงโดย
การปรับจูน BERTCLIPโดเมน-อะแดปทีฟ ทรานส์ฟอร์มเมอร์วิทัศน์ทรานส์ฟอร์มปรับโดเมน (Domain-Adaptive Vision Transformer - DA-ViT)Transformer วิสัยทัศน์ที่อธิบายได้วิชันทรานส์ฟอร์มเมอร์ที่ปรับละเอียดการปรับละเอียด GPT (GPT Fine-Tuning)การจำแนกประเภทรูปภาพโครงข่ายประสาทคอลโมโกรอฟ-อาร์โนลด์LoRA และ PEFTMamba (แบบจำลองปริภูมิสถานะ)Masked AutoencodersMultilingual Vision Transformerการจำแนกประเภทแบบหลายรูปแบบโดยใช้ BERTการประมวลผลภาษาธรรมชาติแบบหลายรูปแบบการแบ่งส่วนความหมายแบบหลายรูปแบบMultimodal Transformerทรานส์ฟอร์มเมอร์วิสัยทัศน์หลายรูปแบบโมเดล Segment AnythingGAN แบบกำกับตนเองการจำแนกภาพแบบกำกับตนเองการแบ่งส่วนอินสแตนซ์แบบกำกับตนเองการแบ่งส่วนภาพตามความหมายแบบเรียนรู้ด้วยตนเองSelf-supervised Vision Transformerหม้อแปลงวิทัศน์แบบกึ่งมีผู้สอนSimCLRเครือข่ายคอนโวลูชันกราฟเชิงพื้นที่-เวลาSwin Transformer (โปรแกรมแปลง Swin)TimeGPTวิชันแมมบ้าการตรวจจับวัตถุแบบมีผู้สอนแบบอ่อนวิทัศน์ทรานส์ฟอร์มแบบมีผู้สอนแบบอ่อน