ফাইন-টিউনড ভিশন ট্রান্সফরমার
ফাইন-টিউনড ভিশন ট্রান্সফরমার (Fine-Tuned Vision Transformer) একটি বৃহৎ প্রি-ট্রেইনড ViT মডেলকে — যা ছবিকে নির্দিষ্ট আকারের প্যাচে বিভক্ত করে এবং সেলফ-অ্যাটেনশন লেয়ারের মাধ্যমে প্রক্রিয়া করে — তুলনামূলকভাবে ছোট লেবেলযুক্ত ডেটাসেট ব্যবহার করে একটি নতুন ইমেজ ক্লাসিফিকেশন বা রিকগনিশন টাস্কের জন্য অভিযোজিত করে। এটি বৃহৎ পরিসরে প্রি-ট্রেনিংয়ের সময় শেখা সমৃদ্ধ উপস্থাপনাগুলির সুবিধা নিয়ে কম্পিউটার ভিশনে অত্যাধুনিক নির্ভুলতা অর্জন করে।
পুরো পদ্ধতিটি পড়ুন
এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।
পদ্ধতি-মানচিত্র
সম্পর্কিত পদ্ধতিসমূহের প্রতিবেশ — অন্বেষণ করতে একটি নোড নির্বাচন করুন।
+4টি আরও
উৎস
- Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link ↗
- Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link ↗
এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন
ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/bn/deep-learning/fine-tuned-vision-transformer
কোন পদ্ধতি?
এই পদ্ধতিটিকে তার নিকটতম সমগোত্রীয়দের পাশে রাখুন এবং পাশাপাশি পড়ুন — গ্রন্থাগার বইগুলি টেবিলে সাজিয়ে দেয়; নির্বাচন আপনার।
- BERT-ভিত্তিক শ্রেণিবিভাগগভীর শিখন↔ তুলনা করুন
- ফাইন-টিউনড কনভোল্যুশনাল নিউরাল নেটওয়ার্কগভীর শিখন↔ তুলনা করুন
- চিত্র শ্রেণীকরণগভীর শিখন↔ তুলনা করুন
- Semantic segmentationগভীর শিখন↔ তুলনা করুন
- ভিশন ট্রান্সফরমারগভীর শিখন↔ তুলনা করুন
যেখানে উদ্ধৃত
এই পৃষ্ঠায় কোনো ত্রুটি চোখে পড়েছে? জানান বা সংশোধনের প্রস্তাব দিন →