ScholarGate
সহকারী
Machine learningDeep learning / NLP / CV

ফাইন-টিউনড ভিশন ট্রান্সফরমার

ফাইন-টিউনড ভিশন ট্রান্সফরমার (Fine-Tuned Vision Transformer) একটি বৃহৎ প্রি-ট্রেইনড ViT মডেলকে — যা ছবিকে নির্দিষ্ট আকারের প্যাচে বিভক্ত করে এবং সেলফ-অ্যাটেনশন লেয়ারের মাধ্যমে প্রক্রিয়া করে — তুলনামূলকভাবে ছোট লেবেলযুক্ত ডেটাসেট ব্যবহার করে একটি নতুন ইমেজ ক্লাসিফিকেশন বা রিকগনিশন টাস্কের জন্য অভিযোজিত করে। এটি বৃহৎ পরিসরে প্রি-ট্রেনিংয়ের সময় শেখা সমৃদ্ধ উপস্থাপনাগুলির সুবিধা নিয়ে কম্পিউটার ভিশনে অত্যাধুনিক নির্ভুলতা অর্জন করে।

MethodMind-এ খুলুনশীঘ্রইভিডিওশীঘ্রইস্লাইড ডাউনলোড করুন

পুরো পদ্ধতিটি পড়ুন

শুধু সদস্যদের জন্য

এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।

সাইন ইন করুন

পদ্ধতি-মানচিত্র

সম্পর্কিত পদ্ধতিসমূহের প্রতিবেশ — অন্বেষণ করতে একটি নোড নির্বাচন করুন।

+4টি আরও

উৎস

  1. Dosovitskiy, A., Beyer, L., Kolesnikov, A., Weissenborn, D., Zhai, X., Unterthiner, T., Dehghani, M., Minderer, M., Heigold, G., Gelly, S., Uszkoreit, J., & Houlsby, N. (2021). An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale. In International Conference on Learning Representations (ICLR 2021). link
  2. Zhai, X., Kolesnikov, A., Houlsby, N., & Beyer, L. (2022). Scaling Vision Transformers. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR 2022), pp. 12104-12113. link

এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন

ScholarGate. (2026, June 3). Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation). ScholarGate. https://scholargate.app/bn/deep-learning/fine-tuned-vision-transformer

কোন পদ্ধতি?

এই পদ্ধতিটিকে তার নিকটতম সমগোত্রীয়দের পাশে রাখুন এবং পাশাপাশি পড়ুন — গ্রন্থাগার বইগুলি টেবিলে সাজিয়ে দেয়; নির্বাচন আপনার।

পাশাপাশি তুলনা করুন

যেখানে উদ্ধৃত

ScholarGateFine-Tuned Vision Transformer (Fine-Tuned Vision Transformer (ViT with Task-Specific Adaptation)). 2026-06-15 তারিখে সংগৃহীত, উৎস: https://scholargate.app/bn/deep-learning/fine-tuned-vision-transformer · ডেটাসেট: https://doi.org/10.5281/zenodo.20539026