ScholarGate
সহকারী
Hypothesis test

মাল্টি-আর্মড ব্যান্ডিট (ইউসিবি, থম্পসন স্যাম্পলিং)

মাল্টি-আর্মড ব্যান্ডিট (এমএবি) হলো একটি অভিযোজিত পরীক্ষামূলক কাঠামো যা সেরা কোন আর্মটি সবচেয়ে ভালো পারফর্ম করে তা শেখার পাশাপাশি ক্রমবর্ধমান ক্ষতি (regret) কমানোর জন্য প্রতিযোগিতামূলক আর্মগুলির মধ্যে পরীক্ষাগুলি ক্রমানুসারে বরাদ্দ করে। এটি রবিন্স ১৯৫২ সালে আনুষ্ঠানিক রূপ দেন এবং আউয়ার এট আল. (২০০২) দ্বারা সসীম-সময়ের নিশ্চয়তা প্রদান করা হয়। এটি অনিশ্চিত বিকল্পগুলির অনুসন্ধান (exploration) এবং বর্তমানে পরিচিত সেরা বিকল্পগুলির ব্যবহারের (exploitation) মধ্যে ভারসাম্য বজায় রাখে — যখন প্রাথমিক সমাপ্তি বা ব্যয়-সংবেদনশীল বরাদ্দ গুরুত্বপূর্ণ তখন এটি ক্লাসিক্যাল এ/বি পরীক্ষার চেয়ে ভালো পারফর্ম করে।

PaperMind দিয়ে বিষয় খুঁজুনশীঘ্রইভিডিওশীঘ্রইস্লাইড ডাউনলোড করুন

পুরো পদ্ধতিটি পড়ুন

শুধু সদস্যদের জন্য

এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।

সাইন ইন করুন

পদ্ধতি-মানচিত্র

সম্পর্কিত পদ্ধতিসমূহের প্রতিবেশ — অন্বেষণ করতে একটি নোড নির্বাচন করুন।

উৎস

  1. Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352
  2. Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070

এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/bn/experimental-design/multiarm-bandit

কোন পদ্ধতি?

এই পদ্ধতিটিকে তার নিকটতম সমগোত্রীয়দের পাশে রাখুন এবং পাশাপাশি পড়ুন — গ্রন্থাগার বইগুলি টেবিলে সাজিয়ে দেয়; নির্বাচন আপনার।

পাশাপাশি তুলনা করুন

যেখানে উদ্ধৃত

ScholarGateMulti-Armed Bandit (Multi-Armed Bandit (UCB, Thompson Sampling)). 2026-06-15 তারিখে সংগৃহীত, উৎস: https://scholargate.app/bn/experimental-design/multiarm-bandit · ডেটাসেট: https://doi.org/10.5281/zenodo.20539026