মাল্টি-আর্মড ব্যান্ডিট (ইউসিবি, থম্পসন স্যাম্পলিং)
মাল্টি-আর্মড ব্যান্ডিট (এমএবি) হলো একটি অভিযোজিত পরীক্ষামূলক কাঠামো যা সেরা কোন আর্মটি সবচেয়ে ভালো পারফর্ম করে তা শেখার পাশাপাশি ক্রমবর্ধমান ক্ষতি (regret) কমানোর জন্য প্রতিযোগিতামূলক আর্মগুলির মধ্যে পরীক্ষাগুলি ক্রমানুসারে বরাদ্দ করে। এটি রবিন্স ১৯৫২ সালে আনুষ্ঠানিক রূপ দেন এবং আউয়ার এট আল. (২০০২) দ্বারা সসীম-সময়ের নিশ্চয়তা প্রদান করা হয়। এটি অনিশ্চিত বিকল্পগুলির অনুসন্ধান (exploration) এবং বর্তমানে পরিচিত সেরা বিকল্পগুলির ব্যবহারের (exploitation) মধ্যে ভারসাম্য বজায় রাখে — যখন প্রাথমিক সমাপ্তি বা ব্যয়-সংবেদনশীল বরাদ্দ গুরুত্বপূর্ণ তখন এটি ক্লাসিক্যাল এ/বি পরীক্ষার চেয়ে ভালো পারফর্ম করে।
পুরো পদ্ধতিটি পড়ুন
এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।
পদ্ধতি-মানচিত্র
সম্পর্কিত পদ্ধতিসমূহের প্রতিবেশ — অন্বেষণ করতে একটি নোড নির্বাচন করুন।
উৎস
- Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
- Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗
এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন
ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/bn/experimental-design/multiarm-bandit
কোন পদ্ধতি?
এই পদ্ধতিটিকে তার নিকটতম সমগোত্রীয়দের পাশে রাখুন এবং পাশাপাশি পড়ুন — গ্রন্থাগার বইগুলি টেবিলে সাজিয়ে দেয়; নির্বাচন আপনার।
- এ/বি পরীক্ষা (অনলাইন নিয়ন্ত্রিত পরীক্ষা)পরীক্ষামূলক নকশা↔ তুলনা করুন
- অভিযোজিত ক্লিনিক্যাল ট্রায়াল ডিজাইনপরীক্ষামূলক নকশা↔ তুলনা করুন
- এলোমেলো নিয়ন্ত্রিত পরীক্ষা (RCT)পরীক্ষামূলক নকশা↔ তুলনা করুন
- সিকোয়েন্সিয়াল / গ্রুপ সিকোয়েন্সিয়াল ট্রায়াল ডিজাইনপরীক্ষামূলক নকশা↔ তুলনা করুন
যেখানে উদ্ধৃত
এই পৃষ্ঠায় কোনো ত্রুটি চোখে পড়েছে? জানান বা সংশোধনের প্রস্তাব দিন →