Process / pipeline

TF-IDF — Term Frequency–Inverse Document Frequency

TF-IDF, যা Salton এবং Buckley (1988) কর্তৃক প্রবর্তিত, একটি শব্দ-ওজন (term-weighting) পদ্ধতি যা একটি ডকুমেন্টের প্রতিটি শব্দকে তার স্থানীয় উপস্থিতি এবং সমগ্র সংগ্রহে তার বিরলতার ভিত্তিতে স্কোর প্রদান করে। এটি কাঁচা টেক্সটকে ওজনযুক্ত ডকুমেন্ট ভেক্টরে রূপান্তরিত করে, যেখানে যে শব্দগুলি একটি নির্দিষ্ট ডকুমেন্টে ঘন ঘন আসে কিন্তু অন্য কোথাও বিরল, সেগুলিকে উচ্চ ওজন দেওয়া হয়।

MethodMind-এ খুলুনশীঘ্রইভিডিওশীঘ্রইDownload slides

পুরো পদ্ধতিটি পড়ুন

শুধু সদস্যদের জন্য

এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।

সাইন ইন করুন

Method map

The neighbourhood of related methods — select a node to explore.

+13 more

উৎস

  1. Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0

এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/bn/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

যেখানে উদ্ধৃত

ScholarGateTF-IDF (Term Frequency–Inverse Document Frequency Vectorization). 2026-06-15 তারিখে সংগৃহীত, উৎস: https://scholargate.app/bn/text-mining/tf-idf · ডেটাসেট: https://doi.org/10.5281/zenodo.20539026