Process / pipeline

TF-IDF — Term Frequency–Inverse Document Frequency

TF-IDF, যা Salton এবং Buckley (1988) কর্তৃক প্রবর্তিত, একটি শব্দ-ওজন (term-weighting) পদ্ধতি যা একটি ডকুমেন্টের প্রতিটি শব্দকে তার স্থানীয় উপস্থিতি এবং সমগ্র সংগ্রহে তার বিরলতার ভিত্তিতে স্কোর প্রদান করে। এটি কাঁচা টেক্সটকে ওজনযুক্ত ডকুমেন্ট ভেক্টরে রূপান্তরিত করে, যেখানে যে শব্দগুলি একটি নির্দিষ্ট ডকুমেন্টে ঘন ঘন আসে কিন্তু অন্য কোথাও বিরল, সেগুলিকে উচ্চ ওজন দেওয়া হয়।

MethodMind-এ খুলুনশীঘ্রইভিডিওশীঘ্রইDownload slides

পুরো পদ্ধতিটি পড়ুন

শুধু সদস্যদের জন্য

এই অংশটি পড়তে বিনামূল্যের অ্যাকাউন্ট দিয়ে সাইন ইন করুন।

সাইন ইন করুন

Method map

The neighbourhood of related methods — select a node to explore.

TF-IDF

অনুভূতি বিশ্লেষণ Text Classification Word2Vec সহ-ঘটনা বিশ্লেষণ Doc2Vec ডকুমেন্ট ক্লাস্টারিং ভুয়ো খবর শনাক্তকরণ GloVe এমবেডিংস মূলশব্দ নিষ্কাশন শব্দভাণ্ডারের বৈচিত্র্য

+13 more

উৎস

Salton, G. & Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5), 513-523. DOI: 10.1016/0306-4573(88)90021-0 ↗

এই পৃষ্ঠা কীভাবে উদ্ধৃত করবেন

ScholarGate. (2026, June 1). Term Frequency–Inverse Document Frequency Vectorization. ScholarGate. https://scholargate.app/bn/text-mining/tf-idf

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

অনুভূতি বিশ্লেষণটেক্সট খনন↔ compare
Text Classificationটেক্সট খনন↔ compare
Word2Vecটেক্সট খনন↔ compare

Compare side by side →

যেখানে উদ্ধৃত

সহ-ঘটনা বিশ্লেষণ Doc2Vec ডকুমেন্ট ক্লাস্টারিং ভুয়ো খবর শনাক্তকরণ GloVe এমবেডিংস মূলশব্দ নিষ্কাশন শব্দভাণ্ডারের বৈচিত্র্য ভাষাগত গ্রহণযোগ্যতা মূল্যায়ন শব্দতাত্ত্বিক বিশ্লেষণ মাল্টি-ডকুমেন্ট সামারাইজেশন এন-গ্রাম ভাষা মডেল (N-gram Language Model)এনএমএফ টপিক মডেলিং (NMF Topic Modeling)পাঠযোগ্যতা বিশ্লেষণ শব্দার্থিক সাদৃশ্য অনুভূতি বিশ্লেষণ সোশ্যাল মিডিয়া এনএলপি Text Classification টেক্সট ডিডুপ্লিকেশন টেক্সট ফ্রিকোয়েন্সি অ্যানালাইসিস টেক্সট রিগ্রেশন টেক্সট সেগমেন্টেশন বিষয় মডেলিং Word2Vec

এই পৃষ্ঠায় কোনো ত্রুটি চোখে পড়েছে? জানান বা সংশোধনের প্রস্তাব দিন →