Process / pipeline

Tekstin segmentointi — Aiherajojen tunnistus

Tekstin segmentointi jakaa pitkän dokumentin merkityksellisiin osioihin (segmentteihin) aiheen tai diskurssin rajojen mukaisesti. Marti A. Hearstin TextTiling (1997) -menetelmä, joka esiteltiin ala-aiheiden käsittelyyn, tukee dokumentin rakenteen analysointia ja aiheen siirtymien tunnistusta jatkuvassa tekstissä.

Avaa sovelluksessa MethodMindTulossaVideoTulossaDownload slides

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Method map

The neighbourhood of related methods — select a node to explore.

Lähteet

  1. Hearst, M.A. (1997). TextTiling: Segmenting Text into Multi-Paragraph Subtopic Passages. Computational Linguistics, 23(1), 33-64. link
  2. Choi, F.Y.Y. (2000). Advances in Domain Independent Linear Text Segmentation. NAACL. link

Näin viittaat tähän sivuun

ScholarGate. (2026, June 1). Text Segmentation (Topic Segmentation). ScholarGate. https://scholargate.app/fi/text-mining/text-segmentation

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

Compare side by side

Tähän viittaavat

ScholarGateText Segmentation (Text Segmentation (Topic Segmentation)). Haettu 2026-06-15 osoitteesta https://scholargate.app/fi/text-mining/text-segmentation · Aineisto: https://doi.org/10.5281/zenodo.20539026