ScholarGate
Asisten

Model Semiterstruktur dan Dokumen

Model data semiterstruktur dan dokumen merepresentasikan data sebagai objek mandiri, berstruktur tidak teratur, berupa pohon atau objek bersarang — seperti dalam XML dan JSON — di mana struktur dibawa bersama data daripada ditetapkan oleh skema yang kaku.

Temukan Topik dengan PaperMindSegeraFind papers & topics
Tools & resources
Unduh salindia
Learn & explore
VideoSegera

Definition

Data semiterstruktur adalah data yang memiliki struktur organisasi tetapi tidak sesuai dengan skema tetap, biasanya dimodelkan sebagai pohon berlabel atau objek kunci-nilai bersarang; model dokumen menyimpan data tersebut sebagai dokumen mandiri (umumnya JSON atau XML) daripada sebagai baris dalam tabel tetap.

Scope

Topik ini mencakup model data yang melonggarkan persyaratan relasional dari skema yang seragam: data semiterstruktur berbentuk pohon dan graf, XML dengan DTD dan skemanya, serta model dokumen berbasis JSON yang digunakan oleh penyimpanan dokumen. Ini membahas penumpukan (nesting), bidang opsional dan berulang, fleksibilitas skema, dan bahasa kueri berorientasi jalur dan pohon (seperti XPath dan XQuery) yang beroperasi di atasnya. Ini tidak termasuk rekayasa sistem NoSQL yang lebih luas dan model konsistensi, yang dibahas dalam area big-data dan NoSQL.

Core questions

  • Bagaimana data yang mandiri dan fleksibel skema berbeda dari tabel relasional yang kaku?
  • Bagaimana XML dan JSON digunakan untuk merepresentasikan data bersarang dan tidak teratur?
  • Peran apa yang dimainkan oleh skema opsional (DTD, Skema XML, Skema JSON)?
  • Bagaimana bahasa kueri jalur dan pohon seperti XPath dan XQuery menavigasi data?
  • Apa saja pertukaran (trade-off) model dokumen dibandingkan dengan model relasional?

Key concepts

  • data semiterstruktur (pohon/graf)
  • XML dan DTD/Skema XML
  • JSON dan penyimpanan dokumen
  • bidang bersarang dan berulang
  • skema-saat-baca versus skema-saat-tulis
  • XPath dan XQuery
  • data mandiri
  • evolusi skema

Key theories

Data terstruktur pohon yang mandiri
Data semiterstruktur dimodelkan sebagai pohon atau graf berlabel di mana struktur dikodekan bersama nilai, memungkinkan bidang yang hilang, opsional, dan heterogen tanpa skema yang telah ditentukan sebelumnya.
Fleksibilitas skema versus penegakan skema
Model dokumen dan semiterstruktur menukarkan integritas dan jaminan kueri dari skema tetap dengan fleksibilitas dan kemudahan evolusi, secara opsional memvalidasi terhadap skema seperti Skema XML atau Skema JSON ketika jaminan yang lebih kuat diperlukan.
Kueri berbasis jalur
Bahasa seperti XPath dan XQuery memilih dan mengubah bagian-bagian dokumen berstruktur pohon dengan menavigasi jalur dan pola, menyediakan model kueri yang sesuai untuk data bersarang dan tidak teratur.

Clinical relevance

Model semiterstruktur dan dokumen mendasari pertukaran data web dan pengembangan aplikasi modern: XML dan JSON adalah format dominan untuk API, konfigurasi, dan perpesanan, dan basis data dokumen menyimpan data yang fleksibel dan berkembang untuk sistem web, seluler, dan manajemen konten di mana skema relasional yang kaku akan merepotkan.

History

Data semiterstruktur muncul pada tahun 1990-an untuk menggambarkan data web dan integrasi heterogen yang tidak sesuai dengan skema tetap. XML menjadi standar W3C pada tahun 1998 dengan bahasa kueri terkait XPath dan XQuery; JSON kemudian menjadi format de facto yang ringan untuk API web, dan basis data dokumen mempopulerkan penyimpanan dokumen JSON secara langsung, menghidupkan kembali dan memperluas tradisi semiterstruktur.

Key figures

  • Serge Abiteboul
  • Peter Buneman
  • Dan Suciu

Related topics

Seminal works

  • abiteboul2000
  • garciamolina2008

Frequently asked questions

Apakah model dokumen sama dengan tidak memiliki skema?
Tidak persis. Model dokumen bersifat fleksibel skema daripada tanpa skema: dokumen individual membawa strukturnya sendiri, dan skema opsional (seperti Skema JSON atau Skema XML) dapat diterapkan untuk validasi. Perbedaannya dari model relasional adalah bahwa struktur tidak harus seragam di semua catatan.
Kapan model dokumen lebih disukai daripada tabel relasional?
Model dokumen cocok untuk data yang secara alami bersarang, heterogen, atau berkembang pesat — seperti profil pengguna, entri katalog, atau peristiwa yang dicatat — di mana memaksakan skema tabel yang seragam akan canggung. Model relasional tetap lebih disukai ketika data teratur dan kuat, integritas multi-catatan, dan gabungan kompleks diperlukan.

Methods for this concept

Related concepts