ScholarGate
Trợ lý

Tinh chỉnh và phân rã lược đồ

Tinh chỉnh lược đồ là quá trình phân rã một quan hệ thành các quan hệ nhỏ hơn để đạt được dạng chuẩn mong muốn, với yêu cầu rằng việc phân rã phải không mất mát và, lý tưởng nhất, bảo toàn các phụ thuộc ban đầu.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Phân rã thay thế một lược đồ quan hệ R bằng một tập hợp các lược đồ mà các thuộc tính của chúng cùng bao phủ R, sao cho quan hệ gốc có thể được khôi phục bằng cách kết nối các phần (kết nối không mất mát) và, khi có thể, mọi phụ thuộc hàm gốc có thể được thực thi trên các phần (bảo toàn phụ thuộc).

Scope

Chủ đề này bao gồm các thuật toán và tiêu chí để phân rã lược đồ quan hệ: thuộc tính kết nối không mất mát (lossless-join property) và cách kiểm tra nó, bảo toàn phụ thuộc (dependency preservation) và sự căng thẳng của nó với các dạng chuẩn cao hơn, cùng với các thuật toán tổng hợp và phân rã tiêu chuẩn tạo ra thiết kế 3NF (bảo toàn phụ thuộc và không mất mát) hoặc BCNF (không mất mát) từ một tập hợp các phụ thuộc hàm. Nó không bao gồm định nghĩa của các dạng chuẩn và các phụ thuộc thúc đẩy việc phân rã.

Core questions

  • Điều gì làm cho một phân rã không mất mát, và thuộc tính này được kiểm tra như thế nào?
  • Một phân rã bảo toàn phụ thuộc có nghĩa là gì?
  • Tại sao phân rã BCNF có thể không bảo toàn phụ thuộc trong khi tổng hợp 3NF thì có?
  • Các thuật toán phân rã BCNF và tổng hợp 3NF tiêu chuẩn hoạt động như thế nào?
  • Việc lựa chọn giữa BCNF và 3NF được thực hiện như thế nào trong thực tế?

Key concepts

  • phân rã lược đồ
  • thuộc tính kết nối không mất mát
  • bảo toàn phụ thuộc
  • bộ dữ liệu giả
  • thuật toán phân rã BCNF
  • thuật toán tổng hợp 3NF
  • bao phủ tối thiểu
  • sự đánh đổi giữa BCNF và 3NF

Key theories

Phân rã kết nối không mất mát
Một phân rã nhị phân là không mất mát nếu các thuộc tính chung của hai phần tạo thành một khóa của ít nhất một trong số chúng; tính không mất mát đảm bảo rằng việc kết nối các phần sẽ tái tạo chính xác quan hệ gốc mà không có các bộ dữ liệu giả.
Bảo toàn phụ thuộc
Một phân rã bảo toàn phụ thuộc nếu hợp của các phụ thuộc có thể thực thi trên từng phần riêng lẻ ngụ ý tất cả các phụ thuộc gốc, do đó tính nhất quán có thể được kiểm tra mà không cần tính toán lại các phép nối.
Phân rã BCNF so với tổng hợp 3NF
Thuật toán phân rã BCNF đảm bảo tính không mất mát nhưng có thể hy sinh việc bảo toàn phụ thuộc, trong khi thuật toán tổng hợp 3NF từ một bao phủ tối thiểu đảm bảo cả kết nối không mất mát và bảo toàn phụ thuộc với chi phí có thể dừng lại ở 3NF.

Clinical relevance

Các thuật toán phân rã là cách lý thuyết chuẩn hóa trở thành một quy trình thiết kế có thể thực hiện được: áp dụng chúng tạo ra các lược đồ tránh dư thừa nhưng vẫn có thể được tái cấu trúc và xác thực hiệu quả, điều này ảnh hưởng trực tiếp đến tính đúng đắn và khả năng bảo trì của các cơ sở dữ liệu sản xuất.

History

Lý thuyết về phân rã không mất mát và bảo toàn phụ thuộc được phát triển trong suốt những năm 1970 khi các nhà nghiên cứu chính thức hóa khi nào việc chia một quan hệ là an toàn. Các thuật toán tổng hợp tạo ra các thiết kế 3NF bảo toàn phụ thuộc, và việc nhận ra rằng BCNF có thể xung đột với việc bảo toàn phụ thuộc, đã trở thành tài liệu tiêu chuẩn trong các sách về cơ sở dữ liệu và vẫn là trung tâm của thiết kế lược đồ.

Key figures

  • Edgar F. Codd
  • Jeffrey D. Ullman
  • Philip Bernstein

Related topics

Seminal works

  • silberschatz2019
  • ramakrishnan2003
  • garciamolina2008

Frequently asked questions

Bộ dữ liệu giả là gì và tại sao nó lại quan trọng?
Bộ dữ liệu giả là một hàng xuất hiện khi bạn kết nối các phần của một phân rã được chọn không tốt nhưng không tương ứng với bất kỳ bộ dữ liệu thực nào của quan hệ gốc. Một phân rã kết nối không mất mát chính xác là một phân rã không tạo ra các bộ dữ liệu giả, đó là lý do tại sao tính không mất mát là một yêu cầu không thể thương lượng.
Tại sao tôi có thể chọn 3NF thay vì BCNF?
Phân rã thành BCNF luôn bảo toàn thuộc tính kết nối không mất mát nhưng có thể phá vỡ việc bảo toàn phụ thuộc, nghĩa là một số ràng buộc chỉ có thể được kiểm tra bằng cách kết nối các bảng. Thuật toán tổng hợp 3NF đảm bảo cả tính không mất mát và bảo toàn phụ thuộc, vì vậy các nhà thiết kế chấp nhận 3NF khi không tồn tại một thiết kế BCNF bảo toàn phụ thuộc.

Methods for this concept

Related concepts