Cơ sở dữ liệu được xây dựng dựa trên

Lý thuyết chung về cơ sở dữ liệu

Tổng quan về cơ sở dữ liệu

Cơ sở dữ liệu là gì ?

Một cơ sở dữ liệu [CSDL] là một tập hợp các dữ liệu có liên quan với nhau, được lưu trữ trên máy tính, có nhiều người sử dụng và được tổ chức theo một mô hình. Hay nói cách khác, CSDL là một bộ các dữ liệu tác nghiệp được lưu trữ lại và được các hệ ứng dụng của một đơn vị cụ thể nào đó sử dụng.

Ví dụ, để quản lý việc học tập trong một môi trường đại học, các dữ liệu là các thông tin về sinh viên, về các môn học, điểm thi... Các dữ liệu đó được tổ chức thành các bảng và lưu giữ chúng vào sổ sách hoặc sử dụng một phần mềm máy tính để lưu giữ chúng trên máy tính. Ta có một tập các dữ liệu có liên quan đến nhau và mang nhiều ý nghĩa, đó là một cơ sở dữ liệu.

Mô hình cơ sở dữ liệu

Mô hình dữ liệu là một khuôn dạng của dữ liệu cho phép người dùng nhìn thấy dữ liệu dưới cấu trúc thuật ngữ để diễn tả mà ta gọi là lược đồ [scheme]. Nó cho ta biết cấu trúc của cơ sở dữ liệu, bao gồm hai thành phần:

  • Hệ thống ký hiệu để mô tả dữ liệu.
  • Tập hợp các phép toán thao tác trên dữ liệu đó.

Mô hình phân cấp [Hierarchical model]

Mô hình phân cấp được đưa ra vào những năm 60, trong mô hình này dữ liệu được tổ chức thành cấu trúc cây. Trong đó các nút [node] là tập các thực thể, các cành [edge] là các mối quan hệ giữa hai nút theo mối quan hệ nhẩt định, cứng nhắc. Hay nói cách khác:

  • Là mô hình dữ liệu trong đó các bản ghi được sắp xếp theo cấu trúc top-down [tree]
  • Một nút con chỉ có một nút cha -> chỉ có một đường truy nhập tới dữ liệu đó trước. Tập dữ liệu được tổ chức theo cấu trúc của mô hình dữ liệu phân cấp gọi là CSDL phân cấp. Ví dụ mô hình phân cấp trong quản lý nhân sự của một công ty.

Ưu điểm :

  • Dễ xây dựng và thao tác.
  • Tương thích với các lĩnh vực tổ chức phân cấp [ví dụ: tổ chức nhân sự trong các đơn vị, ...].
  • Ngôn ngữ thao tác đơn giản [duyệt cây].

Nhược điểm :

  • Sự lặp lại của các kiểu bản ghi gây ra dư thừa dữ liệu và dữ liệu không nhất quán.
  • Giải pháp là xây dựng các bản ghi ảo.
  • Hạn chế trong biểu diễn ngữ nghĩa của các móc nối giữa các bản ghi [chỉ cho phép quan hệ 1-n].

Mô hình mạng [Network model]

Mô hình mạng được sử dụng phổ biến vào cuối những năm 60, và được định nghĩa lại vào năm 1971. Trong mô hình này dữ liệu được tổ chức thành một đồ thị có hướng, trong đó các đỉnh là các thực thể, các cung là quan hệ giữa hai đỉnh, một kiểu bản ghi có thể liên kết với nhiều kiểu bản ghi khác.

Một con có thể có nhiều cha dẫn tới có thể có nhiều đường truy nhập đến một dữ liệu cho trước. Tập dữ liệu được tổ chức theo cấu trúc của mô hình dữ liệu mạng gọi là CSDL mạng. Ví dụ dữ liệu của một công ty có thể tổ chức theo mô hình mạng như sau.

Ưu điểm :

  • Đơn giản.
  • Có thể biểu diễn các ngữ nghĩa đa dạng với kiểu bản ghi và kiểu móc nối
  • Truy vấn thông qua phép duyệt đồ thị [navigation]

Nhược điểm :

  • Số lượng các con trỏ lớn.
  • Hạn chế trong biểu diễn ngữ nghĩa của các móc nối giữa các bản ghi.

Mô hình dữ liệu quan hệ [Relational model]

Mô hình này đượcc E.F Codd đưa vào đầu những năm 70, mô hình này dựa trên lý thuyết tập hợp và đại số quan hệ. Vì tính chất chặt chẽ của toán học về lí thuyết tập hợp nên mô hình này đã mô tả dữ liệu một cách rõ ràng, mềm dẻo và là mô hình thông dụng nhất hiện nay. Hầu hết các DBMS đều tổ chức dữ liệu theo mô hình dữ liệu quan hệ. Trong đó dữ liệu được tổ chức dưới dạng bảng, các phép toán thao tác trên dữ liệu dựa trên lý thuyết tập hợp của toán học. Tập dữ liệu được tổ chức theo cấu trúc của mô hình dữ liệu quan hệ thì được gọi là CSDL quan hệ. Ví dụ dưới đây mô tả dữ liệu được tổ chức theo kiểu quan hệ:

Ưu điểm :

  • Dựa trên lý thuyết tập hợp
  • Khả năng tối ưu hoá các xử lý phong phú

Nhược điểm :

  • Hạn chế trong biểu diễn ngữ nghĩa
  • Cấu trúc dữ liệu không linh hoạt

Mô hình dữ liệu hướng đối tượng [Object Oriented model]

Là mô hình dữ liệu trong đó các thuộc tính dữ liệu và các phương thức thao tác trên các thuộc tính đó đều được đóng gói trong các cấu trúc gọi là đối tượng [object]. Tập dữ liệu được tổ chức theo cấu trúc của mô hình dữ liệu hướng đối tượng gọi là CSDL hướng đối tượng.

Ưu điểm :

  • Dễ dàng biểu diễn cái mà con người nhận thức từ thế giới thực.
  • Biểu diễn ngữ nghĩa phong phú của các thực thể và quan hệ giữa các thực thể.

Nhược điểm :

  • Không dễ dàng ánh xạ vào những cấu trúc lưu trữ trên máy tính

Ưu điểm của cơ sở dữ liệu

  • Giảm sự trùng lặp thông tin xuống mức tối thiểu nhất. Do đó đảm bảo thông tin có tính nhất quán và toàn vẹn dữ liệu.
  • Đảm bảo dữ liệu có thể được truy xuất theo nhiều cách khác nhau.
  • Nhiều người có thể sử dụng chung một cơ sở dữ liệu.

Nhược điểm của cơ sở dữ liệu

  • Tính chủ quyền của dữ liệu
  • Tính bảo mật và quyền khai thác thông tin của người sử dụng
  • Tranh chấp dữ liệu
  • Cần đảm bảo an toàn dữ liệu khi có sự cố

1 - Khái niệm dữ liệu và cơ sở dữ liệu:

Dữ liệu là các thông tin liên quan đến đối tượng [ví dụ như người, vật, sự việc,...] được lưu trữ trên máy tính. Dữ liệu được mô tả dưới nhiều dạng khác nhau [như ký tự, ký hiệu, hình ảnh, , âm thanh...]

Dữ liệu về đối tượng có thể khác nhau tùy thuộc vào mục địch quản lý. Ví dụ: cùng là dữ liệu về đối tượng sinh viên nhưng với mục đích quản lý khác nhau thì sẽ khác nhau, cụ thể như sau:

  • Với mục đích quản lý điểm, dữ liệu về đối tượng sinh viên sẽ bao gồm: Tên, Mã sinh viên, Điểm môn 1, Điểm môn 2, Điểm môn 3
  • Với mục đích quản lý thông tin cá nhân, dữ liệu về đối tượng sinh viên sẽ bao gồm: Tên, Địa chỉ, Ngày Sinh, Quê Quán, Lớp

Cơ sở dữ liệu là tâp hợp dữ liệu được tổ chức một cách có cấu trúc liên quan với nhau và được lưu trữ trong máy tính. Cơ sở dữ liệu được thiết kế, xây dựng cho phép người dùng lưu trữ dữ liệu, truy xuất thông tin hoặc cập nhật dữ liệu

Lợi ích của việc quản lý dữ liệu bằng cơ sở dữ liệu:

  • Giúp dữ liệu được lưu trữ một cách hiệu quả và có tổ chức
  • Tránh dư thừa, trùng lặp dữ liệu
  • Đảm bảo sự nhất quán trong CSDL
  • Các dữ liệu được lưu trữ có thể được chia sẻ
  • Duy trì tính toàn vẹn dữ liệu
  • Đảm bảo dữ liệu được bảo mật

Ví dụ về dữ liệu và cơ sở dữ liệu:

2 - Các mô hình cơ sở dữ liệu:

**a - Mô hình dữ liệu file phẳng [Flat file]: **

Dùng cho các CSDL đơn giản. CSDL dạng file phẳng thường là file kiểu văn bản chứa dữ liệu dạng bảng

Ví dụ:

b - Mô hình dữ liệu mạng [Network model]:

Các file trong mô hình dữ liệu mạng được gọi là các bản ghi. Tập hợp các bản ghi cùng kiểu tạo thành một kiểu thực thể dữ liệu.

Các kiểu thực thể kết nối với nhau thông qua mối quan hệ cha-con. Mô hình này được biểu diễn bởi một đồ thị có hướng và các mũi tên chỉ từ kiểu thực thể cha sang kiểu thực thể con. Ví dụ như sau:

Ưu điểm của mô hình này là có thể biểu diễn được các mối quan hệ phức tạp

Nhược điểm là truy xuất chậm và không thích hợp với các CSDL có quy mô lớn

c - Mô hình dữ liệu phân cấp [Hierarchical model]:

Tổ chức theo hình cây, mỗi nút biểu diễn một thực thể dữ liệu. Mỗi nút cha có thể có một hoặc nhiều nút con nhưng mỗi nút con chỉ có một nút cha. Do đó mô hình dữ liệu phân cấp có thể có các kiểu quan hệ: 1-1, 1-N. Nhược điểm của mô hình này là một nút con không thể có quá một nút cha nên không biểu diễn được các quan hệ phức tạp

d - Mô hình dữ liệu quan hệ [Relational model]:

Trong mô hình dữ liệu quan hệ không có các liên kết vật lý. Dữ liệu được biểu diễn dưới dạng bảng với các hàng và các cột. Dữ liệu trong hai bảng liên kết với nhau thông qua các cột chung và có các toán tử để thao tác trên các hàng của bảng

Ví dụ:

e - Mô hình dữ liệu hướng đối tượng [Object-Oriented model]

Mô hình này ra đời vào khoảng đầu những năm 90, dựa trên cách tiếp cận của phương pháp lập trình hướng đối tượng

Cơ sở dữ liệu bao gồm các đối tượng:

  • Mỗi đối tượng bao gồm các thuộc tính, phương thức của đối tượng
  • Các đối tượng trao đổi với nhau thông qua các phương thức
  • Một dối tượng có thể được sinh ra từ việc kế thừa từ đối tượng khác

Ví dụ:

3 - Hệ quản trị cơ sở dữ liệu là gì:

Hiện nay, một lượng vô cùng lớn các thông tin hữu ích với chúng ta đang tồn tại ở dạng văn bản. Việc của chúng ta là phải biết cách quản lý và sử dụng chúng sao cho thật hiệu quả. Để quản lý một lượng dữ liệu lớn phức tạp, người sử dụng phải có những công cụ hỗ trợ tính năng đơn giản trong thao tác nhưng lại hiệu quả trong trích lọc thông tin.Từ thực tế đó, hệ quản trị cơ sở dữ liệu ra đời.

Hệ quản trị cơ sở dữ liệu [Database Management System - DBMS]: Là một hệ thống phần mềm cho phép tạo lập cơ sở dữ liệu và cung cấp cơ chế lưu trữ, truy cập dựa trên các mô hình CSDL

Trên thị trường phần mềm hiện nay ở Việt Nam xuất hiện khá nhiều phần mềm hệ quản trị cơ sở dữ liệu như: Microsoft Access, Foxpro, SQL Server, Oracle...Trong đó:

  • SQL Server, Microsoft Access, Oracle là các hệ quản trị CSDL điển hình cho mô hình quan hệ
  • IMS của IBM là hệ quản trị CSDL điển hình cho mô hình dữ liệu phân cấp
  • IDMS là hệ quản trị CSDL điển hình cho mô hình dữ liệu mạng

Những lợi ích mà DBMS mang lại:

  • Quản trị các CSDL
  • Cơ chế an toàn, bảo mật cao
  • Hỗ trợ các ngôn ngữ giao tiếp. Ví dụ như ngôn ngữ truy vấn dữ liệu có cấu trúc - SQL, ngôn ngữ thao tác dữ liệu - DML, ngôn ngữ mô tả, định nghĩa dữ liệu - DDL

4 - Cấu trúc của một DBMS

Các thành phần của một DBMS gồm:

  • Dữ liệu, Siêu dữ liệu: Đáy kiến trúc là thiết bị nhớ ngoài lưu trữ dữ liệu và siêu dữ liệu. Trong phần này không chỉ chứa dữ liệu được lưu trữ trong CSDL mà còn chứa cả các siêu dữ liệu, tức là thông tin cấu trúc của CSDL. Ví dụ như tên của các quan hệ, tên các thuộc tính của quan hệ và các kiểu dữ liệu của các thuộc tính này.
  • Bộ quản lý lưu trữ: Nhiệm vụ của bộ quản lý lưu trữ là lấy ra các thông tin được yêu cầu từ những thiết bị lưu trữ dữ liệu và thay đổi những thông tin này khi được yêu cầu bởi các mức trên nó của hệ thống.
  • Bộ xử lý câu hỏi: Bộ xử lý câu hỏi không chỉ điều khiển các câu hỏi mà còn điều khiển cả các yêu cầu thay đổi dữ liệu hay siêu dữ liệu. Nhiệm vụ của nó là tìm ra cách tốt nhất để thực hiện một thao tác được yêu cầu và phát ra lệnh đối với bộ quản lý lưu trữ và thực thi thao tác đó.
  • Bộ quản lý giao dịch: Bộ quản lý giao dịch có trách nhiệm đảm bảo tính toàn vẹn của hệ thống. Nó phải đảm bảo rằng các thao tác thực hiện thông suốt đồng thời không cản trở các thao tác khác và đảm bảo hệ thống không bị mất dữ liệu thậm chí cả khi lỗi hệ thống xảy ra.

Các kiểu thao tác với DBMS gồm:

  • Các truy vấn: Đây là thao tác hỏi đáp về dữ liệu được lưu trữ trong CSDL và được thực hiện thông qua giao diện truy vấn chung hoặc thông qua giao diện của các chương trình ứng dụng
  • Cập nhật dữ liệu: Đây là các thao tác, thêm, sửa, xóa dữ liệu trong CSDL. Giống như các truy vấn, chúng có thể được thực hiện thông qua giao diện chung hoặc thông qua giao diện của các chương trình ứng dụng
  • Thay đổi sơ đồ: Các lệnh này thường được thực hiện bởi những người sử dụng được cấp phép, thường là những người quản trị CSDL mới được phép thay đổi sơ đồ của CSDL hoặc tạo lập các CSDL mới.

Trên đây là một số kiến thức tổng quan về cơ sở dữ liệu và hệ quản trị cơ sở dữ liệu được tham khảo từ các nguồn sau: //voer.edu.vn/m/tong-quan-ve-cac-he-thong-co-so-du-lieu/583a66bf //fit.lqdtu.edu.vn/files/DanhSach/HQTCSDL08.pdf

Video liên quan

Chủ Đề