NGUYỄN KIM ANH
-------
NGUYÊN LÝ
CỦA CÁC HỆ CƠ SỞ DỮ LIỆU
NXB ĐẠI HỌC QUỐC GIA HÀ NỘI -2009
M ỤC LỤC
L Ờ I G IỚ I T H IỆ U
3
CHƯƠNG 1. ĐẠI CƯƠNG VÈ CÁC HÊ c ơ s ỡ DỬ LIỆU
5
I . I . Các hệ th o n g xừ lý tệp iruyển Ihồng
5
1.2. Các hẻ c ơ sơ d ừ liệu
9
1.2.1. Các khái niệm cơ hàn
9
1 2.2. c á c khá nông cùa m ật hệ quan ỉn cơ s ơ dũ' liệu
ìì
1.2.3. Kiến trúc c ủa một hệ quàrì tri cơ sở dừ liệu
18
1.2^4. N gười quán trị c ơ s ờ d ữ liệu
20
1.2 5. N hừng người s ử dụng cơ sớ d ừ liệu
21
» 3. S j phán loại các h ệ CC' sơ d ữ Uệii
22
1 .3 .1. CYỉc hệ cơ s ơ d ừ liệu rạp iru/7g
22
ì. 5.2. C á c hệ c ơ s ớ d ừ liệu phân lớn
25
1.4
Kci luận
C H Ư Ơ N G 2. C Á C M Ô H ÌN H D Ữ L IỆ U
2.1. M ô hìn h th ự c thề liên kếl (m ò hinh ER )
2. /. /
C à c khỏi niệm c ơ s ở
28
30
30
31
2.1 2 S ơ đ ồ thực thê hèn kết (sơ đồ ER)
33
2.1.3. Tính nâng cù a cá c liên kếi
34
2.2. M ô hìn h dừ h ệu q u an hệ
39
2 .2 /. C à c khái niệm c ơ hàn
39
2.2.2. Biến đỏi cá c s ơ đ ồ ER son^ mô hình quan hệ
40
2 3. M ò hin h d ữ liệu m ang
44
2.3. ì. C á c khái niệm c ơ hàn
^4
2.3.2. Biến d ồ i c á c s ơ d ồ ER sơng mô hinh m ạng
45
2 4. M ô hìrứi dừ liệu p h ân cắp
48
2.4. L Thuật toán hiến đồì mô hình manỹ, đơn Ịiián
48
2 4 .2 S ụ lặ p lạ i c á c kiêu bán ghỉ
49
2.4.3. C ác kiểu hàn g h i à o
2.5. M ô hin h d ữ liệu hưómg đối iuợng
2 .5 . 1 C á c k h á ỉ m ệm c ơ bán
2 .5 .2 B iể n đ ổ i c ó c s ơ đ ổ ER sơng m ô hinh d ữ liệu h ư ớn g đ o i (ư ợng
2.6, Đ ánh g iá v à kếl iuân
49
52
52
56
57
C H Ư Ơ N G 3. N G Ô N N G Ữ Đ ỊN H N C H ỈA VÀ T H A O T Á C DỮ L IỆ U
Đ Ó I V Ớ I M Ó H ÌN H Q U A N H Ệ
59
3 .1. Đ ai số q u an hệ
60
3 .2. Phép lín h vỊ từ biến bộ
67
3.3. Phép lín h vị lừ biến m iền
71
3.4. N hàn xél ch u n g về kha năng cua các ngôn ngữ thao tác
74
3.5. ISBL: M ột ngôn ngữ đại số quan hê 'ih u ản tu ý '
76
3 .5 .1. Cú p h á p củo các ph ép (oán đại số
76
3.5.2. C ác Ví' dụ vể bìều diễn truy vần hărìg ISDL
7S
3 . 6 . Q U EL; m ột ngôn ngữ tính toán vỊ từ biến bộ
80
3.6.1. Chi thị truv von
so
i. 6-2. C hi thị cập nhật
H!
3. ố. 3. G án ke! qua tim kiếm vào mô! quan hệ
H2
3 6 4. C á c vi dụ vể truy vầr) hang ngôn tĩ^ừ ĩinh ĩoớn vị lừ biền họ Ọ u el ^3
3 6.5^ Tỉnh đắv đủ cùa Quel
H4
3.6.6. C'àc ph ép loan ỉập hợp
H5
3.7. Q B E (Ọ uerv - By “ Exam ple): mòingỏn ngừ lính loán yị lừ biến iTiicn H6
i . 7. /, Truv vắn dừ hệĩi irong QBE
H7
3.7.2. C á c ph ép toán lập hợp
92
3 .7.3. Các thao lác ỉhơv dôi c ơ s ơ dữ liệu
93
3.7.4 Tỉnh đấy đủ cùa QBE
95
3.7.5. Dĩnh nghĩa d ừ liệu trong Q B ĩí
95
3 .8. SQ L (S ư u ctu red Quer>' Language)
98
3.H.Ì. C ác lệnh tru v vẩn c ơ s ơ dừ liêu
Ị 00
3.H.2.CỎC h à m ih ir v ìệ n
109
3.8.3 C á c lệnh cạp nhặt d ừ liệu
IỈO
5. s. 4. C á c lệnh định nghía * m ột hộ thống th eo y êu cau sỗ
dư ợ c th iếl kế d ê đ á p ứ n g các v cu cầu cu a niộl phòng đạc b iệt hay m ộl nhóm
ngư ời s ử dụ n g cụ thé. D o vạy. không có m ỏi kế hoạch tô n g thê ha>' m ột m ỏ hinh
hư ớng den sự tăn g Irư ơ n g các ứng đụng m ới trong lư ơng lai.
M ỗi ứ n g d ụ n g tin học m ới đ ư ợ c IhiỂt k c m ọt cảc h điển h in h với m ộl lập
các tệ p dữ liộu riên g c u a nó. N hièu dũ’ liộu trong các lẹp m ới có thc đ ã x u ất hiện
trong c á c tẽp đ a n g tồn lại sẽ phai đ ư ơ c cấu trúc lại. m à đến lư ợl n ỏ . các chư ơ ng
trinh đ an g lổn lại s ư d ụ n g cùng các tệp nà> cũng phai đ ư ợ c sư a lại h ay viết lai
hoàn loàn, V ới lý d o này . th iếl kc các lệp mỚ! với m ỗi ứng d ụ n g đ ư ơ c y êu cầu
thư ờ ng là đơ n g ian hơn v à cũng ÍI rui ro hơn.
T rư ớ c tiên, ch ú n g ta hã>' xcm xót ví dụ vè m ộ t phần cu a h ệ thong N gân
hàng tiél kiộm (Ọ u ỷ tiết kiẽm ) lưu g iữ thỏng tin \'C khách h àn g v à c á c lài khoan
tiết kiộm c ú a k h ách hảng. MỘI cách dò lưu (rữ th ô n g tin này trẽn m áy tính là lưu
trữ nó trong c á c lệ p h ê thống bển vírng. Đ c cho p h ép n g ư ờ i s ư dụng th ao lác
những thôiìg lin này , h ệ thong cỏ m ộl sồ c á c ch ư o iig trinh ứ n g dung th ao tác các
tẹ p đó, ch ăn g h ạn như:
• C h ư ơ n g trinh th êm m ộl lài khoan mới;
• C hư ơng ư in h ghì n ợ (g h i có ) m ột lài khoan:
• C hư ơng ưinli tinh s ẻ d u cu a m ội lải khoan.
C ác ch ư ơ n g trinh ứng du n g n ày dược viél bơ i c á c nhà lập Irinh hô íhống dc
đáp ứ ng các y ê u cẩu tin học h o ả củ a N gán h àn g tiét kiộm.
C ác ch ư ơ n g trìn h ứ n g dụng m ới có Ihê bố sung thêm v ào h ệ thong khi các
nhu cầu m ới náy sinh.
Hộ ihồiìg x ử ]ý tệ p diẻn h in h xìra m ỏ ta d ư ơ c hồ irợ bơi m ộl hẹ đ iểu hành
n ào đó. C á c b ản ghi khá ồn dinh v à tồn tại lâu dài đ ư ợ c iưu Irỏ Irong c á c lộp
khảc nhau v à c á c ch ư ơ n g trìn h ứ ng dim g k hác nhau đ ư ơ c viổt dê tri ch ra c á c ban
ghi từ các tệp thich h ợ p hay b ồ su n g ihêm các b an ghi m ới v ào c á c têp đó. N hư
vạ>, trư ớ c khi x u ất hiộn c á c phấn m èm hệ quan trị c ơ sơ d ữ liêu, trong quá khứ
các hệ thống trẽ n c ơ sơ ỉẹp đã đ ư ợ c tạ o lập đé xử lý m ột sồ lưcaig lớ n các d ữ liệu
cua các lô chứ c niỏl c ác h hiệu qua. T rong c á c hệ thong nliư v ạy , việc x ư lý dữ
lỉệu đ ư ợ c hoàn thành boi \ iệc lạo c á c lệp Irẽn các đ ĩa từ h ay các b ă n g từ.
T u y n.hiẽn, khi qui m ô kinh doanh cu a các tồ chứ c v à nhu cẩu x ư Iv Ihao
tác dữ liệii v é i các m ục đích khác nhau theo c á c qui cảnh khác nhau tăn g lỄn,
m ột số các vẩn đe ng h iêm trọ n g có thể này sinh.
C á c h ệ thống ư ê n c ơ sở tệ p đ ư ợ c p h át tn e n với c á c ứiìg d ụ n g đ ặ c b iẽ t, do
vậy việc lưu trừ th ô n g tin cu a các tô chứ c trong các hệ th ố n g lêp c ó m ọ t số bấl
tợỉ chính sau:
• D ư th ừ a dữ ỉiệu v à linh k h ỏ n g n h ất quán dữ liêu: D o các tệ p v à c á c chưcm g
trinh ứ n g d ụ n g đ ư ợ c tạ o lập b ờ i các n h à lập ừ in h k hác n h au ừ o n g m ột
k h o án g thời g ian dài, các íệp k h ác n h au có thể c ó các qui các h k h ác nhau
v à các ch ư ơ n g trinh cỏ thé đ ư ợ c v iết b ẳn g m ột số ngôn n g ữ lập trìn h khác
nhau. H ơn n ữ a , vi c á c tệp d ư ợ c lạo lập đối với m ỗi m ộ i ch ư ơ n g trin h ứng
d ụ n g riê n g , d o vậy cù n g m ọt tạ p các d ữ liêu cù a tồ ch ứ c có thê đ ư ợ c lưu
trữ lạỉ trong m ồi ch ư ơ n g trinh ử ng dụng, có nghĩa là m ột sổ th ô n g Ún có
ihé lă p lại trên m ội số tệp k h ác nhau và c á c lài nguyên p h ần cứ n g n h ư các
đ ĩa từ có thể bị lãn g phí. V í d ụ , địa chi v à số điên thoại củ a c ú a m ọ t khách
hàng dặc b iệ t c ó ihể x u ấ t hiên trong m ọt tệp ch ứ a c á c bàn ghi tải k h o a n tiểt
kiêm v à tro n g m ọt tệ p ch ứ a các b ản ghi số dư tà i khoản. S ự d ư th ừ a nàv
d ẫn đến g iả tru y n h ập v à g iả lưu trữ cao hơn. T h êm v ào d ó , v i c á c d ữ licu
đ ư ợ c lưu trữ tro n g các têp có the đ ư ợ c fftav đoi m ọt c ác h d ộ c lạp b ỏ i các
chưcm g ư in h ứ n g d ụ n g sử dụng chúng, nôi dung c ủ a cù n g c á c k h o an m ục
d ữ liệu ư o n g ch ư ơ n g trinh ứ n g dụiig này có thể không trù n g v ới c ù n g các
k h o ản m ục d ữ liệu đó trong m ộ t ch ư ơ n g trình ứng dụng khác. Đ iể u này
d ẫn đen tín h k h ô n g n h ai quán dữ liệu, có nghĩa là các b ản sao k h á c nhau
cù a cùng m ộl k h o ản m ục dữ liệu k h ô n g giổng n h au .V í d ụ , m ộ t đ ịa chi
k h ách h àn g bi th ay đồi có thể d ư ợ c phán ánh trong bản ghi tài k h o ản tiết
kiệm n h ư n g k h ô n g d ư ơ c p h án ánh trong bản ghi số dư tài k h o ản đ ố i với
khách h án g dó
K h ó k h ăn iro n g tru y n h ập d ữ liệu: G iả s ư rằ n g m ọ t ừ o n g c á c n h â n v iên cu a
N g â n h à n g c ầ n tim đ an h sách lê n c á c k h ách h àn g sống tro n g m ộ t th à n h phố
n à o đó. N h â n v iên n ày hòi p h ò n g x ừ lý d ữ liệu đ ê đ ư a r a m ọ t d an h sách
n h ư vậy, V i y ê u c ầ u n ày k h ô n g đ ư ợ c d ự tín h tru ớ c , h ệ th o n g g ố c d ư ợ c thiểt
k ế k h ô n g c ó sẵ n m ộ t ch ư ơ n g trin h ứ n g d ụ n g để đ áp ứ n g y êu c ầ u n ày .T u y
n h iê n , c ỏ m ộ t c h ư ơ n g trinh ứ n g d ụ n g đ ư a ra d an h sá c h lấ t c á c á c khách
hàng. B ấ y g iờ , n h ân v iên N g â n h àn g n ày đ ứ n g trư ớ c h ai lự a chọn: H o ặc sứ
d ụ n g d a n h sá c h tấ t c ả c á c k h ách h àn g v à ư íc h ra n h ữ n g th ô n g tin c ẩ n Ihiểi
b a n g ta y h o ặ c y ê u c ấ u p h ò n g x ử lý d ữ liệu đ ề nghị m ộ t n h à lậ p ừ in h hệ
ửiong v iết c h ư ơ n g trìn h ứ n g d ụ n g m ới đ áp ứ n g y êu c ầ u m ới n ày . C á hai
lự a c h ọ n h iể n n h iê n đểu k h ô n g đ ư ợ c hải lòng. G ia s ử ran g , m ọ t ch ư ơ n g
trin h n h u v ạy đ u ợ c v iể l, v à sau v ài n g ày , cũ n g n h ân v iẽ n d ó c ầ n m ộ t danh
sá c h k h á c h h à n g khác. C u n g n h ư vậy , m ột c h ư ơ n g trìn h đ ư a ra d a n h sách
đó k h ô n g tồ n tạ i và n h ân v iên này lại đ ứ n g trư ớ c hai lự a ch ọ n v à k h ô n g có
lự a ch ọ n n à o đ ư ợ c h ài lòng. Đ iể u ch ú n g lô i m u ố n chi ra ờ đ ây là c á c m ôi
ừ ư ờ n g x ừ lý tệ p k h ô n g ch o p h ép c á c d ữ liệu c ầ n th iểt đ ư ợ c lim k iể m trong
m ộ t p h ư ơ n g p h á p h iệ u q u ả v à tiện lợi. D o vậy , c á c hệ th ố n g tim k iém dữ
liệu th ic h h ợ p hcni c a n p h ài đ ư ợ c p h át tríế n v à p h ài đ á p ứ n g đ u ọ c c á c ú n g
d ụ n g k h ác ỉứiau c u a hệ thống.
C ô lậ p v à h ạ n c h ể ch ia sẻ d ữ liệu; V ớ i các h tiếp c ả n tru y ền th ổ n g , m ỗi ứ ng
d ụ n g c ỏ c á c tệ p d ữ liệu riên g c ú a nó v à rihững n g ư ờ i s ư d ụ n g ít c ó c ơ hội
c h ia sé d ữ liêu n g o ài c á c ứ n g d ụ n g riê n g c ủ a họ. M ộ t h ậu q u ả c ủ a v iệ c ch ia
sè d ữ liệu b i h ạ n c h ế là c ù n g c á c d ữ liệu p h ải lu u irữ iro n g n h iề u tệ p ứ ng
với c á c ứ n g d ụ n g k h ác n h au do k h i th iểt kế p h ái triê n c á c ứ n g d ụ n g m ới,
n g ư ờ i th íc t k é th ư ờ n g k h ó k h ai th á c c á c d ữ liệu c h ứ a tro n g c á c tệ p đang
lổ n lại tro n g k h i c á c tệ p m ới đ ư ợ c th iế t k é lặ p lạ i n h iều d ữ liệu đ a n g tồn
tại. H ơ n n ữ a , c á c d ữ liệu đ ư ợ c lưu trữ tro n g c á c têp k h ác a h a u v à các tệp
c ó thê có c á c q u i c á c h k h ảc n h au , đ iều n ày dẫn đền k h ó k h ăn khi v iểt các
c h ư ơ n g trin h ứ n g đ ụ n g m ới d e tim k iếm c á c d ữ liẹu th ích h ợ p trê n nhiều
tệp.
C á c v ấn đ ể v ề to à n vẹn: C á c g iá trị d ữ liệu đ ư ợ c lư u trữ tro n g c ơ s ở d ữ liệu
p h ài th o ả m ã n c á c k iể u rà n g b u ộ c to àn vẹn n h ấ t định. C á c n h à p h á t triến
làm h iệu lự c c á c rà n g b u ộ c n ày tro n g h ệ th ố n g b ằ n g c á c h ih ẽm c á c đoạn
m ă tư ơ n g ứ n g v à o c á c ch ư ơ n g ừ ìn h ứ n g đụng. T u y n h iê n , khi c á c fàn g
b u ộ c m ới đ ư ợ c b ổ su n g th ê m đối với c ơ s ớ d ữ liệu, sẽ rấ t k h ó th a y đ ổ i các
ch ư ơ n g trin h đ ế làm h iệu lự c các rà n g b u ộ c m ớ i này . v ấ n d ề n ày p h ứ c tạp
hơn khi c á c rà n g b u ộ c đó lôi k éo m ộ t số k h o ản m ụ c d ữ liệu từ c á c tệp k hác
nhau
• C á c vấn đề v ể dô tin cậy: M ộ t h ệ th ố n g m áy tinh cũ n g n h ư m ộ l Ihiél bị
diộn tư hay cơ học nào đỏ c ỏ Ihê bi lỗi. R o n g n h icu ứ n g d ụ ag . vẩn d è m ấu
chốt lá khi m òl lổi x u ấ l hicn v à d ư ợ c d ố lim p h á i h iệ n , d ừ liệu phai d ư ợ c
phục hổi dén trạn g ihái loàn \c n lồn tại trư ớ c khi xa> ra iỗi. V i dụ. xél
ch ư ơ n g trinh ú n g d ụ n g c h u \ ên 50 đỏ la từ tài k h o an A đ ển là i khoan B
N ếu hệ th ố n g xay ra lỗi tro n g khi th ự c h iên ch ư ơ n g trin h , c ó th ê rẳn g , 50
đô la đ ã chuycn di từ lài k h o àn A n h u n g c h ư a đ ư ợ c g h i c ó v ào tà i k h o án B,
kel q u a là c ơ sờ d ữ liệu ơ (rong m ột trạn g th ái k h ô n g to à n vẹn d ữ liêu.
• C ác dị ih ư ò n g iru)' nliâp d ồ n g thời: Đ c tăn g hiòu n ăn g lô n g thô cu a hộ
th ố n g vả thờ i gian đ ảp ứ n g lứianh n h ắ t c ó th ẻ. a h iể u h ệ th ố n g cho phép
ỉihiẻu n g ư ờ i sư d ụ n g truv n h ảp d ữ liẻu doĩxg thờ i. T ro n g in ò l m ô i Irư òng
rửiư v ậ \ , sự tư ơiig tá c c ú a c á c tru y n h ập đ ồ n g th ờ i c ó th é dẫn đ ển két qua
Irong m ột irạn g th ái không to àn vẹn d ữ liộu. V i d ụ , x é t tà i k h o ản N g ân
h àn g A ch ứ a 500 dô la. M ếu h ai k h á c h h ò n g đếii Iiít q u ỹ (rú t 5 0 đô la vả
100 đỏ la lư ơ n g ứ n g ) lừ là i khoan A v ào c ù n g m ộ t th ờ i đicm . K ết qua cua
các thự c hiện đổng thời nà>' có thê d an d ến tà i k h o an nà>' ơ tro n g m ọ t trạng
thải k h ô n g đ ú n g đ án ( hay k h ô n g to àn vẹn). G ia sư rầ n g . c á c ch ư ơ n g trinh
rú t thự c hiện v ẻu câu rú l b ao gom c á c th a o lá c : d ọ c g iá trị là i k hoan, giam
g iá trị này đi m ột g iá trị b ẳn g sồ c ẩ n r ú t v à g h i kổl q u a tr a lại. N éu hai
ch ư ơ n g trìn h ch ạy dồng thờ i, c a h ai c ó ihê c ù n g đ o c g iá irị 5 0 0 đ ỏ la và ghi
lại 4 5 0 đô la , 4 0 0 đ ô la tư ơ n g ứng. Phu ih u ỏ c v à o c h ư ơ n g trin h n áo ghi giá
trị sau cù ng, tà i k h o án A có th ẽ c h ứ a h o ặc 4 5 0 đô la h o ặc 4 0 0 đ ô la chứ
k h ỏ n g p h ai g iá tr? đ ú n g cu a n ó lả 3 5 0 d ô la. Đ c c à n h g iá c v ớ i n h ữ n g útứx
huống n h ư v ậ y , h ệ Ihống phải duy trì m ộ t d ạ n g g iả m s á t n à o đó. B ời vi dữ
liêu c ó thé d ư ợ c tru y nhập b ò i n h iều c h ư ơ n g trin h ứ n g d ụ n g k h ác lứiau m à
k h ô n g đ ư ợ c d iều phồi tử trư ớ c, m ỏi d ạ n g g iả m s á t n h ư v ậy k h ó c ỏ tlìể dược
cung cầp.
• C ác vấn d ẻ v è an loàn; K lìô n g phai m ọi n g ư ờ i s ư d ụ n g c u a hộ th o n g dều có
ihê tru y n h ập lấ t c á dữ liệu tro n g hệ. V i d ụ , Irong h ệ th o n g N g â n h àng, các
nhân vicn tài vụ c ù a N g ân h à n g chi c ầ n n h ìn th ấ y m ộ i p h ần c u a c ơ sớ dữ
liệu c h ứ a th ô n g tin vể cảc n h ân v iên N g â n h àng. H ọ k h ô n g c ẩ n th iế t truy
n h ập vào th ò n g tin v è c á c tài k h o án k h ách h àng. D o c á c c h ư ơ n g trin h ứng
dụng đ ư ợ c bo sung v ào hệ th ố n g Iheo p h ư ơ n g p h á p Ih êm d ần , v iệ c b ắt tuân
thú c á c ràn g b u ộ c an loàn n h ư v ậy lá k h á khó khản.
• S ụ phụ th u ộ c d ữ liệu cù a c á c ch ư ơ n g trình ứ n g d ụ n g : D o đ ịn h n g h ĩa tệp
đ ư ợ c c h ứ a Irong c á c ch ư ơ n g ừ in h ứ n g d ụ n g , n ểu c á c n ộ i d u n g tệ p v à các
khuôn d ạn g bán ghi cần đ ư ợ c th ay đ oi, c á c c h ư ơ n g ừ in h ứ n g d ụ n g cũng
phái ih ay dối theo.
N h ữ n g k h ỏ k h ã n nà> d ầ u dén c ầ n phai phái iriôn niộl phầti m ểm d ặc biộl.
m ột h ệ q u an Irị c ơ s ơ d ữ liộu với đ ay đu c á c tiiilì năng cho phép kliac p h ụ c các
bất iợi nêu ư ề n .
1.2.
C á c h ệ c ơ s ở d u liệ u
IV oiìg th ờ i g ia n g ầ n đ â \ n g àn h tin liọc đ à c ó iiJiiêu th àn h lựu hct sứ c lo lớii.
T ro n g sổ n h ữ n g th à n h lựu đ ó p h ai k ẽ tớ i v iệ c sir dụng ngà> càn g rộ n g rãi và có
hiệu q u a c ả c h ệ c ơ s ớ đ ữ !iộu. T n rớ c liên ch ú ỉìg (a hãy xem x ét các khái m ệm cơ
ban v è hê c ơ s ơ d ữ liêu
I .2 .I . C á c k h á i n iệ m c ơ b « ĩn
( V/ ,vơ íỉữ liệu là g i ?
M ội tô c h ứ c ( n ì n g h iệ p , n g ân h àn g , bênlì ^'iện. cơ q u an ...) c ỏ Iiliíều ứng
dụiig tin lìỌC k h á c n h a u n h ư n g tấ t c a c á c ứ n g dụng đó cù n g đ ư ợ c liến liàiứi irên
inộl nguồn d ữ liệu clìLuìg ihi k iìông g ì tố t liơĩi là triên klìai các ứ n g d ụ n g đỏ trôn
m ôt c ơ s ơ d ữ liộu h ợ p I\hất c h o p h é p q u an lý tậ p trung tấ t ca d ữ liộu xi nghiệp.
H ìn h 1.1. C ơ s ỡ d ữ iiệ u h ợ |) n h ấ t
T rên hinli 1.1, c lìủ n g ta ìứiin th ấ y thànlì plìần c ơ sơ dữ liệu hợ p nhấl là m ội
b ộ sư u tậ p c á c d ừ liệu c h ứ a trê n c á c p h ư ơ n g tiện lư u trữ n h ư đĩa từ h ay băng
từ... N h ữ n g n g ư ờ i s ư d ụ n g trự c tu y ể n ha>' c á c ch u ơ iìg tritìj\ ứ n g điuig có thô sư
dụn g ch ung h ay clìia se c ơ sơ d ữ liệu 11 à>*.
C ác ch ư ơ n g trình ứ n g dụng theo lô cỏ Ihc th ự c h iện c á c ih a o tá c trẽn các
d ũ liêu d ư ợ c lấy ra lừ c ơ sở dữ liẻu nàv T ihư tim k iém , sư a đôi, b ỏ sung, loại
bo...
N h ữ n g ngư ời sư đ u n g trự c tuyển thao tá c v ớ i c ơ sớ d ữ liệu lử c á c ih iềt bị
đầu cuối ơ c ác h x a (ch ú n g la Ihư ờng gọi !à tihững n g ư ò i s ư d ụ n g c u ố i) v à họ
cOng có ihê th ự c hiện tất ca cảc ih ao tác; tim k iếm , sừ a đôi. b ố su n g , lo ạ i bo. N ói
c h u n g , tim kiếm là ih ao tác phô b iển rứiấl v à q u an tro n g n h a i
N h ư v ậy , ch ủ n g ta c ó ihể đính nghĩa : C ơ sớ d ữ liệu là m ột b ộ s ư u tậ p các
d ữ liệu tác ng h iệp đ ư ợ c iưu trữ lại và dược c á c h ê ứ n g d ụ n g c u a m ộ i \ í nghiệp
c ụ th ẽ nào đó sư dụng.
T ro n g đ ịn h nghĩa nảy , xí nghiẽp ở dâv chi b ấ t kỷ m ộ t h o ạ t đ ô n g khoa hoc.
k> th u ậỉ. km h doanh., n ào đó. D ữ !iẻu tác n g h ic p d ư ợ c sư d ụ n g đê chi dữ liéu
cua xi righiẹp. ch àn g haiì dỗ liỗu về kháclì h à n g ha> d u iiộu v è là i k h o a n trong vi
dụ đ ố i vói N g ân h àn g tiết kiẹm .. C húng tôi rnuốn n h ấn m ạnh rằ n g , c á c dữ liệu
váo, tứ c là các th ô n g Ún đi íừ thể giới bên n g o ài v á o v ả c ó th ể g â y r a n h ư n g thav
đ o i ừ o n g d ữ liệu tác ng h iệp v à c á c dừ !iộu ra , tứ c ià c á c íh ỏ n g b á o , b á o c ả o rú l
ra tù d ũ liệu lác nghiệp k iìông phải là m ôt p h ần c ú a d u liệu lá c n g h iệ p và k h ông
đ ư ợ c b ao hàm trong d ừ liệu tá c nghiệp.
H ệ quản in c ơ s ở d ữ liệu ìà g i?
T rên thị trư ờ n g p h ần m ềm hiện nay ờ V iệ t n am đ ã x u ẩ t h iẹ n k h ả rứiiều
p h an m ềm hệ q u ản trị C0 s ơ dữ liệu ỉứiư: M .A cce ss, D B 2 , In fo rm ix . S Q L Server.
S y b ase, O racle.
C húng ta có thề định nghĩa m ột h ệ q u ản t n c ơ s ơ d ữ liộu n h ư sau : H ệ quan
trị c ơ sơ dữ liệu là m ộl h ê thống phấn m èm ch o p h ép tạ o lâ p c ơ s ơ d ữ liộu và
d íểu kh iẻn m ọi tru y n h ắp đối vớ i cơ sở dữ licu dó.
H ê c ơ s ờ d ữ lĩêu lá
B ây g iò , ch ú n g ta có the dịnh n g h ía m ộ t h ệ c ơ s ò d ữ h ệ u là m ọ l h ệ th o ng
gồ m 4 th àn h phần :
• C ơ sớ d ữ liệu h ợ p nhất: C ơ sờ d ữ liệu c ủ a h ẻ c ó h ai tín h c h ấ t tố i th iểu hoá
d ư th ừ a v à đ ư ợ c c h ia sẻ.
• N h ữ n g ngư ời s ù dụng: N g ư ờ i sử dung c ù a h ệ là b ấ t k ỳ m ọ t c o n n g ư ờ i nào
có nhu cầu tru y n h âp vào cơ sờ dừ iiệu, c ỏ n g h ĩa là n g ư ờ i s ứ d ụ n g b a o gồm
tấ t c ả n h ữ n g n g ư ờ i s ư dụng cuoí> rửiững n g ư ờ i v iế t c á c c h ư ơ n g trìn h ứ n g
d ụ n g v à những n g ư ờ i đ iều khíen toàn b ộ h ệ th ố n g h a y c ò n g ọ i là ngư ời
quản trị c ơ s ở d ữ liệu.
• Phấn m ềm hỗ q u an trị cơ sơ dữ liệu
10
• P h ần cứ n g ; P h ần cứ n g cu a hộ b ao gồm các (hiét bi n h ó th ứ c ấ p d ư ợ c sừ
đ ụ n g đ ê lư u trữ c ơ s ở d ử liêu.
T ro n g c á c phấn tỉểp theo, chủng la sẽ đi sàu tìm h iểu vể h ệ q u án trị cơ sở
d ữ liệu, m ộ i p h ầ n m ềm đ ặc b iệ l VỚI đ ầy đù cảc linh n ăn g cho p h ép c à i dặl các
hô c ơ sở d ữ liệu. Đ ổ n g th ò i, chúng ta cũ n g phản lích c á c k h a n ăn g c ù a m ọl hẹ
q u an tn c ơ s ờ d ữ liêu ch o p h é p khắc phục tắ t cá các n h ư ợ c điểm c ủ a các hệ
ihồng \ ư !ý tộp tru y ền thổng. C uối cù ng, ch ú n g ta sẽ xem x é t c á c nhiêm vụ m à
ngư ời q u an t n c ơ s ơ d ừ liệu phái dam nhiẽm đẽ dièu khiên to àn bọ hẹ c ơ sở dừ
liệu.
1.2.2. C á c k h ả n ã n g c ủ a m ộ t h ệ q u ả n t r ị co* s ờ d ữ liệu
C ỏ h ai k h à n ă n g ch o p h ép phân b iệt các h ệ q u án trị c ơ sờ d ữ liệu v ái các
kiéu hệ th ố n g lạ p trin h khác.
• K h á n ă n g q u ả n lý d ữ liệu tồn tai lảu dài
• K há n ã n g tru v n h ậ p các khối lư ợ ng dữ liệu lớn m ọt cách hiệu qua
Đ ạc đ iềm th ứ n h ấ t chi ra rằn g c ỏ m ột cơ sỡ d ử liệu tổ n tại tro n g m ọt thời
g ia n dải, nội d u n g c ú a c o sờ dữ liệu này là c á c dữ liệu m à m ỏ i hẹ q u án trị cơ sờ
d ữ lìộu truy n h ậ p v à q u ả n lý. Đ ặc điểm th ứ hai phân b iệt m ộ t hệ q u àn ư ị
với
m ô t h ệ thổng x ử lý tệ p cũ n g q u án lý d ữ hệu lon tai lâ u d ài n h ư n g n ó i chung
không cung c ấ p c ả c tru v n h ập nhanh chóng đen các bọ p h ạn d ữ liệu tuỷ ý.
C ảc k h á n à n g c ù a m ô l hộ quán tri
cơ sờ dữ liộu h ầu h é l lá cần Uiièt khi
khổi lư ợ n g d ữ liệu c ầ n lư u trữ là rấl lớn, bới vi các khối lư ợ n g dữ liệu nho thì
c á c k ỹ th u ậ t tn iy n h ậ p đơ n g ià n , chẳng h an q u él tuần tự c á c d ữ liệu ià th ích họp.
K hí ch ú n g ta x em h ai đ ặ c điẻm trễ n cù a m ọt hệ q u àn trị c ơ s ờ dữ íiộu là cơ
bán, còn m ọ t số c á c k h ả n ă n g k h ác m à có thô thấy Irong hầu h ết c ả c hẹ quán trị
cơ s ở dữ liêu th u ơ n g n ìại. Đ ỏ là.
• HỒ trợ ít n h ấ t m ọ t m ô h in h dữ liệu h ay m ỏi sư trừ u tư ợ n g to án học m à qua
đó n g ư ờ i s ứ d ụ n g có th ề q u an sát d ữ liệu.
• Đ àm b ảo tín h độc lậ p d ữ liêu h ay sự b ấ t b iển c ủ a c á c ch ư ơ n g trình ứ ng
đụng đối vớ i c á c th a y đ ổ i về cấu trú c tro n g m ỏ hinh d ữ liệu.
• H ồ trợ c á c n g ô n n g ữ c ấ p cao nhất định cho p h ép ngư ời s ù dụng đ ịn h nghĩa
câu trú c c u a d ữ liệu, tru y n h ập dữ liệu v à thao lá c d ừ liệu.
• Q uán trị g ia o d ịc h , có n g h ĩa lả khá năng cung c ấ p c á c tru y n h ạp d o n g thời,
đủng đ ắn đ ố i v ớ i c ơ s ở d ữ liệu từ nhiều ngư ờ i sứ d ụ n g tại cù n g m ọt thời
diểm.
11
• Đ iểu k h iên lo iy nhập, c ỏ n g h ĩa là khá ĩiăng h an ch ể iru y nhập dổn c á c dữ
liệu b ơ i n h ữ n g n cư ờ i s ư dụng không d ư ơ c c ấ p phép v à kha n ă n g kicni Ira
tinlì d ủ n g d ãn c ú a dữ tiộu
• Phuc lìồi dữ liệu, c ó n g h ĩa lả kha nàng phục hoi. k h ô n g làm m ắl m ảl dữ
liệu dối VỚI c á c lồi cu a h ệ ihong.
ỉ . 2-2.1.
S ự ỉ r ừ u t ư ợ n g h o ớ d ữ Uệu
Đ ế cho hộ thống c ó ihc sư d ụ n g dư ợc, nó phai tra cứ u hay tim k icm d ữ liệu
m ột cách hiệu qu a. Đ iều nà> d ẫn đến việc ílìiết kố cảc cấu trú c dử lièu phứ c lap
dc biêu diễn d ữ liệu tro n g c ơ s ơ dữ liêu này. D o nhiều ngư ờ i s ư d ụ n g iru y nhập
vào các hệ c ơ s ò d ữ liệu k h ỏ n g đ ư ợ c đào tạo về m áy tính, người p h á t triên phai
che dấu liỉili p h ứ c lạ p dổi vớ i rứìũiìg người sủ dung thòng q u a m ọi s o m á c trừ u
iv ơ n g dê đ ơn g ia n h o ả c á c tư ơ iìg lá c cu a n g ư ò i sừ dụng đoi vói hẹ ihóng.
• M ứ c v ật lý. M ứ c thấp n h ất c u a sự trừ u tư ơ ng m ô tá d ữ liộu đ ư ơ c lưu trữ
m ội các h ih ự c s ự n h ư th ế nào. T ại m ức v ật lý, c á c c ả u trú c d ữ liệu m ức
thấp p h ứ c tạp d ư ợ c m ó iá c h i tiết.
• M ứ c logic. M ứ c c a o h ơn liếp theo c u a sư trừ u tư ợ n g m ô ta n h ữ h g d ừ liệu
n ào d ư ợ c lư u Irữ trong c ơ s ở đ ữ liệu và các mối quan hộ n ào tồ n lạ i giữa
các d õ liệu này, N h ư vậy , lo àn bộ cơ sơ d ừ liệu đ ư ợ c m ô tả tro n g th u ậ t ngừ
c u a m ột sổ nhó c á c c ấ u trú c khá dơn giản. M ặc dù sự cài đ ặl c á c c ấ u trú c
d ơ n g iàn tại m ứ c lo g ic n à y c ó Ihc kéo theo các cấu trú c m ú c v ậ t lý phức
tạ p , n g ư ờ i s ử dụng ờ m ử c lo g ic không c ầ n b iếl vể sự phứ c tạ p này. M ức
logic củ a sự trừ u tư ợ n g đ ư ợ c x á c định bơi n g ư ò ỉ q u an trị c ơ sơ d ư liệu, cụ
thề phái q u y ếl dịnh o h ữ ng th ô n g tm gì đ ư ợ c lưu Irử Irong cơ sơ d ữ liệu.
• M ứ c k h u n g nhin. M ứ c c a o n h at cu a sự trừ u tư ợ n g m ỏ tả chi m ộ l phần cua
to àn b ộ c ơ sở dữ liệu. M ặ c dù s ù đụng các cấu trú c dơ n g ia n h ơ n m ức
logic, m ộ t số p h ứ c tạ p vẫjì cò n tồn lại do kích th ư ớ c lớ n củ a c ơ s ớ d ữ liộu.
N h iểu n g u ờ i s ừ d ụ n g c ù a hệ c ơ sờ d ữ liêu k h ô n g quan lâm đến tất ca
n h ữ n g th ô n g tin này. T h ư c c h ất, những ngư ờ i s ử dụng n ày c h ì c ầ n truy
n h ập m ột p h ần cù a c ơ s ớ d ữ liêu. D o vậy sự tư ơ n g tá c cù a h ọ v ớ i hộ thống
n ày d ư ợ c đơ n g iản h o á v à m ứ c khung nhin c ú a sự trừ u tư ợ n g đ ư ợ c xác
định. H ệ th ố n g có thế cu n g c ấ p nhiều khung nhin đối với cù n g m ộ l c a sơ
d ữ liệu.
M ối q u an hê tư ơ n g ho g iữ a b a m ứ c trừ u tư ợ n g đ ư ợ c m inh h o ạ tro n g hinh
1.2.
12
n h ư sau:
M ức kluing nliìn
K hun g nhin 1
K lning nlìin n
M ức logic
M ức v p e cu sto m cr = rc c o rri
custom er^naine: striiig;
so cial_secu rit}’: string;
cu slo m er_ sừ eet: string:
custom cr_cit>'; striiìg:
end:
Đ oạn niã nảy định nghĩa Iiìột kiêu bân glìi m ới d ư ợ c gọi [ả cuslom er
(kliách hảng) v ớ i bốn trư ờng. M ỗi trư ờ n g c ó tên trư ờ iig vả kiếu d ữ liệu kết h ợp
v ới nó. M ộ t N g â n h àn g tiét kiệm có llìẻ có m ội số kiêu bãii ghi nliư v ậ\', chầug
h ạn b ao gồm c á c kiểu ban ghi sau:
- account (tài k h o an ) với các trucnìg accouiìt_nuniber vả trư ờ n g b alan ce;
- em ployee (n3iâiì v iê n ) với các tnrcm g c n p lo y e e _ n a m e vá tru ờ n g salary.
T ại m ứ c v ật lý , m ột ban ghi custom er, accouỉìỉ h ay m ộ t enip lo y ee c ó thẻ
đ ư ợ c m ỏ ta ìú\ư m ột kliéi lìliớ. C h ư ơ n g trinh dịch n g ô n n g ữ lìàv ch e d ấu các
m ức chi tiết lìày doi với n h ữ n g ngư ời lập trinh. T ư ơ iig tự . các h ệ c ơ s ơ d ữ liệu
che dấu Iilìieu chi tiếl lưii trữ m ử c lliấp nhấl dổi xởi ixltững n g ư ờ i lậ p trìnlì ú n g
dụng. N g ư ờ i quan trí c ơ sơ dữ liệu có thé biết nlìững clìi tiểt n liất đ ịn h về tổ
chứ c dữ liệu v ật lý. T ại m ứ c logic. m ỗi bán ghi n lm v ậy đ ư ợ c m ó tả b ơi m ột
địn h ng]ìĩa kiêu Iihư đ ư ợ c miiứi lìoạ tro n g đoạn m â v ừ a rồ i v à Ểĩiối quan lìệ g iữ a
các kiẽu bãn ghi n ày đ ư ợ c x ác dịnli. N h ữ n g tìgười lậ p triiìh sư đụiig m ộ t ngôn
ng ữ lập iTÌxửì làm việc tại m ó c trừu tư ợ ng nà}'. C ung tirơ n g tự vậ>^ n h ữ n g ngư ời
q u a n trị thư ờiìg làm v iệ c tại m ức triru tưỢỉìg nay.
13
C uối cù ng, lại m ức khung nhin. những người su dụng má> tín h nhiII thấ>
m ộl tập các chưcm g trinh ứ ng dụng m à ch e dấu I ih ữ n g chi liêl vê c á c kicu dữ
liêu. T ư ơ n g tự , tại m ứ c khung nhin. m ột số khung nhìn cu a c ơ sơ d ữ líộii được
x á c dinh và nlìững người sư dụng Cỡ sơ d ừ \\ộu nhìn thầ>' c á c k h u n g nhin n à> .
N goài sự ch e d ấu n h ừ n g chi tiết c u a m ức logic dối ^'ới c ơ s ơ d ữ liệu n ày . các
khung Iilììn cũng cung c ấ p niôt c ơ ch c an loàn đô ngán ch ạn n h ữ n g ngư ời sư
dụng khoi sự tru y nhập các bộ phận cu a cơ sơ dữ iicu. Vi d ụ . inôl klìácỉĩ lìàne
cua inộl N gân hàng chi ĩìhin lh á \ m ôl phần cua cơ so dữ hệu clnVa ih ỏiig Un vc
làí khoan cu a a a h la \ à anh la không llic lru> Iihảp đốn các ihòiiíị lin licn quan
dển lu oiig cu a các n h ân vicn ngân lìảng.
C á c th c h iện v à c á c SO’ dồ
C ãc cơ sơ d ữ licu thay dôi ihco thời gjan khi llìỗng Ini đ ư ợ c th cm \ ào ha>
bị xoá di T ậ p h o p các lliông tin đ ư ơ c lư u Irữ Irong cơ sơ d ư licu la i m ột thởi
điôm d ặc biộl đ ư ợ c gọi là m ọt thê hiộn cu a cơ s a d ữ liộu này. MỘI ih iếl kc lông
ihẽ c u a c ơ sơ d ữ licu đ ư ợ c gọi là sơ đổ cơ sơ dữ lỉộu. C ác sơ đ ồ il k h i bị Ih ay đôi
thậin chi hầu n h ư klìông tha> dồi
S ự tươiig tự c u a các khái tiiộm này vớ i các khái niệm v ề kiôu d ữ h ộu. bièn
vả g iá trị Irong c á c ngỏn ngỗ lạp Irinh là niỗt m inh hoa có ich ơ d ấ y Ọua> Irơ lạj
định nghĩa kiôu b an ghi custonicr, chú ý răng. Irong khai bảo k icu b ati ghi nà>\
chúng la k h ô n g kiiai b áo m ột bicn nảo. Đ é khai b áo c ả c bicn n h ư v ậ v Irong m ột
ngôn n g ữ lụ a P ascal, chúng ta viél:
v ar c u s to m e r i: custom er:
B ién cu slo m erl b ây g iờ tư ơ n g ứng với m ọt \iin g n h ớ m ôt b a ti ghi kicu
cu sto m cr M ộ( sơ dồ c ơ sơ d ừ liôu lư ơ n g ú n g với định nghĩa kicư tro n g ngòn
ngữ lập trinh. M ọt biển cu a kiêu đ ã cho có m ột g iá Irị dặc bièl lại m ỏ i th à i diêm
dâ cho N h ư v ậv . giá In cu a m ôt bién irong các ngỏn ngữ lạ p trin lì lư ơ n g ứ ng
với m ội íhc hiộn c u a sơ dồ cơ sơ dữ liệu C ác liô c ơ sơ dừ licu cỏ m ộ i số s ơ dồ
đirợc phân tách phù hợp với c á c m ứ c trừ u tư ợiig m à ch ú n g ta đâ th á o luân. T ại
m ứ c th ấp n h ắp là sơ đồ vậỉ lý, lại m ứ c tru n g g ian là sơ đồ iogic, v à lại m ứ c cao
nhất là m ộ t sơ đ ẻ con. N ó i chung, các hệ c ơ sớ dữ liệu hồ Irợ Jĩiôt s ơ dổ v ậl lý.
m ột sơ đồ ìogic và m ội số sơ dồ con.
14
T ítih d ộ c lậ p d ữ liệu
K h a n ăn g thay đôi m ộl đinh nghĩa sơ đồ trong m ộ t m ứ c m à k h ô n g anh
hư ơng đến định nghĩa sơ dồ troíìg niửc cao hon tiếp theo đ ư ợ c gọi là tinh dôc
lập d ừ liệu. C ó hai m ứ c độc lập du liệu.
1. Đ ộ c lạ p dũ liộu mức vât lý là k!ia nâng ihay đôi sợ đo ^ ậ t lý m à khòng
dẫu dến c á c ch ư ơ n g trinh ứng dung phai \ icl lại C ác ihay dôi tại m ứ c v ại iý dỏi
khi là c ầ n thiél đ ẽ lăng hiệu nàng hộ Lhống.
2. D ộc lậ p dữ liệu m ửc logic là kha năng thay đôi sơ dồ logic m ả không
dẫn đén c ả c ch ư ơ iìg trình ứiìíì dụng phai ^'icl lại C ác th ay dôi tại m ứ c lo^ic lá
cần thiết b ất kc khi nào cấu im c logic cua cơ so dừ hẻu b | sư a dôi. Vi d ụ . khi các
tài khoan Iicn tệ chứ ng khoán d ư a c thcm \ ào hệ llìống N g ân hang.
Đ ộ c lâp d ữ liệu m ứ c logic là khó dạt dirơc hơn so \ ớ i độc lập d ữ liệu m ức
vậl lý do các ch ư ơ n g trinh ứng dụỉìg phu thuỏc nhiều vảo cẩu trú c logic c u a dữ
liộu mà h ọ đang lru>' nhập.
K hải niệm dỏc láp dữ liệu là tươĩig tụ \ ớ i khái niệm các kicu dù liộu Irừu
tưcmg Irong các ngỏii n g ữ lập trình hiện đại C a hai m ứ c độc lâp d ử liộu đcu cố
gắtìg chc dấu c á c clìi liốt cài dăl dổJ \ ở i những ngư ờ i sư dụng, cho plicp những
người sư dụng lập iru n g vào các cấu irúc lông q u ái cliứ k h ô n g phai các chi uếl
cài đ ăl m ú c Lhấp.
/. 2 .2 2.
C ác nỊỊôn
c ơ s à d ừ Ììệĩi
M ột hc c ơ sơ d ữ liệu cung cẩp hai kicu ngôn ngữ k hác nhau: m ột ngôn ngữ
đ à c la sơ d ồ c ơ so d ữ liêu \ à m ôi ngôn ỉ\gũ biêu diễn các Iruy ^'an và các câp
nhại c ơ s ơ dử liệu.
• N gôn ngữ dịnlì nghĩa dữ liệu {D ala-D cnni(ion L an g u ag e - D D L )
M ột s a đ ồ c ơ sơ đữ liệu dậc la bơi m ộl tâ p các dịnh nghĩa đ ư ợ c b ícu diễn
bơi m ội ngôn n g ữ đ ặc biộl d ư ợ c gọi là ngỏn ngữ dịnh n g h ĩa d u liệu. K ct q u à cùa
việc dịch c á c lẹrửì c ủ a ngôn ngữ này là m ột tập các bang d ư ợ c lưu Irữ trong m ội
tộp đặc b iêt d ư ợ c gọi là từ dicn dử licu h a\ thư m ục dù liộu.
MỘI lừ d i ỗ n d ữ liệ u là m ô l lộp c h ú a các SICU d ữ liệ u c ó n g h ĩ a lả c á c d ữ liệ u
vế dũ liệu. T cp này đ ư ợ c tra cứ u irư ớc khi dữ liêu ih ư c sự d ư ợ c dọc h ay d ư ợ c
sư a dòi tro n g h ẻ cơ sỡ d ữ liỘLi.
C ấu trú c lư u irữ và c ả c phươtig pháp truy n h ập đ ư ợ c sư dụng b ờ i m ộ t hộ cơ
s ơ dữ liệu đư ợ c đặc lá bơi m ột tậ p các định nghĩa Irong m ột kiêu d ặc b iệ t cu a
D D L là ngôn n g ữ định nghĩa vả lưu trử dữ liộu. K ét q u a c ú a việc dịch c á c dịnh
15
ng h ĩa nàv là m ột tậ p các chì ihỊ đặc ià các chi tiểt cài dặt cua c ơ sơ d ữ liộu, các
chi tiết này th ư ờ n g đ ư ợ c ch e dẩu đối với những người sử dụng.
• N g ô n n g ữ th ao tá c dừ liệu (D ala-M an ip u latio n L an g u ag c • D M L )
C ác m ứ c irù u tu ợ n g m ả ch ú n g la đà thào luân Irong phần irư ớ c không chí
áp dụng dồi VỚI định n g h ĩa và c ấ u trúc dữ liệu m á đối với c ả th ao tá c dữ liệu.
C ác yẽu cầu th ao tác d ữ liệu b ao gổm:
T ìm kiếm th ô n g tin đ ư ợ c lưu trữ trong c ơ sơ dữ liệu.
T h êm ih ô n g tin mới vào cơ sờ dữ liêu
X o á th ô n g tin từ c ơ sớ d ữ liệu.
T h ay đối th ô n g lin đ ư ợ c lưu ư ũ irong cơ sơ dữ liộu.
T ại m ứ c v ậ l lý , chúng ta phài xác định các th u ậ t toán cho p h é p truy nhập
d ữ liêu m ột cách hiệu quá. T ại c á c m ứ c cao hơ n cũ a sự trừ u tư ợ n g h o á , chúng ta
n h ẩn m ạn h vào lín h dề sừ dụng. M ụ c đích cù a nó là cung c ấ p sự tư o n g tác cù a
con ngư ời đối v ớ i hệ th ố n g m ột cách thuận tiện,
M ội ngôn n g ừ th ao tá c dữ liệu (D M L ) ià m ộl ngôn ngữ cho p h é p những
ngư ờ i sừ dụng tn iy n h ập hay ih ao tác d ừ liệu được lổ chứ c bởi m ột m ô hình dữ
iiệu Uiích hợp. C ó hai kiéu ngôn n g ữ th ao tảc dữ liệu cơ ban.
•
C ác D M L thủ lục đòi hòi m ột người sử d ụ n g phái đ ạc là đ ử liệu nào cần
tim k iếm v ả tim kiếm những dữ liộu n ày như thể nào.
•
C ác D M L phi thủ tục đ ò i hỏi m ỏi người sừ dụng đ ặ c ta d ữ liệu nào cẩn
tim k iếm m à k h ô n g phái đặc tả tim kiếm những d ữ liệu này n h ư thế nào.
C á c D M L phi thủ tục thư ờ n g dề học và dễ sư đụng hơn so VỚI các D M L
thủ tục. T u y ĩìhiên, do m ọt n g ư ờ i sử dụng không phái đặc tá tim k iểm các dữ
liêu n h ư thế n ào , c á c ngôn ngữ nảy có thê sinh ra c á c đoạn m ã k h ô n g hiệu quá
ỉ>u với đoạn m ã đ ư ợ c sinh ra b ở i các ngôn ngữ thủ rục. C h ú n g ta c ó thể k h ẳc
phục vấn đ è n ày th ô n g q u a c ả c kỹ th u ật x ừ lý v à tối ư u h o á câu hòi k h á c nhau.
M ộl tru y v an là m ột chì th ị yêu cầu tim kiểm th ô n g tin. C ác lện h cu a m ộl
D M L k ẻo theo tim kiém thông tin đ ư ợ c gọi là ngôn ngử tru y vấn, M ạ c dù vể kỹ
thuật là k h ô n g đ ú n g dan , trong th ự c hành, các thuậl ngữ ngôn n g ữ tru v vấn và
ngôn n g ữ th ao tác d ữ iiẹu d ư ợ c xem là như nhau.
1.2.2.3.
X ừ lý câ u hỏi
C ô n g v iệ c c ù a b ộ x ử lý c â u hòi là biến đồi m ột tru y vấn h ay m ộ t th a o tác
c ơ s à d ữ liêu c ó th ế d u ợ c b iểu d iễn tạ i m ột m ứ c rất c a o (vi dụ n h ư b iể u diỗn bời
m ột D M L nào đ ó ) th án h m ột d ăy các yêu cầu đổi VỚI các d ữ liệu d ư ợ c lưu Irữ
tro T ìg
16
c ơ sờ dữ liệu. T h ư ở n g p h ẩn khó nhát c u a nhiệm vụ xư lý c â u h o ỉ là tối ư u
hóa c â u hòi, có n g h ĩ lá lự a chọn m ột ké hoạch ihự c hiện lồt n h ất h ay tự a chọn
m ọl d ã v c á c y êu c ầ u đổi vớ i hc thống lưu Irữ đô ira lời tru y v ẩn n ày nhanh nhất.
C ác tru y vẩn phứ c lạp th ư ờ n g cho phép chúng ta sẳ p x ếp lại trinh tự c á c phép
toán v à có thê c ó m ọt số lớn các kể hoạch thuc hiẻn cỏ th ế, th ư ờ n g có thố sồ kế
hoạch lá hàm sổ mũ đổi với kich thư ớc c u a câu hoỉ.
1.2.2.4.
Q uán trị g ia o dịch
T h ô n g thưcm g m ột số thao tác Irên cơ sò d ữ liệu hinh ihảnh m ột đ ơn vị
iogic côĩìg việc đ ơ n nhất. Đ iều này có nghĩa là hoặc tấ l cá các thao tá c d ó được
thự c hiện noặc k h ô n g m ột thao tàc nào được thực hiẻn. rh ê m vào đ o , sư thực
hiện c u a các th a o tác này phai đàm báo lính nhất quán cù a c ơ sờ dư liệu. C ác hộ
quàn trị c ơ s ở d ữ liệu điến hinh cho phép m ột n g ư ờ i sừ dụng nhóm m ộ t hay
nhiều th ao lác rra cứ u hay thay đổ! c ơ sờ dữ liệu ih àn h m ột g ia o dịch. M ột g iao
dịch lá m ột tâ p các th ao tá c m à đ ư ợ c x ừ lý như m ột d ơ n v ị k h ô n g ch ia c ắ t
Sự đ ảm b ao tính ch ất n ày là trảc h nhiậm cùa th ản h phần
q u ản trị g ia o
được.
dịch.
T hư ờ ng m ọt hệ cơ sờ d ữ liộu cho p h ép nhiều giao d ịch th ự c hiện đồng thời. M ột
số các c ơ s ớ d ữ liệu lớn tới m ứ c ch ú ng chi có ích khi ch ú n g d ư ợ c th ao lác đồng
thời bơi tihiểu n g ư ờ i sử dụng. K hi m ộl sổ giao d ịch th ay dồi cơ s ờ dữ liệu dồng
thời, tính n h ấl q u án dữ liệu có ihể khống còn đ ư ợ c đám b áo . th ậm chi ngay cà
khi m ồi giao d ịch c á thể d ư ợ c th ự c hiện đúng đắn, Đ ẳy là trách nhiệm củ a bộ
quàn lý diều khiển tư ơ n g tran h diểu khiến sự tư ơ ng tá c g iữ a c á c g iao dich đồng
ihời đàm b ào lính n h ất quản củ a cơ sờ d ữ liệu. K hí c á c lồi hệ th ố n g x à y ra , m ột
g iao dịch c h u a hoàn (hành không d ư ợ c ánh hưởng dến trạn g ih ải cú a c ơ sớ dữ
liệu. D o vậy, c ơ sờ d ữ iiệu nảy phải đ ư ợ c phuc hoi đ én trạn g thái trư ớ c khi giao
dịch nảy b ắl dầu th ự c hiện. T rá c h nhiệm cu a hộ c ơ s ớ d ữ liệu ià dò Um c á c lỗi hộ
thống và phục hồi c ơ sờ d ữ liệu đến írạn g thái trư ớc khi x u ấ l hiện lỗi này.
C ác hệ c ơ s ở d ữ liệu d u ợ c th iết k ế ư ẻn cảc m áy lín h c á nhân nhò cỏ thổ
không có tal cà c á c d ặ c linh này. Vi (lụ, nhícu hộ ih o n g nhò h ạ n ch ế chi m ộl
ngư ời sử dụng đ ư ợ c phóp iru y nhập cơ sớ dữ liệu tạ i m ỗt thờ i diếm . M ột số hệ
khác xem nhiệm v ụ sa o lư u và phục hồi là nhiệm \TJ c ủ a ngư ờ i s ừ dụng. M ạ c dù
c ác h liếp cận n h ư v ậy lá đú đồi với c ả c cơ sờ dữ liệu c ả n h ân n h ư n g nó se không
thích hợp đe đ áp ử n g c á c yêu c ầ u c ù a các xí nghiệp v ừ a và lớn.
1 .2 .2 . 5.
Q u ả n lý l u v trừ
C ác c ơ sở d ữ liệu th ư ò n g đ ò i hỏi m ột khối lư ợ n g lớ n không g ian lư u trữ.
C á c cơ sỡ dữ iiẽu h ợ p nhất th u ờ n g đư ợ c đo trong th u ạ t n g ữ c ù a g ig ab y tes hay
v ới các cơ sờ d ữ liệu lớ n là terab y tes. D o bộ nhớ ch in h cú a m áy tính k h ò n g the
17
lưu Irír nhiều ih ỏ n g tin n h ư vậy, c á c Ihông lin này dược lưu irủ irôn c á c ihicl bị
nhớ ngoài như c á c đ ĩa từ , b ăn g từ... D ữ iiộu divơc chu>cn g iữ a đ ĩa lừ v à b ộ nhở
chinh là cần Ihiél. Sự di chuycn d ữ liộu này ]á khá chậm so vòi lốc d ộ c u a bộ xir
lý iru n g lâm , d o vậy các hộ c ơ sơ dữ liệu phai lò chứ c dữ liêu v ậi l\ sa o ch o tỏi
ihicu h o á $0 y ê u cầu ch u y ên đ ữ liêu g iữ a đĩa tử và bộ nl\ớ chinh
M ục dích cu a m ột hệ cơ sơ dữ liệu là đơn gian hoá vả tạ o d ic u k iện thiỉận
lơi đé tru y nhập đến dữ liệu. C ác khung nhin inúc c a o g iú p d ạl d ư ợ c niục đich
này. N h ữ n g ngư ờ i sử dụng cu a hộ thống không can thiốl phai b ic l c á c chi ú ct lưu
trữ \ ậ l lý dối với sự cải đ ật cu a hộ thống. Tuy tìlìicn. m ội Iiháa tố c h in h irong
hài lòn g cua ngư ời sử dung đối VỚI n iộl hộ c ơ sơ dữ hộu là h iệu n ă n g cu a hộ
thõng. N cu thời g ian dáp ứ ng đối với m ột vỗu câu là quá lâu, g ỉả trị c u a hệ ihong
sõ bị g iàm SÚI. H iệu n ăn g cu a inội hệ ihổng phụ thuộc vào c á c c ấ u tr\ic dữ liệu
đ ư ợ c sử d ụ n g b icu d iễn dừ liệu trong cơ sơ dừ liộu có hiộu q u á k h ỏ n g \ à hộ
thống có kha n ăn g th ao tá c trên các c ấ u trúc d ữ liệu này m ột c ác h h iệu q u a nhu
the nào.
B ộ quan lỷ lưu trữ là m ội m òdun chương iriiih cung c ấ p g ia o d iẹ n g iừ a các
dữ liệu đirợc lưu trừ tro n g cơ sơ d ữ liệu m ứ c thấp \ à các ch ư ơ n g irin h ứ n g dụng
hay c ả c iru y v ấn đ ư ợ c d ê trinh đ ố i vớ i hệ ihống. Bộ quan Iv lưu i n ì c ó Irách
nhiộm tucm g tác vớ i bộ quan lý lộp. D ữ liệu thô đ ư ợ c lưu trữ trô n đ ĩa từ sư dụng
hẹ thống x ử iý tệ p thưcm g đ ư ợ c cung cấp b ời m ột hệ điều hành n ào d ỏ . B ò quan
lý lư u trừ dịch các lộnh c u a ngôn n g ừ D M L k hác nhau thành c á c lệ n h hộ Uiong
xừ lý tệ p ở m ứ c thấp. D o vậy , b ộ quán lý lu u trữ có trách nhiộm lư u trừ , tim
kicm v à cập n h ật d ũ liệu ư o n g cơ sơ d ữ liệu nả}'.
1.2.3. K iến trú c củ a m ột h ệ quản trị c ơ s ớ dS* liệu
T ro n g p h ần này , chủng ta se phác thao kiển trú c c u a m ột hộ q u á n trị c ơ sơ
d ữ liệu dién hinh. C h ù n g la cũng sỗ nhin ihay cách Ihức m ột hệ q u a n iri c ơ sơ
dữ liộu x ử lý c á c c â u hòi v à các th ao lác khác đồi \ Ớ1 cơ sơ d ữ liộu. C ô n g nghệ
dối VỚI việc cài đ ặl m ột hệ quàn trị c ơ sơ d ừ liệu klìông thuộc p h ạm v i c u a cuốn
sách này. H ơn n ữ a , ch ú n g ta chí lậ p trung vào vấn đ ể c á c c ơ s ở d ữ liộu đu ợ c
th iết kế và đ ư ợ c s ử dụng m ộ t cách hiệu quá như thể ỉiào.
H in h 1,3 chi r a c á c thành phần chu yếu c u a m ọt hệ quan trị c ơ s ớ d ữ liệu.
T ại đ áy c ủ a kiển ưúCy ch ú n g la nhin thấ>' m ột sự bicu diễn c u a th iế t b ị n h ớ ngoài
(th eo qui ư ớ c, th iếl bị n hớ ngoải ờ dây lả cả c đĩa từ) lưu irữ c ả c dũ liệ u vả SICU
d ữ liệu. C hú ý rằn g thành phần n ày ch ử a không chỉ các dữ licu d ư ợ c ỉưu irữ
trong c ơ sở d ữ liệu m à cả c á c siẻu d ữ liệu, tứ c là các ih ô n g tíii vè c ấ u irú c cu a cơ
s ơ d ữ Hệu. Ví đ ụ , nếu m ột hộ quan irị cơ sơ dữ !iệu là !iệ q u an tn c ơ s ơ d ữ licu
q u an hẹ, c á c siêu d ữ liệu b ao gồm tên c u a các quan hệ. lên c á c th u ộ c lính cua
18
các q u an hộ v à c á c kicii dữ liệu dồi với các tlìuộc lính này. T h ô n g tỉìirờiìg. m ột
hộ q u an trị c ơ s ơ d ữ liệu bcio tri niộl sé clìi dẫn đối với dữ liệu. MỘI chi dẫn là
m ọt c ấ u tn ic d ữ liệu g iíip clìo viộc tim kiồm c á c klìoan m ục d ữ liộii m ộl cách
Iilianh c h ó n g vớ i các điêu kiộn clio ta rớ c, MỘI \ í dụ chiuìg nhất là m ội chi dan
cho p h ép tim kiổm c á c bộ cu a m ột quan hộ vớ i m ột g iá Irị cho irirớc đối với mội
trong c á c tlìiiỏc lính cu a quaiì hệ. C ác chi dẫn là m ột phần c u a du liệu lưu trữ ^'à
sự m ò la c á c th u ộ c líiili nào đ ư ợ c chì dần lá m ộ t phần cu a các siêu d ữ ỉiệu.
C ác thav dòi sơ dồ
C ác (hav đòi d ừ liêu
H ình 1.3: C á c th ành phần chính củ a m ộ t h ệ quán trị c ơ s ớ d ư liệu
T rong hinli 1.3. ch ú n g ta cung tilùn ih ấy m ột b ộ quan lý lưu trữ m à lìhiẹni
vụ c u a nó là lấ> ni c á c llìôiig tin đ ư ợ c yêu c ẩ u tìr lìlìững ihiết bị lưu Irù d ữ liệu
v à lha> dôi Iiliững th ô n g tin này khi dư ợ c y èu cầu bơi các m ứ c trẻ lì nó cu a hệ
ihỏng, C hú n g ta cũ n g ti]ìin Iháy IIIỘI thành p h an diiợ c gọi là bộ XIT lý câu lioi
m ặc dù lẻ n gọi n ày là kliỏiig lìoàn loàn chính xác, B ộ x ư lý c â u hoi đicu klìièn
k h ô n g chi c á c c â u hoi m à
cà
cảc )'êu
c ầ u th ay đôi d u liệu hav siêu dữ liệu.
N hiệm vụ c u a lìó là lim ra
m ọt
cách tối
n h ất luộl thao tác đ ư ợ c y êu cầu và phát
ra c á c lộnh đổi v ới bộ quan lỷ liru Irữ đê thự c thi th ao lác đỏ.
llià n h p h ần bộ q u an trị g iao dịch cỏ trác h Iiliiệm đam b ao tíixli loàn vẹn
cua hộ tlìổng này. N ó phai dam b ao rằn g n iộ l sổ th ao lác tlìực liiộn dổng thời
kh ông can trơ inỗi th ao lác k h ác \ à hệ thống sẽ không m ấl dữ liệu tlìậni chí khi
lỗi hệ ihống \ ã \ ra. N ó lư ơiig tác với bộ x ư lý cắii lìòi, do vậy nỏ phai b iếl dữ
liệu tiào đ ư ợ c tliao tác bơi
các
độn g và lìỏ có th ê c ầ n tliiểl làin
i]\ẵ0 lá c
hiện thời d ẻ tráỉili sự dụiìg đ ộ các hành
trề m ột sổ tru\* v ấn rủ)ầi dịnlì Kay m ội sổ th ao lác
cập n h ật đê c á c đụ]\g đ ò n ày k h ô n g \ ã y ra, N ó tiỉơitg tác với bộ quãii Iv lưu trữ
19
- Xem thêm -