Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học Đại cương Nguyên lý của các hệ cơ sở dữ liệu...

Tài liệu Nguyên lý của các hệ cơ sở dữ liệu

.PDF
296
9
134

Mô tả:

NGUYỄN KIM ANH ------- NGUYÊN LÝ CỦA CÁC HỆ CƠ SỞ DỮ LIỆU NXB ĐẠI HỌC QUỐC GIA HÀ NỘI -2009 M ỤC LỤC L Ờ I G IỚ I T H IỆ U 3 CHƯƠNG 1. ĐẠI CƯƠNG VÈ CÁC HÊ c ơ s ỡ DỬ LIỆU 5 I . I . Các hệ th o n g xừ lý tệp iruyển Ihồng 5 1.2. Các hẻ c ơ sơ d ừ liệu 9 1.2.1. Các khái niệm cơ hàn 9 1 2.2. c á c khá nông cùa m ật hệ quan ỉn cơ s ơ dũ' liệu ìì 1.2.3. Kiến trúc c ủa một hệ quàrì tri cơ sở dừ liệu 18 1.2^4. N gười quán trị c ơ s ờ d ữ liệu 20 1.2 5. N hừng người s ử dụng cơ sớ d ừ liệu 21 » 3. S j phán loại các h ệ CC' sơ d ữ Uệii 22 1 .3 .1. CYỉc hệ cơ s ơ d ừ liệu rạp iru/7g 22 ì. 5.2. C á c hệ c ơ s ớ d ừ liệu phân lớn 25 1.4 Kci luận C H Ư Ơ N G 2. C Á C M Ô H ÌN H D Ữ L IỆ U 2.1. M ô hìn h th ự c thề liên kếl (m ò hinh ER ) 2. /. / C à c khỏi niệm c ơ s ở 28 30 30 31 2.1 2 S ơ đ ồ thực thê hèn kết (sơ đồ ER) 33 2.1.3. Tính nâng cù a cá c liên kếi 34 2.2. M ô hìn h dừ h ệu q u an hệ 39 2 .2 /. C à c khái niệm c ơ hàn 39 2.2.2. Biến đỏi cá c s ơ đ ồ ER son^ mô hình quan hệ 40 2 3. M ò hin h d ữ liệu m ang 44 2.3. ì. C á c khái niệm c ơ hàn ^4 2.3.2. Biến d ồ i c á c s ơ d ồ ER sơng mô hinh m ạng 45 2 4. M ô hìrứi dừ liệu p h ân cắp 48 2.4. L Thuật toán hiến đồì mô hình manỹ, đơn Ịiián 48 2 4 .2 S ụ lặ p lạ i c á c kiêu bán ghỉ 49 2.4.3. C ác kiểu hàn g h i à o 2.5. M ô hin h d ữ liệu hưómg đối iuợng 2 .5 . 1 C á c k h á ỉ m ệm c ơ bán 2 .5 .2 B iể n đ ổ i c ó c s ơ đ ổ ER sơng m ô hinh d ữ liệu h ư ớn g đ o i (ư ợng 2.6, Đ ánh g iá v à kếl iuân 49 52 52 56 57 C H Ư Ơ N G 3. N G Ô N N G Ữ Đ ỊN H N C H ỈA VÀ T H A O T Á C DỮ L IỆ U Đ Ó I V Ớ I M Ó H ÌN H Q U A N H Ệ 59 3 .1. Đ ai số q u an hệ 60 3 .2. Phép lín h vỊ từ biến bộ 67 3.3. Phép lín h vị lừ biến m iền 71 3.4. N hàn xél ch u n g về kha năng cua các ngôn ngữ thao tác 74 3.5. ISBL: M ột ngôn ngữ đại số quan hê 'ih u ản tu ý ' 76 3 .5 .1. Cú p h á p củo các ph ép (oán đại số 76 3.5.2. C ác Ví' dụ vể bìều diễn truy vần hărìg ISDL 7S 3 . 6 . Q U EL; m ột ngôn ngữ tính toán vỊ từ biến bộ 80 3.6.1. Chi thị truv von so i. 6-2. C hi thị cập nhật H! 3. ố. 3. G án ke! qua tim kiếm vào mô! quan hệ H2 3 6 4. C á c vi dụ vể truy vầr) hang ngôn tĩ^ừ ĩinh ĩoớn vị lừ biền họ Ọ u el ^3 3 6.5^ Tỉnh đắv đủ cùa Quel H4 3.6.6. C'àc ph ép loan ỉập hợp H5 3.7. Q B E (Ọ uerv - By “ Exam ple): mòingỏn ngừ lính loán yị lừ biến iTiicn H6 i . 7. /, Truv vắn dừ hệĩi irong QBE H7 3.7.2. C á c ph ép toán lập hợp 92 3 .7.3. Các thao lác ỉhơv dôi c ơ s ơ dữ liệu 93 3.7.4 Tỉnh đấy đủ cùa QBE 95 3.7.5. Dĩnh nghĩa d ừ liệu trong Q B ĩí 95 3 .8. SQ L (S ư u ctu red Quer>' Language) 98 3.H.Ì. C ác lệnh tru v vẩn c ơ s ơ dừ liêu Ị 00 3.H.2.CỎC h à m ih ir v ìệ n 109 3.8.3 C á c lệnh cạp nhặt d ừ liệu IỈO 5. s. 4. C á c lệnh định nghía * m ột hộ thống th eo y êu cau sỗ dư ợ c th iếl kế d ê đ á p ứ n g các v cu cầu cu a niộl phòng đạc b iệt hay m ộl nhóm ngư ời s ử dụ n g cụ thé. D o vạy. không có m ỏi kế hoạch tô n g thê ha>' m ột m ỏ hinh hư ớng den sự tăn g Irư ơ n g các ứng đụng m ới trong lư ơng lai. M ỗi ứ n g d ụ n g tin học m ới đ ư ợ c IhiỂt k c m ọt cảc h điển h in h với m ộl lập các tệ p dữ liộu riên g c u a nó. N hièu dũ’ liộu trong các lẹp m ới có thc đ ã x u ất hiện trong c á c tẽp đ a n g tồn lại sẽ phai đ ư ơ c cấu trúc lại. m à đến lư ợl n ỏ . các chư ơ ng trinh đ an g lổn lại s ư d ụ n g cùng các tệp nà> cũng phai đ ư ợ c sư a lại h ay viết lai hoàn loàn, V ới lý d o này . th iếl kc các lệp mỚ! với m ỗi ứng d ụ n g đ ư ơ c y êu cầu thư ờ ng là đơ n g ian hơn v à cũng ÍI rui ro hơn. T rư ớ c tiên, ch ú n g ta hã>' xcm xót ví dụ vè m ộ t phần cu a h ệ thong N gân hàng tiél kiộm (Ọ u ỷ tiết kiẽm ) lưu g iữ thỏng tin \'C khách h àn g v à c á c lài khoan tiết kiộm c ú a k h ách hảng. MỘI cách dò lưu (rữ th ô n g tin này trẽn m áy tính là lưu trữ nó trong c á c lệ p h ê thống bển vírng. Đ c cho p h ép n g ư ờ i s ư dụng th ao lác những thôiìg lin này , h ệ thong cỏ m ộl sồ c á c ch ư o iig trinh ứ n g dung th ao tác các tẹ p đó, ch ăn g h ạn như: • C h ư ơ n g trinh th êm m ộl lài khoan mới; • C hư ơng ư in h ghì n ợ (g h i có ) m ột lài khoan: • C hư ơng ưinli tinh s ẻ d u cu a m ội lải khoan. C ác ch ư ơ n g trinh ứng du n g n ày dược viél bơ i c á c nhà lập Irinh hô íhống dc đáp ứ ng các y ê u cẩu tin học h o ả củ a N gán h àn g tiét kiộm. C ác ch ư ơ n g trìn h ứ n g dụng m ới có Ihê bố sung thêm v ào h ệ thong khi các nhu cầu m ới náy sinh. Hộ ihồiìg x ử ]ý tệ p diẻn h in h xìra m ỏ ta d ư ơ c hồ irợ bơi m ộl hẹ đ iểu hành n ào đó. C á c b ản ghi khá ồn dinh v à tồn tại lâu dài đ ư ợ c iưu Irỏ Irong c á c lộp khảc nhau v à c á c ch ư ơ n g trìn h ứ ng dim g k hác nhau đ ư ơ c viổt dê tri ch ra c á c ban ghi từ các tệp thich h ợ p hay b ồ su n g ihêm các b an ghi m ới v ào c á c têp đó. N hư vạ>, trư ớ c khi x u ất hiộn c á c phấn m èm hệ quan trị c ơ sơ d ữ liêu, trong quá khứ các hệ thống trẽ n c ơ sơ ỉẹp đã đ ư ợ c tạ o lập đé xử lý m ột sồ lưcaig lớ n các d ữ liệu cua các lô chứ c niỏl c ác h hiệu qua. T rong c á c hệ thong nliư v ạy , việc x ư lý dữ lỉệu đ ư ợ c hoàn thành boi \ iệc lạo c á c lệp Irẽn các đ ĩa từ h ay các b ă n g từ. T u y n.hiẽn, khi qui m ô kinh doanh cu a các tồ chứ c v à nhu cẩu x ư Iv Ihao tác dữ liệii v é i các m ục đích khác nhau theo c á c qui cảnh khác nhau tăn g lỄn, m ột số các vẩn đe ng h iêm trọ n g có thể này sinh. C á c h ệ thống ư ê n c ơ sở tệ p đ ư ợ c p h át tn e n với c á c ứiìg d ụ n g đ ặ c b iẽ t, do vậy việc lưu trừ th ô n g tin cu a các tô chứ c trong các hệ th ố n g lêp c ó m ọ t số bấl tợỉ chính sau: • D ư th ừ a dữ ỉiệu v à linh k h ỏ n g n h ất quán dữ liêu: D o các tệ p v à c á c chưcm g trinh ứ n g d ụ n g đ ư ợ c tạ o lập b ờ i các n h à lập ừ in h k hác n h au ừ o n g m ột k h o án g thời g ian dài, các íệp k h ác n h au có thể c ó các qui các h k h ác nhau v à các ch ư ơ n g trinh cỏ thé đ ư ợ c v iết b ẳn g m ột số ngôn n g ữ lập trìn h khác nhau. H ơn n ữ a , vi c á c tệp d ư ợ c lạo lập đối với m ỗi m ộ i ch ư ơ n g trin h ứng d ụ n g riê n g , d o vậy cù n g m ọt tạ p các d ữ liêu cù a tồ ch ứ c có thê đ ư ợ c lưu trữ lạỉ trong m ồi ch ư ơ n g trinh ử ng dụng, có nghĩa là m ột sổ th ô n g Ún có ihé lă p lại trên m ội số tệp k h ác nhau và c á c lài nguyên p h ần cứ n g n h ư các đ ĩa từ có thể bị lãn g phí. V í d ụ , địa chi v à số điên thoại củ a c ú a m ọ t khách hàng dặc b iệ t c ó ihể x u ấ t hiên trong m ọt tệp ch ứ a c á c bàn ghi tải k h o a n tiểt kiêm v à tro n g m ọt tệ p ch ứ a các b ản ghi số dư tà i khoản. S ự d ư th ừ a nàv d ẫn đến g iả tru y n h ập v à g iả lưu trữ cao hơn. T h êm v ào d ó , v i c á c d ữ licu đ ư ợ c lưu trữ tro n g các têp có the đ ư ợ c fftav đoi m ọt c ác h d ộ c lạp b ỏ i các chưcm g ư in h ứ n g d ụ n g sử dụng chúng, nôi dung c ủ a cù n g c á c k h o an m ục d ữ liệu ư o n g ch ư ơ n g trinh ứ n g dụiig này có thể không trù n g v ới c ù n g các k h o ản m ục d ữ liệu đó trong m ộ t ch ư ơ n g trình ứng dụng khác. Đ iể u này d ẫn đen tín h k h ô n g n h ai quán dữ liệu, có nghĩa là các b ản sao k h á c nhau cù a cùng m ộl k h o ản m ục dữ liệu k h ô n g giổng n h au .V í d ụ , m ộ t đ ịa chi k h ách h àn g bi th ay đồi có thể d ư ợ c phán ánh trong bản ghi tài k h o ản tiết kiệm n h ư n g k h ô n g d ư ơ c p h án ánh trong bản ghi số dư tài k h o ản đ ố i với khách h án g dó K h ó k h ăn iro n g tru y n h ập d ữ liệu: G iả s ư rằ n g m ọ t ừ o n g c á c n h â n v iên cu a N g â n h à n g c ầ n tim đ an h sách lê n c á c k h ách h àn g sống tro n g m ộ t th à n h phố n à o đó. N h â n v iên n ày hòi p h ò n g x ừ lý d ữ liệu đ ê đ ư a r a m ọ t d an h sách n h ư vậy, V i y ê u c ầ u n ày k h ô n g đ ư ợ c d ự tín h tru ớ c , h ệ th o n g g ố c d ư ợ c thiểt k ế k h ô n g c ó sẵ n m ộ t ch ư ơ n g trin h ứ n g d ụ n g để đ áp ứ n g y êu c ầ u n ày .T u y n h iê n , c ỏ m ộ t c h ư ơ n g trinh ứ n g d ụ n g đ ư a ra d an h sá c h lấ t c á c á c khách hàng. B ấ y g iờ , n h ân v iên N g â n h àn g n ày đ ứ n g trư ớ c h ai lự a chọn: H o ặc sứ d ụ n g d a n h sá c h tấ t c ả c á c k h ách h àn g v à ư íc h ra n h ữ n g th ô n g tin c ẩ n Ihiểi b a n g ta y h o ặ c y ê u c ấ u p h ò n g x ử lý d ữ liệu đ ề nghị m ộ t n h à lậ p ừ in h hệ ửiong v iết c h ư ơ n g trìn h ứ n g d ụ n g m ới đ áp ứ n g y êu c ầ u m ới n ày . C á hai lự a c h ọ n h iể n n h iê n đểu k h ô n g đ ư ợ c hải lòng. G ia s ử ran g , m ọ t ch ư ơ n g trin h n h u v ạy đ u ợ c v iể l, v à sau v ài n g ày , cũ n g n h ân v iẽ n d ó c ầ n m ộ t danh sá c h k h á c h h à n g khác. C u n g n h ư vậy , m ột c h ư ơ n g trìn h đ ư a ra d a n h sách đó k h ô n g tồ n tạ i và n h ân v iên này lại đ ứ n g trư ớ c hai lự a ch ọ n v à k h ô n g có lự a ch ọ n n à o đ ư ợ c h ài lòng. Đ iể u ch ú n g lô i m u ố n chi ra ờ đ ây là c á c m ôi ừ ư ờ n g x ừ lý tệ p k h ô n g ch o p h ép c á c d ữ liệu c ầ n th iểt đ ư ợ c lim k iể m trong m ộ t p h ư ơ n g p h á p h iệ u q u ả v à tiện lợi. D o vậy , c á c hệ th ố n g tim k iém dữ liệu th ic h h ợ p hcni c a n p h ài đ ư ợ c p h át tríế n v à p h ài đ á p ứ n g đ u ọ c c á c ú n g d ụ n g k h ác ỉứiau c u a hệ thống. C ô lậ p v à h ạ n c h ể ch ia sẻ d ữ liệu; V ớ i các h tiếp c ả n tru y ền th ổ n g , m ỗi ứ ng d ụ n g c ỏ c á c tệ p d ữ liệu riên g c ú a nó v à rihững n g ư ờ i s ư d ụ n g ít c ó c ơ hội c h ia sé d ữ liêu n g o ài c á c ứ n g d ụ n g riê n g c ủ a họ. M ộ t h ậu q u ả c ủ a v iệ c ch ia sè d ữ liệu b i h ạ n c h ế là c ù n g c á c d ữ liệu p h ải lu u irữ iro n g n h iề u tệ p ứ ng với c á c ứ n g d ụ n g k h ác n h au do k h i th iểt kế p h ái triê n c á c ứ n g d ụ n g m ới, n g ư ờ i th íc t k é th ư ờ n g k h ó k h ai th á c c á c d ữ liệu c h ứ a tro n g c á c tệ p đang lổ n lại tro n g k h i c á c tệ p m ới đ ư ợ c th iế t k é lặ p lạ i n h iều d ữ liệu đ a n g tồn tại. H ơ n n ữ a , c á c d ữ liệu đ ư ợ c lưu trữ tro n g c á c têp k h ác a h a u v à các tệp c ó thê có c á c q u i c á c h k h ảc n h au , đ iều n ày dẫn đền k h ó k h ăn khi v iểt các c h ư ơ n g trin h ứ n g đ ụ n g m ới d e tim k iếm c á c d ữ liẹu th ích h ợ p trê n nhiều tệp. C á c v ấn đ ể v ề to à n vẹn: C á c g iá trị d ữ liệu đ ư ợ c lư u trữ tro n g c ơ s ở d ữ liệu p h ài th o ả m ã n c á c k iể u rà n g b u ộ c to àn vẹn n h ấ t định. C á c n h à p h á t triến làm h iệu lự c c á c rà n g b u ộ c n ày tro n g h ệ th ố n g b ằ n g c á c h ih ẽm c á c đoạn m ă tư ơ n g ứ n g v à o c á c ch ư ơ n g ừ ìn h ứ n g đụng. T u y n h iê n , khi c á c fàn g b u ộ c m ới đ ư ợ c b ổ su n g th ê m đối với c ơ s ớ d ữ liệu, sẽ rấ t k h ó th a y đ ổ i các ch ư ơ n g trin h đ ế làm h iệu lự c các rà n g b u ộ c m ớ i này . v ấ n d ề n ày p h ứ c tạp hơn khi c á c rà n g b u ộ c đó lôi k éo m ộ t số k h o ản m ụ c d ữ liệu từ c á c tệp k hác nhau • C á c vấn đề v ể dô tin cậy: M ộ t h ệ th ố n g m áy tinh cũ n g n h ư m ộ l Ihiél bị diộn tư hay cơ học nào đỏ c ỏ Ihê bi lỗi. R o n g n h icu ứ n g d ụ ag . vẩn d è m ấu chốt lá khi m òl lổi x u ấ l hicn v à d ư ợ c d ố lim p h á i h iệ n , d ừ liệu phai d ư ợ c phục hổi dén trạn g ihái loàn \c n lồn tại trư ớ c khi xa> ra iỗi. V i dụ. xél ch ư ơ n g trinh ú n g d ụ n g c h u \ ên 50 đỏ la từ tài k h o an A đ ển là i khoan B N ếu hệ th ố n g xay ra lỗi tro n g khi th ự c h iên ch ư ơ n g trin h , c ó th ê rẳn g , 50 đô la đ ã chuycn di từ lài k h o àn A n h u n g c h ư a đ ư ợ c g h i c ó v ào tà i k h o án B, kel q u a là c ơ sờ d ữ liệu ơ (rong m ột trạn g th ái k h ô n g to à n vẹn d ữ liêu. • C ác dị ih ư ò n g iru)' nliâp d ồ n g thời: Đ c tăn g hiòu n ăn g lô n g thô cu a hộ th ố n g vả thờ i gian đ ảp ứ n g lứianh n h ắ t c ó th ẻ. a h iể u h ệ th ố n g cho phép ỉihiẻu n g ư ờ i sư d ụ n g truv n h ảp d ữ liẻu doĩxg thờ i. T ro n g in ò l m ô i Irư òng rửiư v ậ \ , sự tư ơiig tá c c ú a c á c tru y n h ập đ ồ n g th ờ i c ó th é dẫn đ ển két qua Irong m ột irạn g th ái không to àn vẹn d ữ liộu. V i d ụ , x é t tà i k h o ản N g ân h àn g A ch ứ a 500 dô la. M ếu h ai k h á c h h ò n g đếii Iiít q u ỹ (rú t 5 0 đô la vả 100 đỏ la lư ơ n g ứ n g ) lừ là i khoan A v ào c ù n g m ộ t th ờ i đicm . K ết qua cua các thự c hiện đổng thời nà>' có thê d an d ến tà i k h o an nà>' ơ tro n g m ọ t trạng thải k h ô n g đ ú n g đ án ( hay k h ô n g to àn vẹn). G ia sư rầ n g . c á c ch ư ơ n g trinh rú t thự c hiện v ẻu câu rú l b ao gom c á c th a o lá c : d ọ c g iá trị là i k hoan, giam g iá trị này đi m ột g iá trị b ẳn g sồ c ẩ n r ú t v à g h i kổl q u a tr a lại. N éu hai ch ư ơ n g trìn h ch ạy dồng thờ i, c a h ai c ó ihê c ù n g đ o c g iá irị 5 0 0 đ ỏ la và ghi lại 4 5 0 đô la , 4 0 0 đ ô la tư ơ n g ứng. Phu ih u ỏ c v à o c h ư ơ n g trin h n áo ghi giá trị sau cù ng, tà i k h o án A có th ẽ c h ứ a h o ặc 4 5 0 đô la h o ặc 4 0 0 đ ô la chứ k h ỏ n g p h ai g iá tr? đ ú n g cu a n ó lả 3 5 0 d ô la. Đ c c à n h g iá c v ớ i n h ữ n g útứx huống n h ư v ậ y , h ệ Ihống phải duy trì m ộ t d ạ n g g iả m s á t n à o đó. B ời vi dữ liêu c ó thé d ư ợ c tru y nhập b ò i n h iều c h ư ơ n g trin h ứ n g d ụ n g k h ác lứiau m à k h ô n g đ ư ợ c d iều phồi tử trư ớ c, m ỏi d ạ n g g iả m s á t n h ư v ậy k h ó c ỏ tlìể dược cung cầp. • C ác vấn d ẻ v è an loàn; K lìô n g phai m ọi n g ư ờ i s ư d ụ n g c u a hộ th o n g dều có ihê tru y n h ập lấ t c á dữ liệu tro n g hệ. V i d ụ , Irong h ệ th o n g N g â n h àng, các nhân vicn tài vụ c ù a N g ân h à n g chi c ầ n n h ìn th ấ y m ộ i p h ần c u a c ơ sớ dữ liệu c h ứ a th ô n g tin vể cảc n h ân v iên N g â n h àng. H ọ k h ô n g c ẩ n th iế t truy n h ập vào th ò n g tin v è c á c tài k h o án k h ách h àng. D o c á c c h ư ơ n g trin h ứng dụng đ ư ợ c bo sung v ào hệ th ố n g Iheo p h ư ơ n g p h á p Ih êm d ần , v iệ c b ắt tuân thú c á c ràn g b u ộ c an loàn n h ư v ậy lá k h á khó khản. • S ụ phụ th u ộ c d ữ liệu cù a c á c ch ư ơ n g trình ứ n g d ụ n g : D o đ ịn h n g h ĩa tệp đ ư ợ c c h ứ a Irong c á c ch ư ơ n g ừ in h ứ n g d ụ n g , n ểu c á c n ộ i d u n g tệ p v à các khuôn d ạn g bán ghi cần đ ư ợ c th ay đ oi, c á c c h ư ơ n g ừ in h ứ n g d ụ n g cũng phái ih ay dối theo. N h ữ n g k h ỏ k h ã n nà> d ầ u dén c ầ n phai phái iriôn niộl phầti m ểm d ặc biộl. m ột h ệ q u an Irị c ơ s ơ d ữ liộu với đ ay đu c á c tiiilì năng cho phép kliac p h ụ c các bất iợi nêu ư ề n . 1.2. C á c h ệ c ơ s ở d u liệ u IV oiìg th ờ i g ia n g ầ n đ â \ n g àn h tin liọc đ à c ó iiJiiêu th àn h lựu hct sứ c lo lớii. T ro n g sổ n h ữ n g th à n h lựu đ ó p h ai k ẽ tớ i v iệ c sir dụng ngà> càn g rộ n g rãi và có hiệu q u a c ả c h ệ c ơ s ớ đ ữ !iộu. T n rớ c liên ch ú ỉìg (a hãy xem x ét các khái m ệm cơ ban v è hê c ơ s ơ d ữ liêu I .2 .I . C á c k h á i n iệ m c ơ b « ĩn ( V/ ,vơ íỉữ liệu là g i ? M ội tô c h ứ c ( n ì n g h iệ p , n g ân h àn g , bênlì ^'iện. cơ q u an ...) c ỏ Iiliíều ứng dụiig tin lìỌC k h á c n h a u n h ư n g tấ t c a c á c ứ n g dụng đó cù n g đ ư ợ c liến liàiứi irên inộl nguồn d ữ liệu clìLuìg ihi k iìông g ì tố t liơĩi là triên klìai các ứ n g d ụ n g đỏ trôn m ôt c ơ s ơ d ữ liộu h ợ p I\hất c h o p h é p q u an lý tậ p trung tấ t ca d ữ liộu xi nghiệp. H ìn h 1.1. C ơ s ỡ d ữ iiệ u h ợ |) n h ấ t T rên hinli 1.1, c lìủ n g ta ìứiin th ấ y thànlì plìần c ơ sơ dữ liệu hợ p nhấl là m ội b ộ sư u tậ p c á c d ừ liệu c h ứ a trê n c á c p h ư ơ n g tiện lư u trữ n h ư đĩa từ h ay băng từ... N h ữ n g n g ư ờ i s ư d ụ n g trự c tu y ể n ha>' c á c ch u ơ iìg tritìj\ ứ n g điuig có thô sư dụn g ch ung h ay clìia se c ơ sơ d ữ liệu 11 à>*. C ác ch ư ơ n g trình ứ n g dụng theo lô cỏ Ihc th ự c h iện c á c ih a o tá c trẽn các d ũ liêu d ư ợ c lấy ra lừ c ơ sở dữ liẻu nàv T ihư tim k iém , sư a đôi, b ỏ sung, loại bo... N h ữ n g ngư ời sư đ u n g trự c tuyển thao tá c v ớ i c ơ sớ d ữ liệu lử c á c ih iềt bị đầu cuối ơ c ác h x a (ch ú n g la Ihư ờng gọi !à tihững n g ư ò i s ư d ụ n g c u ố i) v à họ cOng có ihê th ự c hiện tất ca cảc ih ao tác; tim k iếm , sừ a đôi. b ố su n g , lo ạ i bo. N ói c h u n g , tim kiếm là ih ao tác phô b iển rứiấl v à q u an tro n g n h a i N h ư v ậy , ch ủ n g ta c ó ihể đính nghĩa : C ơ sớ d ữ liệu là m ột b ộ s ư u tậ p các d ữ liệu tác ng h iệp đ ư ợ c iưu trữ lại và dược c á c h ê ứ n g d ụ n g c u a m ộ i \ í nghiệp c ụ th ẽ nào đó sư dụng. T ro n g đ ịn h nghĩa nảy , xí nghiẽp ở dâv chi b ấ t kỷ m ộ t h o ạ t đ ô n g khoa hoc. k> th u ậỉ. km h doanh., n ào đó. D ữ !iẻu tác n g h ic p d ư ợ c sư d ụ n g đê chi dữ liéu cua xi righiẹp. ch àn g haiì dỗ liỗu về kháclì h à n g ha> d u iiộu v è là i k h o a n trong vi dụ đ ố i vói N g ân h àn g tiết kiẹm .. C húng tôi rnuốn n h ấn m ạnh rằ n g , c á c dữ liệu váo, tứ c là các th ô n g Ún đi íừ thể giới bên n g o ài v á o v ả c ó th ể g â y r a n h ư n g thav đ o i ừ o n g d ữ liệu tác ng h iệp v à c á c dừ !iộu ra , tứ c ià c á c íh ỏ n g b á o , b á o c ả o rú l ra tù d ũ liệu lác nghiệp k iìông phải là m ôt p h ần c ú a d u liệu lá c n g h iệ p và k h ông đ ư ợ c b ao hàm trong d ừ liệu tá c nghiệp. H ệ quản in c ơ s ở d ữ liệu ìà g i? T rên thị trư ờ n g p h ần m ềm hiện nay ờ V iệ t n am đ ã x u ẩ t h iẹ n k h ả rứiiều p h an m ềm hệ q u ản trị C0 s ơ dữ liệu ỉứiư: M .A cce ss, D B 2 , In fo rm ix . S Q L Server. S y b ase, O racle. C húng ta có thề định nghĩa m ột h ệ q u ản t n c ơ s ơ d ữ liộu n h ư sau : H ệ quan trị c ơ sơ dữ liệu là m ộl h ê thống phấn m èm ch o p h ép tạ o lâ p c ơ s ơ d ữ liộu và d íểu kh iẻn m ọi tru y n h ắp đối vớ i cơ sở dữ licu dó. H ê c ơ s ờ d ữ lĩêu lá B ây g iò , ch ú n g ta có the dịnh n g h ía m ộ t h ệ c ơ s ò d ữ h ệ u là m ọ l h ệ th o ng gồ m 4 th àn h phần : • C ơ sớ d ữ liệu h ợ p nhất: C ơ sờ d ữ liệu c ủ a h ẻ c ó h ai tín h c h ấ t tố i th iểu hoá d ư th ừ a v à đ ư ợ c c h ia sẻ. • N h ữ n g ngư ời s ù dụng: N g ư ờ i sử dung c ù a h ệ là b ấ t k ỳ m ọ t c o n n g ư ờ i nào có nhu cầu tru y n h âp vào cơ sờ dừ iiệu, c ỏ n g h ĩa là n g ư ờ i s ứ d ụ n g b a o gồm tấ t c ả n h ữ n g n g ư ờ i s ư dụng cuoí> rửiững n g ư ờ i v iế t c á c c h ư ơ n g trìn h ứ n g d ụ n g v à những n g ư ờ i đ iều khíen toàn b ộ h ệ th ố n g h a y c ò n g ọ i là ngư ời quản trị c ơ s ở d ữ liệu. • Phấn m ềm hỗ q u an trị cơ sơ dữ liệu 10 • P h ần cứ n g ; P h ần cứ n g cu a hộ b ao gồm các (hiét bi n h ó th ứ c ấ p d ư ợ c sừ đ ụ n g đ ê lư u trữ c ơ s ở d ử liêu. T ro n g c á c phấn tỉểp theo, chủng la sẽ đi sàu tìm h iểu vể h ệ q u án trị cơ sở d ữ liệu, m ộ i p h ầ n m ềm đ ặc b iệ l VỚI đ ầy đù cảc linh n ăn g cho p h ép c à i dặl các hô c ơ sở d ữ liệu. Đ ổ n g th ò i, chúng ta cũ n g phản lích c á c k h a n ăn g c ù a m ọl hẹ q u an tn c ơ s ờ d ữ liêu ch o p h é p khắc phục tắ t cá các n h ư ợ c điểm c ủ a các hệ ihồng \ ư !ý tộp tru y ền thổng. C uối cù ng, ch ú n g ta sẽ xem x é t c á c nhiêm vụ m à ngư ời q u an t n c ơ s ơ d ừ liệu phái dam nhiẽm đẽ dièu khiên to àn bọ hẹ c ơ sở dừ liệu. 1.2.2. C á c k h ả n ã n g c ủ a m ộ t h ệ q u ả n t r ị co* s ờ d ữ liệu C ỏ h ai k h à n ă n g ch o p h ép phân b iệt các h ệ q u án trị c ơ sờ d ữ liệu v ái các kiéu hệ th ố n g lạ p trin h khác. • K h á n ă n g q u ả n lý d ữ liệu tồn tai lảu dài • K há n ã n g tru v n h ậ p các khối lư ợ ng dữ liệu lớn m ọt cách hiệu qua Đ ạc đ iềm th ứ n h ấ t chi ra rằn g c ỏ m ột cơ sỡ d ử liệu tổ n tại tro n g m ọt thời g ia n dải, nội d u n g c ú a c o sờ dữ liệu này là c á c dữ liệu m à m ỏ i hẹ q u án trị cơ sờ d ữ lìộu truy n h ậ p v à q u ả n lý. Đ ặc điểm th ứ hai phân b iệt m ộ t hệ q u àn ư ị với m ô t h ệ thổng x ử lý tệ p cũ n g q u án lý d ữ hệu lon tai lâ u d ài n h ư n g n ó i chung không cung c ấ p c ả c tru v n h ập nhanh chóng đen các bọ p h ạn d ữ liệu tuỷ ý. C ảc k h á n à n g c ù a m ô l hộ quán tri cơ sờ dữ liộu h ầu h é l lá cần Uiièt khi khổi lư ợ n g d ữ liệu c ầ n lư u trữ là rấl lớn, bới vi các khối lư ợ n g dữ liệu nho thì c á c k ỹ th u ậ t tn iy n h ậ p đơ n g ià n , chẳng h an q u él tuần tự c á c d ữ liệu ià th ích họp. K hí ch ú n g ta x em h ai đ ặ c điẻm trễ n cù a m ọt hệ q u àn trị c ơ s ờ dữ íiộu là cơ bán, còn m ọ t số c á c k h ả n ă n g k h ác m à có thô thấy Irong hầu h ết c ả c hẹ quán trị cơ s ở dữ liêu th u ơ n g n ìại. Đ ỏ là. • HỒ trợ ít n h ấ t m ọ t m ô h in h dữ liệu h ay m ỏi sư trừ u tư ợ n g to án học m à qua đó n g ư ờ i s ứ d ụ n g có th ề q u an sát d ữ liệu. • Đ àm b ảo tín h độc lậ p d ữ liêu h ay sự b ấ t b iển c ủ a c á c ch ư ơ n g trình ứ ng đụng đối vớ i c á c th a y đ ổ i về cấu trú c tro n g m ỏ hinh d ữ liệu. • H ồ trợ c á c n g ô n n g ữ c ấ p cao nhất định cho p h ép ngư ời s ù dụng đ ịn h nghĩa câu trú c c u a d ữ liệu, tru y n h ập dữ liệu v à thao lá c d ừ liệu. • Q uán trị g ia o d ịc h , có n g h ĩa lả khá năng cung c ấ p c á c tru y n h ạp d o n g thời, đủng đ ắn đ ố i v ớ i c ơ s ở d ữ liệu từ nhiều ngư ờ i sứ d ụ n g tại cù n g m ọt thời diểm. 11 • Đ iểu k h iên lo iy nhập, c ỏ n g h ĩa là khá ĩiăng h an ch ể iru y nhập dổn c á c dữ liệu b ơ i n h ữ n g n cư ờ i s ư dụng không d ư ơ c c ấ p phép v à kha n ă n g kicni Ira tinlì d ủ n g d ãn c ú a dữ tiộu • Phuc lìồi dữ liệu, c ó n g h ĩa lả kha nàng phục hoi. k h ô n g làm m ắl m ảl dữ liệu dối VỚI c á c lồi cu a h ệ ihong. ỉ . 2-2.1. S ự ỉ r ừ u t ư ợ n g h o ớ d ữ Uệu Đ ế cho hộ thống c ó ihc sư d ụ n g dư ợc, nó phai tra cứ u hay tim k icm d ữ liệu m ột cách hiệu qu a. Đ iều nà> d ẫn đến việc ílìiết kố cảc cấu trú c dử lièu phứ c lap dc biêu diễn d ữ liệu tro n g c ơ s ơ dữ liêu này. D o nhiều ngư ờ i s ư d ụ n g iru y nhập vào các hệ c ơ s ò d ữ liệu k h ỏ n g đ ư ợ c đào tạo về m áy tính, người p h á t triên phai che dấu liỉili p h ứ c lạ p dổi vớ i rứìũiìg người sủ dung thòng q u a m ọi s o m á c trừ u iv ơ n g dê đ ơn g ia n h o ả c á c tư ơ iìg lá c cu a n g ư ò i sừ dụng đoi vói hẹ ihóng. • M ứ c v ật lý. M ứ c thấp n h ất c u a sự trừ u tư ơ ng m ô tá d ữ liộu đ ư ơ c lưu trữ m ội các h ih ự c s ự n h ư th ế nào. T ại m ức v ật lý, c á c c ả u trú c d ữ liệu m ức thấp p h ứ c tạp d ư ợ c m ó iá c h i tiết. • M ứ c logic. M ứ c c a o h ơn liếp theo c u a sư trừ u tư ợ n g m ô ta n h ữ h g d ừ liệu n ào d ư ợ c lư u Irữ trong c ơ s ở đ ữ liệu và các mối quan hộ n ào tồ n lạ i giữa các d õ liệu này, N h ư vậy , lo àn bộ cơ sơ d ừ liệu đ ư ợ c m ô tả tro n g th u ậ t ngừ c u a m ột sổ nhó c á c c ấ u trú c khá dơn giản. M ặc dù sự cài đ ặl c á c c ấ u trú c d ơ n g iàn tại m ứ c lo g ic n à y c ó Ihc kéo theo các cấu trú c m ú c v ậ t lý phức tạ p , n g ư ờ i s ử dụng ờ m ử c lo g ic không c ầ n b iếl vể sự phứ c tạ p này. M ức logic củ a sự trừ u tư ợ n g đ ư ợ c x á c định bơi n g ư ò ỉ q u an trị c ơ sơ d ư liệu, cụ thề phái q u y ếl dịnh o h ữ ng th ô n g tm gì đ ư ợ c lưu Irử Irong cơ sơ d ữ liệu. • M ứ c k h u n g nhin. M ứ c c a o n h at cu a sự trừ u tư ợ n g m ỏ tả chi m ộ l phần cua to àn b ộ c ơ sở dữ liệu. M ặ c dù s ù đụng các cấu trú c dơ n g ia n h ơ n m ức logic, m ộ t số p h ứ c tạ p vẫjì cò n tồn lại do kích th ư ớ c lớ n củ a c ơ s ớ d ữ liộu. N h iểu n g u ờ i s ừ d ụ n g c ù a hệ c ơ sờ d ữ liêu k h ô n g quan lâm đến tất ca n h ữ n g th ô n g tin này. T h ư c c h ất, những ngư ờ i s ử dụng n ày c h ì c ầ n truy n h ập m ột p h ần cù a c ơ s ớ d ữ liêu. D o vậy sự tư ơ n g tá c cù a h ọ v ớ i hộ thống n ày d ư ợ c đơ n g iản h o á v à m ứ c khung nhin c ú a sự trừ u tư ợ n g đ ư ợ c xác định. H ệ th ố n g có thế cu n g c ấ p nhiều khung nhin đối với cù n g m ộ l c a sơ d ữ liệu. M ối q u an hê tư ơ n g ho g iữ a b a m ứ c trừ u tư ợ n g đ ư ợ c m inh h o ạ tro n g hinh 1.2. 12 n h ư sau: M ức kluing nliìn K hun g nhin 1 K lning nlìin n M ức logic M ức v p e cu sto m cr = rc c o rri custom er^naine: striiig; so cial_secu rit}’: string; cu slo m er_ sừ eet: string: custom cr_cit>'; striiìg: end: Đ oạn niã nảy định nghĩa Iiìột kiêu bân glìi m ới d ư ợ c gọi [ả cuslom er (kliách hảng) v ớ i bốn trư ờng. M ỗi trư ờ n g c ó tên trư ờ iig vả kiếu d ữ liệu kết h ợp v ới nó. M ộ t N g â n h àn g tiét kiệm có llìẻ có m ội số kiêu bãii ghi nliư v ậ\', chầug h ạn b ao gồm c á c kiểu ban ghi sau: - account (tài k h o an ) với các trucnìg accouiìt_nuniber vả trư ờ n g b alan ce; - em ployee (n3iâiì v iê n ) với các tnrcm g c n p lo y e e _ n a m e vá tru ờ n g salary. T ại m ứ c v ật lý , m ột ban ghi custom er, accouỉìỉ h ay m ộ t enip lo y ee c ó thẻ đ ư ợ c m ỏ ta ìú\ư m ột kliéi lìliớ. C h ư ơ n g trinh dịch n g ô n n g ữ lìàv ch e d ấu các m ức chi tiết lìày doi với n h ữ n g ngư ời lập trinh. T ư ơ iig tự . các h ệ c ơ s ơ d ữ liệu che dấu Iilìieu chi tiếl lưii trữ m ử c lliấp nhấl dổi xởi ixltững n g ư ờ i lậ p trìnlì ú n g dụng. N g ư ờ i quan trí c ơ sơ dữ liệu có thé biết nlìững clìi tiểt n liất đ ịn h về tổ chứ c dữ liệu v ật lý. T ại m ứ c logic. m ỗi bán ghi n lm v ậy đ ư ợ c m ó tả b ơi m ột địn h ng]ìĩa kiêu Iihư đ ư ợ c miiứi lìoạ tro n g đoạn m â v ừ a rồ i v à Ểĩiối quan lìệ g iữ a các kiẽu bãn ghi n ày đ ư ợ c x ác dịnli. N h ữ n g tìgười lậ p triiìh sư đụiig m ộ t ngôn ng ữ lập iTÌxửì làm việc tại m ó c trừu tư ợ ng nà}'. C ung tirơ n g tự vậ>^ n h ữ n g ngư ời q u a n trị thư ờiìg làm v iệ c tại m ức triru tưỢỉìg nay. 13 C uối cù ng, lại m ức khung nhin. những người su dụng má> tín h nhiII thấ> m ộl tập các chưcm g trinh ứ ng dụng m à ch e dấu I ih ữ n g chi liêl vê c á c kicu dữ liêu. T ư ơ n g tự , tại m ứ c khung nhin. m ột số khung nhìn cu a c ơ sơ d ữ líộii được x á c dinh và nlìững người sư dụng Cỡ sơ d ừ \\ộu nhìn thầ>' c á c k h u n g nhin n à> . N goài sự ch e d ấu n h ừ n g chi tiết c u a m ức logic dối ^'ới c ơ s ơ d ữ liệu n ày . các khung Iilììn cũng cung c ấ p niôt c ơ ch c an loàn đô ngán ch ạn n h ữ n g ngư ời sư dụng khoi sự tru y nhập các bộ phận cu a cơ sơ dữ iicu. Vi d ụ . inôl klìácỉĩ lìàne cua inộl N gân hàng chi ĩìhin lh á \ m ôl phần cua cơ so dữ hệu clnVa ih ỏiig Un vc làí khoan cu a a a h la \ à anh la không llic lru> Iihảp đốn các ihòiiíị lin licn quan dển lu oiig cu a các n h ân vicn ngân lìảng. C á c th c h iện v à c á c SO’ dồ C ãc cơ sơ d ữ licu thay dôi ihco thời gjan khi llìỗng Ini đ ư ợ c th cm \ ào ha> bị xoá di T ậ p h o p các lliông tin đ ư ơ c lư u Irữ Irong cơ sơ d ư licu la i m ột thởi điôm d ặc biộl đ ư ợ c gọi là m ọt thê hiộn cu a cơ s a d ữ liộu này. MỘI ih iếl kc lông ihẽ c u a c ơ sơ d ữ licu đ ư ợ c gọi là sơ đổ cơ sơ dữ lỉộu. C ác sơ đ ồ il k h i bị Ih ay đôi thậin chi hầu n h ư klìông tha> dồi S ự tươiig tự c u a các khái tiiộm này vớ i các khái niệm v ề kiôu d ữ h ộu. bièn vả g iá trị Irong c á c ngỏn ngỗ lạp Irinh là niỗt m inh hoa có ich ơ d ấ y Ọua> Irơ lạj định nghĩa kiôu b an ghi custonicr, chú ý răng. Irong khai bảo k icu b ati ghi nà>\ chúng la k h ô n g kiiai b áo m ột bicn nảo. Đ é khai b áo c ả c bicn n h ư v ậ v Irong m ột ngôn n g ữ lụ a P ascal, chúng ta viél: v ar c u s to m e r i: custom er: B ién cu slo m erl b ây g iờ tư ơ n g ứng với m ọt \iin g n h ớ m ôt b a ti ghi kicu cu sto m cr M ộ( sơ dồ c ơ sơ d ừ liôu lư ơ n g ú n g với định nghĩa kicư tro n g ngòn ngữ lập trinh. M ọt biển cu a kiêu đ ã cho có m ột g iá Irị dặc bièl lại m ỏ i th à i diêm dâ cho N h ư v ậv . giá In cu a m ôt bién irong các ngỏn ngữ lạ p trin lì lư ơ n g ứ ng với m ội íhc hiộn c u a sơ dồ cơ sơ dữ liệu C ác liô c ơ sơ dừ licu cỏ m ộ i số s ơ dồ đirợc phân tách phù hợp với c á c m ứ c trừ u tư ợiig m à ch ú n g ta đâ th á o luân. T ại m ứ c th ấp n h ắp là sơ đồ vậỉ lý, lại m ứ c tru n g g ian là sơ đồ iogic, v à lại m ứ c cao nhất là m ộ t sơ đ ẻ con. N ó i chung, các hệ c ơ sớ dữ liệu hồ Irợ Jĩiôt s ơ dổ v ậl lý. m ột sơ đồ ìogic và m ội số sơ dồ con. 14 T ítih d ộ c lậ p d ữ liệu K h a n ăn g thay đôi m ộl đinh nghĩa sơ đồ trong m ộ t m ứ c m à k h ô n g anh hư ơng đến định nghĩa sơ dồ troíìg niửc cao hon tiếp theo đ ư ợ c gọi là tinh dôc lập d ừ liệu. C ó hai m ứ c độc lập du liệu. 1. Đ ộ c lạ p dũ liộu mức vât lý là k!ia nâng ihay đôi sợ đo ^ ậ t lý m à khòng dẫu dến c á c ch ư ơ n g trinh ứng dung phai \ icl lại C ác ihay dôi tại m ứ c v ại iý dỏi khi là c ầ n thiél đ ẽ lăng hiệu nàng hộ Lhống. 2. D ộc lậ p dữ liệu m ửc logic là kha năng thay đôi sơ dồ logic m ả không dẫn đén c ả c ch ư ơ iìg trình ứiìíì dụng phai ^'icl lại C ác th ay dôi tại m ứ c lo^ic lá cần thiết b ất kc khi nào cấu im c logic cua cơ so dừ hẻu b | sư a dôi. Vi d ụ . khi các tài khoan Iicn tệ chứ ng khoán d ư a c thcm \ ào hệ llìống N g ân hang. Đ ộ c lâp d ữ liệu m ứ c logic là khó dạt dirơc hơn so \ ớ i độc lập d ữ liệu m ức vậl lý do các ch ư ơ n g trinh ứng dụỉìg phu thuỏc nhiều vảo cẩu trú c logic c u a dữ liộu mà h ọ đang lru>' nhập. K hải niệm dỏc láp dữ liệu là tươĩig tụ \ ớ i khái niệm các kicu dù liộu Irừu tưcmg Irong các ngỏii n g ữ lập trình hiện đại C a hai m ứ c độc lâp d ử liộu đcu cố gắtìg chc dấu c á c clìi liốt cài dăl dổJ \ ở i những ngư ờ i sư dụng, cho plicp những người sư dụng lập iru n g vào các cấu irúc lông q u ái cliứ k h ô n g phai các chi uếl cài đ ăl m ú c Lhấp. /. 2 .2 2. C ác nỊỊôn c ơ s à d ừ Ììệĩi M ột hc c ơ sơ d ữ liệu cung cẩp hai kicu ngôn ngữ k hác nhau: m ột ngôn ngữ đ à c la sơ d ồ c ơ so d ữ liêu \ à m ôi ngôn ỉ\gũ biêu diễn các Iruy ^'an và các câp nhại c ơ s ơ dử liệu. • N gôn ngữ dịnlì nghĩa dữ liệu {D ala-D cnni(ion L an g u ag e - D D L ) M ột s a đ ồ c ơ sơ đữ liệu dậc la bơi m ộl tâ p các dịnh nghĩa đ ư ợ c b ícu diễn bơi m ội ngôn n g ữ đ ặc biộl d ư ợ c gọi là ngỏn ngữ dịnh n g h ĩa d u liệu. K ct q u à cùa việc dịch c á c lẹrửì c ủ a ngôn ngữ này là m ột tập các bang d ư ợ c lưu Irữ trong m ội tộp đặc b iêt d ư ợ c gọi là từ dicn dử licu h a\ thư m ục dù liộu. MỘI lừ d i ỗ n d ữ liệ u là m ô l lộp c h ú a các SICU d ữ liệ u c ó n g h ĩ a lả c á c d ữ liệ u vế dũ liệu. T cp này đ ư ợ c tra cứ u irư ớc khi dữ liêu ih ư c sự d ư ợ c dọc h ay d ư ợ c sư a dòi tro n g h ẻ cơ sỡ d ữ liỘLi. C ấu trú c lư u irữ và c ả c phươtig pháp truy n h ập đ ư ợ c sư dụng b ờ i m ộ t hộ cơ s ơ dữ liệu đư ợ c đặc lá bơi m ột tậ p các định nghĩa Irong m ột kiêu d ặc b iệ t cu a D D L là ngôn n g ữ định nghĩa vả lưu trử dữ liộu. K ét q u a c ú a việc dịch c á c dịnh 15 ng h ĩa nàv là m ột tậ p các chì ihỊ đặc ià các chi tiểt cài dặt cua c ơ sơ d ữ liộu, các chi tiết này th ư ờ n g đ ư ợ c ch e dẩu đối với những người sử dụng. • N g ô n n g ữ th ao tá c dừ liệu (D ala-M an ip u latio n L an g u ag c • D M L ) C ác m ứ c irù u tu ợ n g m ả ch ú n g la đà thào luân Irong phần irư ớ c không chí áp dụng dồi VỚI định n g h ĩa và c ấ u trúc dữ liệu m á đối với c ả th ao tá c dữ liệu. C ác yẽu cầu th ao tác d ữ liệu b ao gổm: T ìm kiếm th ô n g tin đ ư ợ c lưu trữ trong c ơ sơ dữ liệu. T h êm ih ô n g tin mới vào cơ sờ dữ liêu X o á th ô n g tin từ c ơ sớ d ữ liệu. T h ay đối th ô n g lin đ ư ợ c lưu ư ũ irong cơ sơ dữ liộu. T ại m ứ c v ậ l lý , chúng ta phài xác định các th u ậ t toán cho p h é p truy nhập d ữ liêu m ột cách hiệu quá. T ại c á c m ứ c cao hơ n cũ a sự trừ u tư ợ n g h o á , chúng ta n h ẩn m ạn h vào lín h dề sừ dụng. M ụ c đích cù a nó là cung c ấ p sự tư o n g tác cù a con ngư ời đối v ớ i hệ th ố n g m ột cách thuận tiện, M ội ngôn n g ừ th ao tá c dữ liệu (D M L ) ià m ộl ngôn ngữ cho p h é p những ngư ờ i sừ dụng tn iy n h ập hay ih ao tác d ừ liệu được lổ chứ c bởi m ột m ô hình dữ iiệu Uiích hợp. C ó hai kiéu ngôn n g ữ th ao tảc dữ liệu cơ ban. • C ác D M L thủ lục đòi hòi m ột người sử d ụ n g phái đ ạc là đ ử liệu nào cần tim k iếm v ả tim kiếm những dữ liộu n ày như thể nào. • C ác D M L phi thủ tục đ ò i hỏi m ỏi người sừ dụng đ ặ c ta d ữ liệu nào cẩn tim k iếm m à k h ô n g phái đặc tả tim kiếm những d ữ liệu này n h ư thế nào. C á c D M L phi thủ tục thư ờ n g dề học và dễ sư đụng hơn so VỚI các D M L thủ tục. T u y ĩìhiên, do m ọt n g ư ờ i sử dụng không phái đặc tá tim k iểm các dữ liêu n h ư thế n ào , c á c ngôn ngữ nảy có thê sinh ra c á c đoạn m ã k h ô n g hiệu quá ỉ>u với đoạn m ã đ ư ợ c sinh ra b ở i các ngôn ngữ thủ rục. C h ú n g ta c ó thể k h ẳc phục vấn đ è n ày th ô n g q u a c ả c kỹ th u ật x ừ lý v à tối ư u h o á câu hòi k h á c nhau. M ộl tru y v an là m ột chì th ị yêu cầu tim kiểm th ô n g tin. C ác lện h cu a m ộl D M L k ẻo theo tim kiém thông tin đ ư ợ c gọi là ngôn ngử tru y vấn, M ạ c dù vể kỹ thuật là k h ô n g đ ú n g dan , trong th ự c hành, các thuậl ngữ ngôn n g ữ tru v vấn và ngôn n g ữ th ao tác d ữ iiẹu d ư ợ c xem là như nhau. 1.2.2.3. X ừ lý câ u hỏi C ô n g v iệ c c ù a b ộ x ử lý c â u hòi là biến đồi m ột tru y vấn h ay m ộ t th a o tác c ơ s à d ữ liêu c ó th ế d u ợ c b iểu d iễn tạ i m ột m ứ c rất c a o (vi dụ n h ư b iể u diỗn bời m ột D M L nào đ ó ) th án h m ột d ăy các yêu cầu đổi VỚI các d ữ liệu d ư ợ c lưu Irữ tro T ìg 16 c ơ sờ dữ liệu. T h ư ở n g p h ẩn khó nhát c u a nhiệm vụ xư lý c â u h o ỉ là tối ư u hóa c â u hòi, có n g h ĩ lá lự a chọn m ột ké hoạch ihự c hiện lồt n h ất h ay tự a chọn m ọl d ã v c á c y êu c ầ u đổi vớ i hc thống lưu Irữ đô ira lời tru y v ẩn n ày nhanh nhất. C ác tru y vẩn phứ c lạp th ư ờ n g cho phép chúng ta sẳ p x ếp lại trinh tự c á c phép toán v à có thê c ó m ọt số lớn các kể hoạch thuc hiẻn cỏ th ế, th ư ờ n g có thố sồ kế hoạch lá hàm sổ mũ đổi với kich thư ớc c u a câu hoỉ. 1.2.2.4. Q uán trị g ia o dịch T h ô n g thưcm g m ột số thao tác Irên cơ sò d ữ liệu hinh ihảnh m ột đ ơn vị iogic côĩìg việc đ ơ n nhất. Đ iều này có nghĩa là hoặc tấ l cá các thao tá c d ó được thự c hiện noặc k h ô n g m ột thao tàc nào được thực hiẻn. rh ê m vào đ o , sư thực hiện c u a các th a o tác này phai đàm báo lính nhất quán cù a c ơ sờ dư liệu. C ác hộ quàn trị c ơ s ở d ữ liệu điến hinh cho phép m ột n g ư ờ i sừ dụng nhóm m ộ t hay nhiều th ao lác rra cứ u hay thay đổ! c ơ sờ dữ liệu ih àn h m ột g ia o dịch. M ột g iao dịch lá m ột tâ p các th ao tá c m à đ ư ợ c x ừ lý như m ột d ơ n v ị k h ô n g ch ia c ắ t Sự đ ảm b ao tính ch ất n ày là trảc h nhiậm cùa th ản h phần q u ản trị g ia o được. dịch. T hư ờ ng m ọt hệ cơ sờ d ữ liộu cho p h ép nhiều giao d ịch th ự c hiện đồng thời. M ột số các c ơ s ớ d ữ liệu lớn tới m ứ c ch ú ng chi có ích khi ch ú n g d ư ợ c th ao lác đồng thời bơi tihiểu n g ư ờ i sử dụng. K hi m ộl sổ giao d ịch th ay dồi cơ s ờ dữ liệu dồng thời, tính n h ấl q u án dữ liệu có ihể khống còn đ ư ợ c đám b áo . th ậm chi ngay cà khi m ồi giao d ịch c á thể d ư ợ c th ự c hiện đúng đắn, Đ ẳy là trách nhiệm củ a bộ quàn lý diều khiển tư ơ n g tran h diểu khiến sự tư ơ ng tá c g iữ a c á c g iao dich đồng ihời đàm b ào lính n h ất quản củ a cơ sờ d ữ liệu. K hí c á c lồi hệ th ố n g x à y ra , m ột g iao dịch c h u a hoàn (hành không d ư ợ c ánh hưởng dến trạn g ih ải cú a c ơ sớ dữ liệu. D o vậy, c ơ sờ d ữ iiệu nảy phải đ ư ợ c phuc hoi đ én trạn g thái trư ớ c khi giao dịch nảy b ắl dầu th ự c hiện. T rá c h nhiệm cu a hộ c ơ s ớ d ữ liệu ià dò Um c á c lỗi hộ thống và phục hồi c ơ sờ d ữ liệu đến írạn g thái trư ớc khi x u ấ l hiện lỗi này. C ác hệ c ơ s ở d ữ liệu d u ợ c th iết k ế ư ẻn cảc m áy lín h c á nhân nhò cỏ thổ không có tal cà c á c d ặ c linh này. Vi (lụ, nhícu hộ ih o n g nhò h ạ n ch ế chi m ộl ngư ời sử dụng đ ư ợ c phóp iru y nhập cơ sớ dữ liệu tạ i m ỗt thờ i diếm . M ột số hệ khác xem nhiệm v ụ sa o lư u và phục hồi là nhiệm \TJ c ủ a ngư ờ i s ừ dụng. M ạ c dù c ác h liếp cận n h ư v ậy lá đú đồi với c ả c cơ sờ dữ liệu c ả n h ân n h ư n g nó se không thích hợp đe đ áp ử n g c á c yêu c ầ u c ù a các xí nghiệp v ừ a và lớn. 1 .2 .2 . 5. Q u ả n lý l u v trừ C ác c ơ sở d ữ liệu th ư ò n g đ ò i hỏi m ột khối lư ợ n g lớ n không g ian lư u trữ. C á c cơ sỡ dữ iiẽu h ợ p nhất th u ờ n g đư ợ c đo trong th u ạ t n g ữ c ù a g ig ab y tes hay v ới các cơ sờ d ữ liệu lớ n là terab y tes. D o bộ nhớ ch in h cú a m áy tính k h ò n g the 17 lưu Irír nhiều ih ỏ n g tin n h ư vậy, c á c Ihông lin này dược lưu irủ irôn c á c ihicl bị nhớ ngoài như c á c đ ĩa từ , b ăn g từ... D ữ iiộu divơc chu>cn g iữ a đ ĩa lừ v à b ộ nhở chinh là cần Ihiél. Sự di chuycn d ữ liộu này ]á khá chậm so vòi lốc d ộ c u a bộ xir lý iru n g lâm , d o vậy các hộ c ơ sơ dữ liệu phai lò chứ c dữ liêu v ậi l\ sa o ch o tỏi ihicu h o á $0 y ê u cầu ch u y ên đ ữ liêu g iữ a đĩa tử và bộ nl\ớ chinh M ục dích cu a m ột hệ cơ sơ dữ liệu là đơn gian hoá vả tạ o d ic u k iện thiỉận lơi đé tru y nhập đến dữ liệu. C ác khung nhin inúc c a o g iú p d ạl d ư ợ c niục đich này. N h ữ n g ngư ờ i sử dụng cu a hộ thống không can thiốl phai b ic l c á c chi ú ct lưu trữ \ ậ l lý dối với sự cải đ ật cu a hộ thống. Tuy tìlìicn. m ội Iiháa tố c h in h irong hài lòn g cua ngư ời sử dung đối VỚI n iộl hộ c ơ sơ dữ hộu là h iệu n ă n g cu a hộ thõng. N cu thời g ian dáp ứ ng đối với m ột vỗu câu là quá lâu, g ỉả trị c u a hệ ihong sõ bị g iàm SÚI. H iệu n ăn g cu a inội hệ ihổng phụ thuộc vào c á c c ấ u tr\ic dữ liệu đ ư ợ c sử d ụ n g b icu d iễn dừ liệu trong cơ sơ dừ liộu có hiộu q u á k h ỏ n g \ à hộ thống có kha n ăn g th ao tá c trên các c ấ u trúc d ữ liệu này m ột c ác h h iệu q u a nhu the nào. B ộ quan lỷ lưu trữ là m ội m òdun chương iriiih cung c ấ p g ia o d iẹ n g iừ a các dữ liệu đirợc lưu trừ tro n g cơ sơ d ữ liệu m ứ c thấp \ à các ch ư ơ n g irin h ứ n g dụng hay c ả c iru y v ấn đ ư ợ c d ê trinh đ ố i vớ i hệ ihống. Bộ quan Iv lưu i n ì c ó Irách nhiộm tucm g tác vớ i bộ quan lý lộp. D ữ liệu thô đ ư ợ c lưu trữ trô n đ ĩa từ sư dụng hẹ thống x ử iý tệ p thưcm g đ ư ợ c cung cấp b ời m ột hệ điều hành n ào d ỏ . B ò quan lý lư u trừ dịch các lộnh c u a ngôn n g ừ D M L k hác nhau thành c á c lệ n h hộ Uiong xừ lý tệ p ở m ứ c thấp. D o vậy , b ộ quán lý lu u trữ có trách nhiộm lư u trừ , tim kicm v à cập n h ật d ũ liệu ư o n g cơ sơ d ữ liệu nả}'. 1.2.3. K iến trú c củ a m ột h ệ quản trị c ơ s ớ dS* liệu T ro n g p h ần này , chủng ta se phác thao kiển trú c c u a m ột hộ q u á n trị c ơ sơ d ữ liệu dién hinh. C h ù n g la cũng sỗ nhin ihay cách Ihức m ột hệ q u a n iri c ơ sơ dữ liộu x ử lý c á c c â u hòi v à các th ao lác khác đồi \ Ớ1 cơ sơ d ữ liộu. C ô n g nghệ dối VỚI việc cài đ ặl m ột hệ quàn trị c ơ sơ d ừ liệu klìông thuộc p h ạm v i c u a cuốn sách này. H ơn n ữ a , ch ú n g ta chí lậ p trung vào vấn đ ể c á c c ơ s ở d ữ liộu đu ợ c th iết kế và đ ư ợ c s ử dụng m ộ t cách hiệu quá như thể ỉiào. H in h 1,3 chi r a c á c thành phần chu yếu c u a m ọt hệ quan trị c ơ s ớ d ữ liệu. T ại đ áy c ủ a kiển ưúCy ch ú n g la nhin thấ>' m ột sự bicu diễn c u a th iế t b ị n h ớ ngoài (th eo qui ư ớ c, th iếl bị n hớ ngoải ờ dây lả cả c đĩa từ) lưu irữ c ả c dũ liệ u vả SICU d ữ liệu. C hú ý rằn g thành phần n ày ch ử a không chỉ các dữ licu d ư ợ c ỉưu irữ trong c ơ sở d ữ liệu m à cả c á c siẻu d ữ liệu, tứ c là các ih ô n g tíii vè c ấ u irú c cu a cơ s ơ d ữ Hệu. Ví đ ụ , nếu m ột hộ quan irị cơ sơ dữ !iệu là !iệ q u an tn c ơ s ơ d ữ licu q u an hẹ, c á c siêu d ữ liệu b ao gồm tên c u a các quan hệ. lên c á c th u ộ c lính cua 18 các q u an hộ v à c á c kicii dữ liệu dồi với các tlìuộc lính này. T h ô n g tỉìirờiìg. m ột hộ q u an trị c ơ s ơ d ữ liệu bcio tri niộl sé clìi dẫn đối với dữ liệu. MỘI chi dẫn là m ọt c ấ u tn ic d ữ liệu g iíip clìo viộc tim kiồm c á c klìoan m ục d ữ liộii m ộl cách Iilianh c h ó n g vớ i các điêu kiộn clio ta rớ c, MỘI \ í dụ chiuìg nhất là m ội chi dan cho p h ép tim kiổm c á c bộ cu a m ột quan hộ vớ i m ột g iá Irị cho irirớc đối với mội trong c á c tlìiiỏc lính cu a quaiì hệ. C ác chi dẫn là m ột phần c u a du liệu lưu trữ ^'à sự m ò la c á c th u ộ c líiili nào đ ư ợ c chì dần lá m ộ t phần cu a các siêu d ữ ỉiệu. C ác thav dòi sơ dồ C ác (hav đòi d ừ liêu H ình 1.3: C á c th ành phần chính củ a m ộ t h ệ quán trị c ơ s ớ d ư liệu T rong hinli 1.3. ch ú n g ta cung tilùn ih ấy m ột b ộ quan lý lưu trữ m à lìhiẹni vụ c u a nó là lấ> ni c á c llìôiig tin đ ư ợ c yêu c ẩ u tìr lìlìững ihiết bị lưu Irù d ữ liệu v à lha> dôi Iiliững th ô n g tin này khi dư ợ c y èu cầu bơi các m ứ c trẻ lì nó cu a hệ ihỏng, C hú n g ta cũ n g ti]ìin Iháy IIIỘI thành p h an diiợ c gọi là bộ XIT lý câu lioi m ặc dù lẻ n gọi n ày là kliỏiig lìoàn loàn chính xác, B ộ x ư lý c â u hoi đicu klìièn k h ô n g chi c á c c â u hoi m à cà cảc )'êu c ầ u th ay đôi d u liệu hav siêu dữ liệu. N hiệm vụ c u a lìó là lim ra m ọt cách tối n h ất luộl thao tác đ ư ợ c y êu cầu và phát ra c á c lộnh đổi v ới bộ quan lỷ liru Irữ đê thự c thi th ao lác đỏ. llià n h p h ần bộ q u an trị g iao dịch cỏ trác h Iiliiệm đam b ao tíixli loàn vẹn cua hộ tlìổng này. N ó phai dam b ao rằn g n iộ l sổ th ao lác tlìực liiộn dổng thời kh ông can trơ inỗi th ao lác k h ác \ à hệ thống sẽ không m ấl dữ liệu tlìậni chí khi lỗi hệ ihống \ ã \ ra. N ó lư ơiig tác với bộ x ư lý cắii lìòi, do vậy nỏ phai b iếl dữ liệu tiào đ ư ợ c tliao tác bơi các độn g và lìỏ có th ê c ầ n tliiểl làin i]\ẵ0 lá c hiện thời d ẻ tráỉili sự dụiìg đ ộ các hành trề m ột sổ tru\* v ấn rủ)ầi dịnlì Kay m ội sổ th ao lác cập n h ật đê c á c đụ]\g đ ò n ày k h ô n g \ ã y ra, N ó tiỉơitg tác với bộ quãii Iv lưu trữ 19
- Xem thêm -