Đăng ký Đăng nhập
Trang chủ Giáo dục - Đào tạo Cao đẳng - Đại học Đại cương Toán học trong hoạt động thư viện thông tin...

Tài liệu Toán học trong hoạt động thư viện thông tin

.PDF
319
314
73

Mô tả:

fU r - T R Ư Ờ N G ĐẠI HỌC VÃN HOÁ HÀ NỘI Đ O À N PHAN TÂN TOAN TRƯỜNG ĐẠI HỌC VẢN HÓA HÀ NỘI PGS.TS. ĐOÀN p h a n T â n TOÁN HỌC • TRONG HOẠT • ĐỘNG • THƯ VIỆN - THÔNG TIN (Giáo trình dành cho sinh viển Đai hoc và Cao đẳng ngành thư viên - thông tin và quin trị thông tín) NHÀ XUẤT BẢN ĐẠI HỌC QUỐC GIA HÀ NỘI MỤC LỤC LỜI NÓI Đ Ầ U ........................................................................................... 7 Chương 1........................................................................................................ 11 NGON NGỮ CỦA TOÁN HỌC VÀ PHƯƠNG PHÁP BIẾU DIỄN THÔNG TIN ............................ềỂ...............................................................11 1.1. Lý thuyết tập hợp...................................................................... 11 1.1.1. Khái niệm tập hợp và phương pháp biêu diễn tập hợp ,ẽ.................... ............*......ệ.....................ệ„.................................*....... 11 1.1.2. Biếu diễn các mẫu tìm bằng ngôn ngữ của lý thuyết tập hợp........................................................................................15 1.1.3. Quan hệ bao hàm, tập con............................................... 16 1.1.4. Phương pháp xác định quan hệ ngữ nghĩa giữa các từ chuẩn....................................................................................20 1.1.5. Các phép toán trên tập hợp.............................................23 1.1.6. ứng dụng cùa phép toán tập họp trong tìm tin và đánh giá hiệu quả tìm tin................................................. 29 1.1.7. Phân hoạch của một tập h ọ p .......................................... 32 1.2. Quan hệ........................................................................................ 34 1.2.1. Tích Đề - các của các tập hợp..........................................34 1.2.2. Quan hệ hai ngôi và nguyên tắc lưu trữ thông tin..... 38 1.2.3ỖQuan hệ n - ngôi và cơ sờ dữ liệu quan h ệ...................43 1.2.4. Các tính châ't cùa quan hệ hai ngôi trên một tập hữu hạn........................................................................................ 46 1.2.5. Quan hệ tương đương -Quần hệ dùng đê phân lớp các tập hợp................................................................................50 1.2.6. Quan hệ thứ tự - Quan hệ dùng để sắp thứ tự các tập họp........................................................................................ 56 1.2.7. Cấu trúc toán học của các hệ thống phân loại............. 59 1.3ềÁnh sáng........................................,,............................................ 63 1.3.1. Khái niệm về ánh xạ..................... ................................... 63 1.3.2. Một số ví dụ về ánh xạ.....................................................68 1.3.3. Sự tương ứng một - một và các phương tiện lưu trữ thông tin.............................................................................. 70 1.3.4. Ánh xạ đặc trưng và phương pháp biểu diễn tập hợp bằng mã nhị phân............................................................ 76 1.3.5. Khoảng cách Hamming và độ gần................................78 1.4. Phương pháp đếm .................................................................... 80 1.4.1. Các quy tắc đếm................................................................ 80 1.4.2. Hoán vị và chinh hợ p ...................................................... 85 1.4.3. Chinh hợp lặp và cách tính khả năng mã hoá của một SÔ hệ mã chuấn quốc tê....................................................88 1.4.4. Đếm các tập con của một tập hợp: các tổ hợp............. 92 1.4.5. Công thức Pascal và định lý nhị thức............................95 1.5. Hệ đếm nhị phân..................................................................... 101 1.5.1. Sô' nhị phân và sô' thập phân.........................................101 1.5.2. Phép cộng và phép trừ các sô' nhị phân..................... 106 BÀI TẬP CHƯƠNG 1..................................................... .......................... 109 1.1. Tập hợp......................................................................................109 1.2. Quan hệ......................................................................................113 1.3. Ánh xạ........................................................................................118 1.4. Phương pháp đếm .................................................................. 121 1.5. Hệ đếm nhị phân..................................................................... 124 Chương 2 ..................................................................................................... 125 LOGIC VÀ CÁC HỆ THỐNG TÌM TIN T ự ĐỘNG HÓA.......... 125 2.1. Logic mệnh đ ề ......................................................................... 125 2.1.1. Phán đoán và mệnh đ ể ............ ..................................... 125 2.1.2. Các phép toán mệnh đ ề................................................. 127 2.1.3. Biểu thức logic và tương đương logic..... ...................134 2.1.4. Các luật logic.......................................... .........................139 2.1.5. Các quy tắc suy diễn trong logic mệnh đ ề ................ 143 22. Quan hệ giữa logic và tập hợp..............................................152 2.3. ứng dụng của logic mệnh đề trong các hệ thống tìm tin tự động hóa..................................................................................... 156 2.3.1. Hệ thông tìm tin tự động hoá.......................................156 Ạ/ 1 Ạ 4 1 Ạk> A' ẵ Ạ/ o o 2.3.2. Phương thức tìm tin cơ bản...........................................158 2.3.3. Mô phỏng quá trình tìm tin trên máy tính................ 161 BÀI TẬP CHƯƠNG 2 ......................................................................... 165 2.1. Logic mệnh đề.......................................................................... 165 2.2. ứng dụng cùa logic mệnh đê' trong các hệ thống tìm tin tự động hóa....................................................................................168 Chương 3...................................................................................................... 170 ĐẠI SỐ BOOLE VÀ CÁC MẠCH TỔ H Ợ P....................................170 3.1. Đại SỐ Boole...............................................................................170 3.1.1. Biến nhị phân và các phép toán Booĩe.........................170 3.1.2. Tính chât của các phép toán Boole...............................174 3.1.3. Biểu thức Boole và hàm Boole......................................175 3.2. Các mạch tổng h ợ p ................................................................. 178 3.2.1. Các cổng logic.................................................................. 178 3.2.2. Các mạch tô hợp............................................................. 179 3.2.3. Mạch logic cùa phép cộng hai sô'nhị phân................ 183 BÀI TẬP CHƯƠNG 3 ........ *............ệ.ệể„.............................................185 3.1. Đại sốboole.............................................................................. 185 3.2. Các mạch tô hợp...................................................................... 186 Chương 4...................................................................................................... 188 THỐNG KÊ TOÁN H ỌC................................................................... 188 4.1. Phương pháp trình bày và đánh giá các kết quà thực nghiệm.............................................................................................. 188 4.1.1. Khái niệm mờ đầu..........................................................188 4.1.2. Phương pháp trình bày số liệu.....................................191 4.1.3. Phương pháp thu gọn sô'liệu........................................202 Phương sai và độ lệch chuẩn..................................................209 4.2. Một sô'khái niệm cơ bản của lý thuyết xác suâ't................ 213 4.2.1. Khái niệm xác suất và đơn vị thông tin...................... 213 4.2.2. Biến ngẫu nhiên và quy luật phân phối xác suâ't của một biến ngẫu nhiên rời rạc. Entropy và thông tin ...223 4.2.3. Quy luật phân phối nhị thức........................................230 4.2.4. Phân phối xác suất cùa biến ngẫu nhiên liên tục. Quv luật phân phôi chuẩn...................................................... 233 4.2.5. Định lý giới hạn trung tâm............................................242 4.3. Phương pháp điều tra chọn mẫu..........................................245 5 4.3.1. Khái niệm mờ đầu..........................................................245 4.3.2. ước lượng ti lệ cấu thành..............................................248 4.3.3. Ước lượng giá trị trung bình.........................................255 BÀI TẬP CHƯƠNG 4 ......................................................................... 261 4.1. Phương pháp trình bày và đánh giá các kết quà thực nghiệm ...................................................................... ...............261 4.2. Một sô' khái niệm cơ bàn cùa lý thuyết xác suâ't................ 266 4.3. Phương pháp điểu tra chọn mẫu..........................................268 HƯỚNG DẪN VÀ TRẢ LỜI MỘT SỐ BÀI TẬP...........................270 Chương 1 .....................................................................................................270 1.1. Tập hợp......................................................................................270 1.2. Quan hệ..................................................................................... 275 1.3. Ánh xạ........................................................................................279 1.4. Phương pháp đếm .................................................................. 282 1.5. Hệ đếm nhị phân..................................................................... 290 Chương 2 .....................................................................................................291 2.1. Logic mệnh đ ề ......................................................................... 291 2.3. ứng dụng cùa logic mệnh đê trong các hệ thống tìm tự động hóạ..........................................................................................294 Chương 3 .....................................................................................................296 3.1. Đại sôboole...............................................................................296 3.2. Các mạch tổ hợp...................................................................... 298 Chương 4 .....................................................................................................300 4.1. Phương pháp trình bày và đánh giá các kết quà thực nghiệm (thống kê mô tà)............................................................... 300 4.2. Một sô' khái niệm co bàn của lý thuyết xác suât................ 306 4.3. Phương pháp điểu tra chọn mẫu.......................................... 313 PHỤ LỤC........ *.............................ềẾ.....................317 TÀI LIỆU THAM KHẢO.....................................................................318 6 LỜI NÓI ĐẦU Khoa học ngày càng phát triển thì sự phân chia khoa học ra các ngành nhò ngày càng sâu sắc. Mặt khác, do sự phát triển của khoa học mà nhiều ngành có thể áp dụng phương pháp và thành tựu của nhau để giải quyê't các vân để của mình. Trong xu hướng đó, đặc biệt nổi lên vai trò của Toán học. Các phương pháp cùa toán học không chỉ dùng trong các ngành vật lý và cơ học mà đã trờ thành phương pháp chung của rất nhiểu ngành khoa học khác, kê cả các ngành khoa học xã hội và nhân văn. Việc ứng dụng các phương pháp toán học trong hoạt động thư viện - thông tin không có gì là mới mé, đặc biệt ờ các nước có nền khoa học phát triển. Ngày nay, cùng vói những biêí. đổi sâu sắc trong kỹ thuật xử lý thông tin, sụ xâm nhập cùa tin học vào tâ't cả các lĩnh vực hoạt động của con người, hoạt động thư viện ngày càng gắn với hoạt động thông tin và đang trong quá trình tin học hoá thì việc trang bị các kiên thức toán học caờ câ'p hiện đại cho sinh viên ngành Thư viện - Thông tin ngày càng trờ thành một nhu cầu câp bách. Xuất phát từ yêu cẩu thực tiễn đó, từ năm 1976, bộ môn Toán của trường Dại học Văn hoá Hà Nội đã được giao nhiệm vụ xây dựng chương trình và triển khai giảng dạy môn Toán cao câ'p ứng dụng cho sinh viên ngành Thư viện - Thông tin. Năm 2004, Hội đổng chương trình ngành Thư viện - Thông tin truòng Dại học Văn hoá Hà Nội đã biên soạn bộ chưong trình 7 mới, trong đó vẫn khẳng định "Toán học trong hoạt động Thư viện - Thông tin" là một môn học cơ sở của ngành. Tuy nhiên, nội dung chương trình cần được biên soạn lại sao cho phù hợp hom với yêu cầu mới và sự phát triển của thực tiễn. Giáo trình "Toán học trong hoạt động thư viện - thông tin" được biên soạn lẩn này là theo yêu cẩu của chương trình mới, có kế thừa giáo trình "M ột số phương pháp toán học trong công tác thư viện - thông tin" của tác giả, xuâ't bản năm 1992, nhưng với nội dung cập nhật, tinh hơn và thiết thực hơn. Mục tiêu của giáo trình là trang bị cho sinh viên những kiến thức cơ bản của toán học ròi rạc và thống kê toán học, tập trung vào những nội dung và phương pháp thường dùng trong việc mô tả thông tin, xử lý thông tin, xử lý dữ liệu, xử lý s ố liệu được áp dụng trong thực tiễn của hoạt động thư viện - thông tin, hoặc làm sáng tỏ những vân đê' lý luận và phương pháp luận của thư viện học và thông tin học, đặc biệt trong điều kiện tin học hoá. Nội dung cùa giáo trình gồm bốn phần: - Ngôn ngữ của toán học và phương pháp biểu diễn thông tin, bao gồm: Lý thuyết tập hợp, quan hệ, ánh xạ, phương pháp đêm và hệ đêm nhị phân. - Logic và các hệ thống tìm tin tự động hóa, bao gồm: Logic mệnh để, quan hệ giữa tập hợp và logic, ứng dụng của logic trong các hệ thống tìm tin tự động hoá. - Đại sô Boole và các mạch tô họp bao gồm: Đại s ố Boole, tính chât cùa đại sô Boole, các mạch tô hợp, mạch logic của phép cộng hai số nhị phân. - Thông kê toán học, bao gồm: Phương pháp trình bày và đánh giá các kết quả thực nghiệm (Thống kê mô tả), một số khái niệm cơ bản của lý thuyêí xác suất, phương pháp điều tra chọn mẫu (Ước lượng thống kê). 8 Thông qua chương trình, sinh viên sẽ biết vận dụng ngôn ngữ của lý thuyết tập hợp để mô tả thông tin trong các mẫu tìm và thực hiện tìm tin trên các mẫu tìm đó bằng các phép toán tập hợp, dùng quan hệ tập con đê’ xác định quan hệ ngữ nghĩa giữa các từ chuẩn. Lý thuyết về quan hệ giúp sinh viên hiểu rõ hon nguyên tắc lưu trữ thông tin, câu trúc của ngôn ngữ tu liệu và mô hình cơ sờ dữ liệu quan hệ. Sự tương ứng một - một trong ánh xạ là nguyên tắc chung của các phương tiện lưu trữ thông tin. Ánh xạ đặc trung cho phép mã hoá các tập hợp bằng mã nhị phân. Phương pháp đếm cung câ'p các công thức tính khả năng mã hoá của các hệ mã dùng trong hoạt động thư viện - thông tin. Kiến thức về logic giúp sinh viên hiểu được bản châ't của quá trình tìm tin trong các hệ thống tìm tin tự động hoá, từ đó biết sử dụng các toán tủ' logic viết đúng những biểu thức tìm mô tả những yêu cẩu tìm tin phức hợp. Hệ đếm nhị phân và đại sô' Boole là cơ sở toán học và logic cùa máy tính điện từ, giúp sinh viên hiểu được vì sao máy tính có thế thực hiện được các phép toán số học và các phép toán tập hợp trên các mẫu tìm khi tìm tin. Các phương pháp thống kê mô tà và phương pháp điều tra chọn mẫu cung câ'p cho sinh viên nhũng phương pháp khoa học để điều tra đánh giá hiệu quà công tác phục vụ ngưòi đọc, hiệu quả của các sàn phấm và dịch vụ thông tin. Một số khái niệm về xác suâ't được đua vào giáo trình vói dung lượng vừa đù làm cơ sờ lý thuyết cho các ước lưọng thống kê, cũng giúp sinh viên hiếu rõ hon khái niệm vê đon vị đo thông tin (bit) và các công thức tính số lượng thông tin do E. Shanon đua ra trong lý thuyết thông tin. Ngoài ra những kiến thức về toán ròi rạc cũng giúp sinh viên có điều kiện tốt hon đê tiếp thu môn tin học. Giáo trình được trình bày một cách cơ bản, hệ thông vói tinh thần tinh giàn tối đa về lý thuyết đế phù họp với sinh viên ngành khoa học xã hội, đổng thòi có nhiều ví dụ minh họa được lấy tù thực tiễn của hoạt động thư viện - thông tin. Cuối mỗi chưong đều có một số bài tập chọn lọc, kèm theo hướng dẫn và lòi giai, giúp 9 sinh viên cùng cô' thêm lý thuyết. Một sô' mô hình đưa ra trong giáo trình cũng là kết quà nghiên cứu cùa tác giả, qua nhiều năm giang dạy và nghiên cứu khả năng ứng dụng của toán học và tin học trong hoạt động thu viện - thông tin ờ trường Đại học Văn hoá Hà Nội. Chúng tôi hy vọng giáo trình này sẽ giúp ích cho nhũng nguòi làm công tác giàng dạy và sinh viên ngành thư viện - thông tin, đổng thời cũng có thế là tài liệu tham khảo cho cán bộ hoạt động trong một số ngành khoa học xã hội khác. Vì khà năng và thời gian có hạn, cuốn sách khó tránh khòi các thiếu sót. Chúng tôi mong được sự đóng góp ý kiến cùa đổng nghiệp và bạn đọc gần xa. Tác giả 10 Chương 1 NGÔN NGỮ CỦA TOÁN HỌC VÀ PHƯƠNG PHÁP BIÊU DIỄN THÔNG TIN 1.1 . LÝ THUYẾT TẬP HỢP Vào cuối thế ký XIX, Georg Cantor (1845-191S) lân đấu tiên đã nhận ra giá trị tiếm ẩn cua việc phát hiện ra nhũns; tính chất chung cua tập họp, khi tách nó khoi các tính chất của phấn tu tạo thành chúniỊ. N vịìiv nav lý thuyết tập họp trừu tuọng đu ọc xem là co so cua tu duy toán học. Mọi đỏi tuọng cua toán học, kè cà các số, đeu có thê xem xét trong khuôn khỏ cua các tập họp, và nt;ón ngữ cua lý thuyết tập họp đuợc su dụng đê xây dụng eo so logic cho nhiêu ngành toán học khác nhau. Trong phàn này ta sẽ đề cập đòn nhũng khái niệm co ban cua lý thuyết tập họp, các phép toán trôn tập họp đong thòi giói thiệu nhũng úng dụng cua chúng trong mô ta thông tin và tìm tin. 1.1.1. Khái niệm tập hợ}t và phiíơitg pháp biếu diễn tập ỉiỢịì Tập họp là một khái niệm co ban cua toán học. Theo gọi V cua Georg Cantor, ta hãy hình dung tập họp nhu là một bộ suu tập các đối tuọng quan sát đuọc. Các đối tượng này gọi là pìiãn tư cua tập họp. Ví dụ: - Tập họp các sô tụ nhiên tù 1 đôn 100. 11 - Tập hợp các cuốn sách của một thư viện. - Tập hợp các từ chuẩn. - Tập hợp các đối tượng có tính chat p nào đó. v.v ... Các tập hợp thường được ký hiệu bằng các chữ cái viết hoa: A, B, C, X, Y, Z, ... Các phần tử của tập hợp thường được ký hiệu bằng chữ thường: a, b, c, . . X, y, z,... Tập hợp được tạo thành bởi các phần tử. Giả sử E là một tập họp. Để chỉ phẩn tử a thuộc tập hợp E, ta ký hiệu: ae E Nếu a không phải là phần tử của E, tức là a không thuộc E, ta ký hiệu: aỂE Lực lượtig của tập hợp Tập hợp có một số hữu hạn phần tử gọi là tập hĩni hạn. Tập hợp có vô số phần tử gọi là tập vô hạn. Lực lượng của tập họp hay bản số của tập hợp là số các phần tử của tập hợp đó. Lực lượng của tập hợp E ký hiệu là I E I. Sơ đ ổ Veitit d X Hình 1.1.1 Người ta thường biểu diễn tập hợp bằng một đường cong khép kín, gọi là sơ đồ Venn. 12 Trên hình 1.1.1 ta có: a, b, c e E dỂE Phươỉtg pháp biểu diễn tập hợp Có hai phương pháp biểu diễn tập hợp, đó là phương pháp liệt kê và phương pháp xác định các thuộc tính đặc trưng. 1.1.1.1. Phương pháp liệt kê Nếu tập hợp E gồm ba phần tử a, b, c ta viết: E = {a, b, c} Trong cách viết trên thứ tự các phẩn từ không quan trọng và sự lặp lại một phần tử nào đó không làm thay đổi tập hợp, tức là: Ịa, b, c} = {a, c, b) = {a, a, b, c) Ví dụ l ẽGiả sừ Lan, Thu, Hà là ba sinh viên của lớp thư viện, gọi E là tập họp gồm ba sinh viên đó, ta viết: E = {Lan, Thu, Hà} Các tập họp sau đây cùng biểu diễn một tập hợp: {Lan, Thu, Hà} = ỊHà, Lan, Thu}= {Hà, Lan, Thu, Hà, Thu} vì mỗi tập hợp đó đều chỉ gổm ba phần tử, là ba sinh viên Lan, Thu, Hà. Ví dụ 2: Tập họp các ước số dương của 6, ký hiệu là A: A = {1 ,2 , 3, 6} A là tập hữu hạn vói lực lượng là IA I = 4 Ví dụ 3: Tập họp các số tự nhiên, ký hiệu là N: N = {1, 2, 3.........n , ......I N là tập hợp vô hạn. 1.1.12. Phương pháp chỉ rõ thuộc tính dặc trim4» Nếu tập hợp E gồm các phần tù X có tính châ't p ta viết: E = ịx I X có tính chất PỊ Hay gọn hơn: E = {x|Pị Ví dụ: 1) Nêu A là tập hợp các ước số duơng cùa 6 và 13 là tập họp các SỐ dương chẵn, ta viết: A = {xeN I 6 chia hết cho x) B = jxeN |x = 2k, k 6 NỊ 2) Tập hợp các điểm M của đường tròn (C) tâm trong mặt p được xác định bởi: o bán kính r (C) = ỊM eP I OM = rỊ 3) Tập họp D các nghiệm thực cùa phương trinh f(x) = 0 xác định bởi: D = {xeR|f(x) = 0Ị Tập hợp có m ột phần tử vả tập rỗng Tập hợp chi gõm một phần từ a ký hiệu là {a}. Kỷ hiệu (a) là chi tập hợp gổm một phẩn tử a, trong khi đó ký hiệu a là chì chính phần tử a, vì thế: {a} * a Tập hợp không có phần từ nào gọi là tập rỗng hay tập trong, ký hiệu là 0 . Tập rỗng tổn tại cũng nhu sỏ 0 tổn tại. Ví dụ: (x e R |x2 + 1 = O Ị=0 1.1.2. Biếu diễn các mẫu tìm bằng ngôn ngữ c ù a lý thuyêt tập ÌIỢỊÌ Giả sử trong một hệ thống lưu trử và tìm kiếm thông tin, các tài liệu nói về thư viện bao gồm các tài liệu có mã sô 13, 17, 20, 25, 34. Ta ký hiệu: d(Thư viện) = Tập họp các tài liệu nói vê thư viện. Theo cách biểu diễn của lý thuyết tập hợp ta có thê mô tà tập hợp đó như sau: d(Thu viện) = (13, 17, 20, 25, 34} Giả sù ta gọi: d(Trung tâm thông tin) = Tập họp các tài liệu nói vê' các trung tâm thông tin. d(Tự động hoá) = Tập hợp các tài liệu nói vê' tụ động hoá. Tương tự, nếu các tài liệu nói về các trung tâm thông tin là các tài liệu có mã số 11, 17, 25, 22 và các tài liệu nói về tự động hoá là các tài liệu có mã số 13, 17, 22, 35, thì ta có thê mô tả các tập hợp đó nhu sau: d(Trung tâm thông tin) = {11,17, 25, 22( d(Tụ động hoá) = {13,17, 22, 35} Trong các hệ thống lưu trử và tìm kiếm thông tin cua thu viện hoặc trung tàm thông tin tu liệu, các tập họp d(Thu viện), d(Trung tâm thông tin), d(Tụ động hoá) được gọi là các bàng đào. Các bàng đảo có thê là: • Các phiếu lỗ soi. 15 • Các phiếu đơn thuật ngữ. • Các biểu ghi trong tệp đảo của các cơ sở dữ liệu thư mục. Đó là các phương tiện lưu trữ thông tin, đổng thời cũng là các công cụ giúp ta tìm tin, nên chúng còn được gọi là các mẫu tìm. Thực hiện các phép toán tập hợp trên các mẫu tìm, ta có thể tìm được những tài liệu đáp ứng yêu cẩu tìm tin đặt ra. 1.1.3. Quan hệ bao hàm, tập con Một quan hệ cơ bản giữa các tập hợp là quan hệ bao hàm hay quan hệ tập con. Định nghĩa Giả sử A và B là hai tập hợp, ta nói rằng A bao hàm trong B hay A là tập con của B, ký hiệu là A c B, nếu và chỉ nếu mọi phần tử của A đểu là phần từ của B. Ký hiệu: A cB o Vx e A thì X e B Từ định nghĩa ta suy ra tập A không là tập con của tập B, ký hiệu là A 3x sao cho x e A v à x í B Quan hệ A - Xem thêm -

Tài liệu liên quan