Đăng ký Đăng nhập
Trang chủ Nghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu vi...

Tài liệu Nghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu việt nam

.PDF
70
3
72

Mô tả:

.. ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG MA NGỌC KHÁNH NGHIÊN CỨU PHƯƠNG PHÁP RÚT GỌN VĂN BẢN VÀ CHUYỂN ĐỔI CÚ PHÁP NGÔN NGỮ KÝ HIỆU VIỆT NAM Chuyên ngành: Khoa học máy tính Mã số: 8480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS. PHÙNG TRUNG NGHĨA THÁI NGUYÊN, 2018 MỤC LỤC MỞ ĐẦU ........................................................................................................................ 1 CHƯƠNG 1. TỔNG QUAN VỀ NGÔN NGỮ KÝ HIỆU VIỆT NAM ................ 3 1.1. Tổng quan về ngôn ngữ ký hiệu............................................................. 3 1.1.1. Khái niệm ngôn ngữ ký hiệu ........................................................... 3 1.1.2. Đặc điểm ngôn ngữ học của ngôn ngữ ký hiệu .............................. 6 1.1.3. Vai trò của ngôn ngữ kí hiệu với cộng đồng người khiếm thính. ... 8 1.2. Tổng quan về ngôn ngữ ký hiệu Việt Nam ............................................ 9 1.3. Tính rút gọn trong ngôn ngữ ký hiệu Việt Nam .................................. 11 1.4. Trật tự cú pháp trong ngôn ngữ ký hiệu Việt Nam .............................. 12 1.5. Ứng dụng công nghệ thông tin trong dịch ngôn ngữ ký hiệu .............. 13 1.6. Mục tiêu của luận văn. ......................................................................... 15 CHƯƠNG 2. LUẬT RÚT GỌN VĂN BẢN VÀ CHUYỂN ĐỔI CÚ PHÁP ĐỐI VỚI NGÔN NGỮ KÝ HIỆU VIỆT NAM ...............................................................16 2.1. Thu thập luật rút gọn trong ngôn ngữ ký hiệu Việt Nam .................... 16 2.1.1. Thu thập luật rút gọn giới từ và liên từ ......................................... 16 2.1.2. Thu thập luật rút gọn các từ tính thái ............................................ 22 2.2. Thu thập luật chuyển đổi cú pháp trong ngôn ngữ ký hiệu Việt Nam. 25 2.2.1. Vấn đề về xây dựng ngân hàng câu được chú giải cú pháp .......... 25 2.2.2. Tổng kết những đặc điểm về trật tự cú pháp ngôn ngữ kí hiệu Việt Nam ......................................................................................................... 31 2.3. Cơ sở dữ liệu văn bản tiếng Việt.......................................................... 33 2.3.1. Đặc trưng của văn bản tiếng Việt.................................................. 33 2.3.2. Phân tích dữ liệu văn bản tiếng Việt ............................................. 36 2.3.3. Các vấn đề về phân tích cú pháp trong Tiếng Việt ....................... 38 CHƯƠNG 3. XÂY DỰNG HỆ THỐNG RÚT GỌN VĂN BẢN VÀ CHUYỂN ĐỔI CÚ PHÁP NGÔN NGỮ KÝ HIỆU VIỆT NAM. ...........................................47 3.1. Môi trường thực nghiệm hệ thống rút gọn văn bản và chuyển đổi cú pháp ............................................................................................................. 47 3.2. Các công cụ hỗ trợ thực nghiệm .......................................................... 47 3.2.1. Công cụ TreeBank Editor ............................................................. 47 3.2.2. Bộ phân tích cú pháp Bikel ........................................................... 47 3.3. Cài đặt thuật toán rút gọn văn bản ....................................................... 48 3.3.1. Thuật toán rút gọn văn bản trong ngôn ngữ ký hiệu Việt Nam .... 48 3.3.2. Đánh giá thực nghiệm ................................................................... 50 3.4. Cài đặt thuật toán chuyển đổi cú pháp ................................................. 53 3.4.1. Xây dựng cây chuyển đổi cú pháp tương ứng trong ngôn ngữ kí hiệu. ......................................................................................................... 53 3.4.2. Cài đặt thuật toán .......................................................................... 56 3.4.3. Đánh giá, kết quả thực nghiệm ..................................................... 57 3.5. Xây dựng phần mềm thực nghiệm rút gọn văn bản và chuyển đổi cú pháp ............................................................................................................. 59 KẾT LUẬN ..................................................................................................................61 TÀI LIỆU THAM KHẢO ..........................................................................................62 DANH MỤC HÌNH Hình 1.1. Ngôn ngữ kí hiệu trong hệ thông Arthrological ......................................... 5 Hình 2.1. Quá trình gán nhãn ......................................................................................31 Hình 2.2. Cây cú pháp của câu "tôi nhìn cô gái với chiếc ống nhòm” ...................39 Hình 2.3. Dẫn xuất phân tích top - down ...................................................................42 Hình 2.4. Dẫn xuất phân tích bottom - up..................................................................45 Hình 3.1. Sơ đồ thuật toán rút gọn văn bản ...............................................................50 Hình 3.2. Cấu trúc cây cú pháp chuyển đổi tương ứng sang dạng NNKH câu đơn 53 Hình 3.3. Cấu trúc cây cú pháp chuyển đổi tương ứng sang dạng NNKH câu phủ định dạng 1....................................................................................................................53 Hình 3.4. Cấu trúc cây cú pháp chuyển đổi tương ứng sang dạng NNKH câu phủ định dạng 2....................................................................................................................54 Hình 3.5. Cấu trúc cây cú pháp chuyển đổi tương ứng sang dạng NNKH câu nghi vấn dạng 1 .....................................................................................................................54 Hình 3.6. Cấu trúc cây cú pháp chuyển đổi tương ứng sang dạng NNKH câu nghi vấn dạng 2 .....................................................................................................................54 Hình 3.7. Cấu trúc cây cú pháp chuyển đổi tương ứng sang dạng NNKH câu đơn có bao gồm số từ. .........................................................................................................55 Hình 3.8. Sơ đồ thuật toán chuyển đổi cú pháp.........................................................56 Hình 3.9. Kết quả dịch tự động câu tiếng Việt sang dạng câu đúng ngữ pháp trong ngôn ngữ kí hiệu Việt Nam .........................................................................................58 Hình 3.10. Giao diện phần mềm thực nghiệm rút gọn và chuyển đổi cú pháp ......59 Hình 3.11. Giao diện phần mềm thực nghiệm rút gọn và chuyển đổi cú pháp ......60 Hình 3.12. Giao diện phần mềm thực nghiệm rút gọn và chuyển đổi cú pháp ......60 DANH MỤC BẢNG BIỂU Bảng 1.1. So sánh câu tiếng việt và câu ngôn ngữ ký hiệu ......................................12 Bảng 2.1. Một số mẫu câu rút gọn giới từ và liên từ ................................................22 Bảng 2.2. Tập nhãn từ loại ..........................................................................................26 Bảng 2.3. Tập nhãn cụm từ .........................................................................................28 Bảng 2.4. Nhãn mệnh đề .............................................................................................28 Bảng 2.5. Nhãn chức năng cú pháp ............................................................................29 Bảng 2.6. Nhãn chức năng trạng ngữ .........................................................................30 Bảng 2.7. Bảng các thành phần âm tiết ......................................................................34 Bảng 3.1. Điểm số của BLEU.....................................................................................52 Bảng 3.2. Điểm BLEU đánh giá tập dữ liệu của thuật toán chuyển đổi cú pháp NNKH ...........................................................................................................................58 LỜI CAM ĐOAN Tôi là: Ma Ngọc Khánh Lớp: CK15 Khoá học: 2016 - 2018 Chuyên ngành: Khoa học máy tính Mã số chuyên ngành: 8480101 Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông Thái Nguyên. Giáo viên hướng dẫn: PGS.TS. Phùng Trung Nghĩa Tôi xin cam đoan luận văn “Nghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam” này là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn của PGS.TS. Phùng Trung Nghĩa. Các số liệu sử dụng trong luận văn là trung thực. Các kết quả nghiên cứu được trình bày trong luận văn chưa từng được công bố tại bất kỳ công trình nào khác. Thái Nguyên, ngày 30 tháng 5 năm 2018 HỌC VIÊN Ma Ngọc Khánh LỜI CẢM ƠN Học viên xin gửi lời cảm ơn chân thành tới Thầy hướng dẫn PGS.TS. Phùng Trung Nghĩa, Trường Đại học Công nghệ Thông tin và Truyền thông Đại học Thái Nguyên, người đã tận tình hướng dẫn giúp học viên hoàn thành luận văn tốt nghiệp. Học viên cũng xin gửi lời cảm ơn sâu sắc đến các thầy cô giáo của Trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên, cùng các thầy cô giáo của Viện Công nghệ thông tin - Viện khoa học Việt Nam đã nhiệt tình giảng dạy, truyền đạt kiến thức cho học viên trong suốt 2 năm học để học viên có thể hoàn thành được luận văn của mình. Ma Ngọc Khánh 1 MỞ ĐẦU Hiện nay theo thống kê, Việt Nam có khoảng trên 2.5 triệu người khiếm thính [1]. Do khả năng nghe bị suy giảm nên khả năng giao tiếp bằng lời ở cộng đồng người khiếm thính bị hạn chế rất nhiều. Để thay thế cho khả năng giao tiếp bằng tiếng nói, ngôn ngữ ký hiệu, là ngôn ngữ tượng hình sử dụng biểu diễn, chuyển động của bàn tay, cơ thể, và sắc thái biểu cảm của khuôn mặt đã ra đời Tuy nhiên, việc sử dụng ngôn ngữ ký hiệu chưa phát huy được hiệu quả giúp người khiếm thính hòa nhập được với xã hội do việc giao tiếp giữa người khiếm thính và người nghe tốt còn gặp nhiều khó khăn. Trên thế giới hiện nay đã và đang nghiên cứu phát triển và đưa ra nhiều dịch vụ thông dịch và sản phẩm công nghệ nhằm hỗ trợ người khiếm thính trong giao tiếp xã hội như máy trợ thính dành cho người nghe kém, găng tay chuyển đổi ngôn ngữ ký hiệu thành giọng nói [9], các phần mềm dịch từ văn bản/giọng nói sang ngôn ngữ ký hiệu hay các từ điển tra cứu ngôn ngữ ký hiệu online [12], v.v… Tuy nhiên mỗi một nghiên cứu hay sản phẩm đều có những hạn chế và chưa đáp ứng được việc hỗ trợ trong giao tiếp hai chiều giữa người khiếm thính và người nghe tốt trong thực tế. Việc nghiên cứu xử lý ngôn ngữ ký hiệu trên máy tính ở nước ta còn rất mới mẻ. Chúng ta chưa thực sự có một hệ thống ngôn ngữ đồng nhất cho ngôn ngữ ký hiệu tiếng Việt [6]. Bên cạnh vấn đề ngôn ngữ học, việc phát triển sản phẩm ứng dụng công nghệ để phát huy ngôn ngữ ký hiệu nhằm nâng cao trình độ, tiếp nhận thông tin, khả năng giao tiếp cho người khiếm thính lại càng ít và kém hiệu quả. Với sự quan tâm đặc biệt của Đảng và Nhà nước, đã có nhiều trường học, trung tâm hỗ trợ dạy học và việc làm riêng cho người khiếm thính. Vì vậy việc nghiên cứu về các thuật toán và xây dựng phần mềm rút gọn văn 2 bản, chuyển đổi cú pháp đối với ngôn ngữ ký hiệu Việt Nam là cần thiết [2]. Do đó tôi chọn đề tài “Nghiên cứu phương pháp rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam” Mục tiêu của luân văn là Nghiên cứu các lý thuyết đã có để phân tích, đánh giá về các tính chất, các luật rút gọn, chuyển đổi cú pháp đối với ngôn ngữ ký hiệu Việt Nam. Dựa trên các cơ sở lý thuyết và các phân tích, đánh giá sẽ nghiên cứu cài đặt thực nghiệm các thuật toán rút gọn, chuyển đổi cú pháp này và xây dựng phần mềm hỗ trợ rút gọn và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam. Nội dung chính của luận văn bao gồm 3 chương: Chương 1. Tổng quan về ngôn ngữ ký hiệu Việt Nam Chương 2. Luật rút gọn văn bản và chuyển đổi cú pháp đối với ngôn ngữ ký hiệu Việt Nam. Chương 3. Xây dựng hệ thống rút gọn văn bản và chuyển đổi cú pháp ngôn ngữ ký hiệu Việt Nam. Khi viết báo cáo này học viên đã cố gắng để đạt được những mục tiêu và định hướng nghiên cứu đề ra ban đầu, song điều kiện thời gian và năng lực còn hạn chế nên không tránh khỏi thiếu sót. Học viên mong nhận được sự góp ý của thầy giáo hướng dẫn, thầy cô giáo để học viên có được những kinh nghiệm thực tế và bổ ích để sau này có thể xây dựng được một chương trình hoàn thiện hơn. 3 CHƯƠNG 1 TỔNG QUAN VỀ NGÔN NGỮ KÝ HIỆU VIỆT NAM 1.1. Tổng quan về ngôn ngữ ký hiệu 1.1.1. Khái niệm ngôn ngữ ký hiệu Ngôn ngữ ký hiệu (hay ngôn ngữ dấu hiệu, thủ ngữ) là ngôn ngữ dùng những biểu hiện của bàn tay thay cho âm thanh của tiếng nói. Ngôn ngữ ký hiệu do người điếc tạo ra nhằm giúp họ có thể giao tiếp với nhau trong cộng đồng của mình và tiếp thu tri thức của xã hội. Việc thay thế âm thanh của tiếng nói có thể liên quan đến đồng thời sự kết hợp các hình dạng tay, hướng và chuyển động của bàn tay, cánh tay hoặc cơ thể, và nét mặt để thể hiện trôi chảy những suy nghĩ của người nói. Ngôn ngữ kí hiệu có nhiều điểm tương đồng với ngôn ngữ nói (đôi khi được gọi là "ngôn ngữ bằng miệng" - mà phụ thuộc chủ yếu vào âm thanh), đó là lý do tại sao ngôn ngữ học xem xét cả hai dạng ngôn ngữ là ngôn ngữ tự nhiên. Tuy nhiên cũng có một số khác biệt đáng kể giữa các ngôn ngữ ký hiệu và ngôn ngữ nói. Đặc biệt không nên nhầm lẫn ngôn ngữ kí hiệu với ngôn ngữ cơ thể, là một loại giao tiếp phi ngôn ngữ. Bất cứ đâu trong cộng đồng người khiếm thính trên thế giới, ngôn ngữ ký hiệu đều được phát triển. Ngôn ngữ kí hiệu không chỉ được sử dụng bởi người điếc mà nó cũng được sử dụng bởi những người có thể nghe thấy, nhưng thể chất bị hạn chế để có thể nói chuyện bình thường. Ngôn ngữ kí hiệu có những thuộc tính ngôn ngữ riêng biệt. Hiện nay, hàng trăm ngôn ngữ ký hiệu được sử dụng trên thế giới và phát triển trong cộng đồng người khiếm thính ở tất cả các quốc gia. Một số ngôn ngữ ký hiệu có được công nhận pháp lý, trong khi một số khác thì chỉ mang tính cục bộ, địa phương. Một quan niệm sai lầm phổ biến là tất cả các ngôn ngữ ký hiệu là trên toàn thế giới là hoàn toàn giống nhau hoặc ngôn ngữ ký hiệu là một ngôn ngữ 4 quốc tế. Thực tế thì không phải vậy, mỗi quốc gia có hơn ngôn ngữ ký hiệu bản địa riêng của mình, và thậm chí một quốc gia có nhiều hơn một loại ngôn ngữ kí hiệu mang tính chất đặc trưng của từng địa phương trong quốc gia đó. Mặc dù, có thể nhận thấy ngôn ngữ ký hiệu có thể chia sẻ với nhau với nhau, cho dù trong cùng một nước hoặc mở rộng phạm vi bên ngoài một quốc gia. Từ những năm 384-322 TCN Aristotle, triết gia vĩ đại của Hy Lạp, tuyên bố rằng: "Người điếc không thể giáo dục được. Nếu không nghe được, con người không thể học được". Tuyên bố này đặt nền móng cho việc xây dựng một ngôn ngữ riêng cho người điếc. Một trong những ghi chép sớm nhất về ngôn ngữ ký hiệu là từ thế kỷ thứ V trước Công nguyên, trong Plato 's Cratylus , Socrates nói: “ If we hadn't a voice or a tongue, and wanted to express things to one another, wouldn't we try to make signs by moving our hands, head, and the rest of our body, just as dumb people do at present? (Tạm dịch: “ Nếu chúng ta không có một giọng nói hay một cái lưỡi, và muốn thể hiện mọi điều với nhau, chúng ta sẽ phải cố gắng để tạo ra dấu hiệu bằng cách di chuyển bàn tay, đầu, và một phần cơ thể như cách người câm họ làm có phải không? " [12] Cho đến thế kỷ 19, hầu hết những gì chúng ta biết về lịch sử ngôn ngữ ký hiệu chỉ giới hạn trong bảng chữ cái bằng tay (hệ thống fingerspelling) đã được phát minh ra để tạo điều kiện chuyển giao từ một ngôn ngữ nói đến một ngôn ngữ ký hiệu, chứ không phải là một loại ngôn ngữ riêng. Trong năm 1620, Juan Pablo Bonet xuất bản một cuốn sách nói về rút gọn chữ và nghệ thuật giảng dạy cho người câm ở Madrid. [13] Nó được coi là luận thuyết hiện đại đầu tiên của dấu hiệu ngữ âm học ngôn ngữ, đặt ra một phương pháp giáo dục bằng miệng cho người khiếm thính và một bảng chữ cái của ngôn ngữ kí hiệu. 5 Tại Anh, bảng chữ cái bằng tay cũng đã được sử dụng cho một số mục đích, chẳng hạn như thông tin liên lạc bí mật, [14] nói trước công chúng, hay giao tiếp của người khiếm thính. [15] Năm 1648, John Bulwer mô tả "Master Babington", một người đàn ông bị điếc thành thạo trong việc sử dụng một bảng chữ cái, người vợ có thể trò chuyện với anh ta một cách dễ dàng, ngay cả trong bóng tối thông qua việc sử dụng các ký hiệu xúc giác . [16] Năm 1680, George Dalgarno bố một nghiên cứu [17] , trong đó ông đã trình bày phương pháp riêng của mình về giáo dục người khiếm thính, trong đó có một bảng chữ cái "arthrological", bằng cách chỉ vào các khớp khác nhau của các ngón tay và lòng bàn tay của bàn tay trái. Hệ thống Arthrological đã được sử dụng một thời gian. Hình 1.1. Ngôn ngữ kí hiệu trong hệ thông Arthrological Ngôn ngữ kí hiệu thường có khá ít mối liên hệ với ngôn ngữ cho tiếng nói của các vùng mà ngôn ngữ đó phát sinh sinh. Mối tương quan giữa ký hiệu và ngôn ngữ nói là phức tạp và khác nhau tùy thuộc vào quốc gia hơn là phụ thuộc chỉ vàocác ngôn ngữ nói. Ví dụ, Mỹ, Canada, Anh, Úc và New Zealand đều có tiếng Anh là ngôn ngữ chính của họ, nhưng ngôn ngữ American Sign (ASL), được sử dụng ở Mỹ và hầu hết các bộ phận của Canada, có nguồn gốc từ Ngôn ngữ ký hiệu của Pháp trong khi nó khác biệt với phương ngữ trong ngôn ngữ kí hiệu của Anh, Úc và New Zealand [18] Tương tự như vậy, các ngôn ngữ kí hiệu của Tây Ban Nha và Mexico là rất khác nhau, mặc dù Tây Ban Nha là ngôn ngữ quốc gia của mỗi nước và ngôn ngữ ký hiệu được sử dụng trong Bolivia dựa trên ASL hơn bất kỳ ngôn ngữ 6 ký hiệu được sử dụng trong một quốc gia Tây Ban Nha Biến thể cũng phát sinh trong một ngôn ngữ ký hiệu 'quốc gia' mà không nhất thiết phải tương ứng với sự khác biệt phương ngữ trong ngôn ngữ nói quốc gia; đúng hơn, chúng thường có thể tương quan đến vị trí địa lý của cộng đồng người điếc. 1.1.2. Đặc điểm ngôn ngữ học của ngôn ngữ ký hiệu Cũng như ngôn ngữ nói, ngôn ngữ ký hiệu của từng quốc gia, thậm chí là từng khu vực trong một quốc gia rất khác nhau. Điều đó là do mỗi quốc gia, khu vực có lịch sử, văn hóa, tập quán khác nhau nên ký hiệu để biểu thị sự vật hiện tượng cũng khác nhau. Chẳng hạn, cùng chỉ tính từ màu hồng thì ở Hà Nội người ta xoa vào má (má hồng), còn tại Thành phố Hồ Chí Minh lại chỉ vào môi (môi hồng). Điều tương tự cũng diễn ra khi có sự khác biệt lớn hơn trên tầm quốc gia, dẫn tới sự khác biệt của hệ thống từ vựng và ngữ pháp ngôn ngữ ký hiệu giữa các nước. Tuy nhiên, ký hiệu tất cả mọi nơi trên thế giới đều có những điểm tương đồng nhất định. Ví dụ: ký hiệu ‘uống nước’ thì nước nào cũng làm như nhau là giả bộ cầm cốc uống nước, ký hiệu ‘lái ô tô’ thì giả bộ cầm vô lăng ô tô quay quay, v.v. Mỗi người (dù bình thường hay câm điếc) đều có sẵn 30% kiến thức ngôn ngữ ký hiệu. Do ngôn ngữ ký hiệu phát triển hơn trong cộng đồng người khiếm thính, nên những người thuộc cộng đồng này của hai nước khác nhau có thể giao tiếp với nhau tốt hơn hai người bình thường nhưng mà không biết ngoại ngữ. Hai đặc điểm quan trọng nhất của NGÔN NGỮ KÍ HIỆU là tính giản lược và có điểm nhấn, VD: Tiếng Anh: “Today it is not so much beautiful as the sky clouds make gloomy” NGÔN NGỮ KÍ HIỆU: "It is NOT BEAUTIFUL, sky CLOUDS make GLOOMY " 7 Do tính giản lược và có điểm nhấn nên cấu trúc ngữ pháp ngôn ngữ ký hiệu nhiều khi không thống nhất, cùng một câu có thể sắp xếp nhiều cách khác nhau (thường thì điểm nhấn được đưa lên đầu câu để gây hiệu quả chú ý). Một quan niệm sai lầm phổ biến là ngôn ngữ ký hiệu phụ thuộc vào ngôn ngữ nói. Ngôn ngữ kí hiệu, giống như tất cả các ngôn ngữ tự nhiên, được phát triển bởi những người sử dụng chúng, trong trường hợp này, những người khiếm thính, những người có thể có ít hoặc không có kiến thức của bất kỳ ngôn ngữ nói nào. Khi phát triển ngôn ngữ kí hiệu, đôi khi phải vay mượn các yếu tố từ ngôn ngữ nói, cũng giống như tất cả các ngôn ngữ vay mượn từ các ngôn ngữ khác. Trong nhiều ngôn ngữ kí hiệu, một bảng chữ cái (fingerspelling) có thể được sử dụng trong giao tiếp bằng cách vay một từ từ một ngôn ngữ nói, bằng cách quy định các chữ cái. Điều này thường được sử dụng cho tên riêng của người và nơi chốn; nó cũng được sử dụng trong một số ngôn ngữ cho các khái niệm mà không có kí hiệu có sẵn tại thời điểm đó. Fingerspelling đôi khi có thể là một nguồn gốc của những kí hiệu mới, chẳng hạn như kí hiệu khởi tạo Nhìn chung, mặc dù, ký ngôn ngữ độc lập với ngôn ngữ nói và phát triển theo con đường riêng. Ví dụ, Ngôn ngữ ký hiệu Anh và Ngôn ngữ ký hiệu Mỹ (ASL) là khá khác nhau và đôi bên cùng khó hiểu, mặc dù những người nghe của Anh và Mỹ có cùng ngôn ngữ nói. Các văn phạm của ngôn ngữ kí hiệu thường không giống ngôn ngữ nói được sử dụng trong các khu vực địa lý tương tự; trên thực tế, về mặt cú pháp, ASL có mối quan hệ với tiếng Nhật nhiều hơn là với tiếng Anh. Tương tự như vậy, các nước có sử dụng một ngôn ngữ nói duy nhất có thể có hai hoặc nhiều ngôn ngữ dấu hiệu, hoặc một khu vực chứa nhiều hơn một ngôn ngữ nói có thể chỉ sử dụng một ngôn ngữ ký hiệu. Ở Nam Phi , có 11 ngôn ngữ nói chính thức và một số lượng tương tự khác sử dụng rộng rãi 8 ngôn ngữ nói. Tuy nhiên nó chỉ có một ngôn ngữ ký hiệu với hai biến thể do lịch sử của việc có hai tổ chức giáo dục lớn dành cho người điếc ở các khu vực địa lý khác nhau. 1.1.3. Vai trò của ngôn ngữ kí hiệu với cộng đồng người khiếm thính. Theo Tổ chức Y tế Thế giới (WHO) thì hiện nay trên thế giới có khoảng 360 triệu người câm điếc các dạng (chiếm khoảng 5% dân số thế giới). Hầu hết trong số họ có mức sống dưới trung bình do rào cản ngôn ngữ. Thông thường, những người khiếm thính bẩm sinh sẽ chỉ học và tư duy bằng ngôn ngữ ký hiệu. Tuy vậy, một số người điếc bẩm sinh đôi lúc sẽ tư duy được bằng cả ngôn ngữ lời nói nếu cố gắng học nói. Những người không bị điếc hoàn toàn vẫn nghe được một chút khi đeo thiết bị trợ thính (thường gọi là “khiếm thính”) sẽ vẫn có khả năng tư duy trong đầu bằng âm thanh, lời nói. Khiếm thính thường nghiêm trọng hơn khiếm thị bởi não bộ của người khiếm thính không tiếp xúc được với ngôn ngữ, trong khi đó ngôn ngữ có tầm quan trọng không thể thiếu với các chức năng lưu giữ ký ức, tư duy trừu tượng và sự tự nhận thức của não bộ. Nói một cách hình tượng, ngôn ngữ như là phương tiện để não có thể điều khiển các “phần cứng”. Do đó, dù không khiếm khuyết về não bộ, nhưng những người khiếm thính không được học ngôn ngữ kí hiệu sẽ bị khuyết tật trí tuệ, cho đến khi họ học được một thứ ngôn ngữ đã được cấu trúc sẵn. Ngôn ngữ đóng vai trò rất quan trọng trong những giai đoạn phát triển đầu của não bộ, vì thế những người điếc không được học ngôn ngữ kí hiệu sớm thường sẽ gặp khó khăn trong học tập và các vấn đề này sẽ đeo bám họ suốt cuộc đời, ngay cả khi sau đó họ có thể học một loại ngôn ngữ ký hiệu đặc thù. Đó là lý do mà người khiếm thính từng bị coi là một dạng khuyết tật trí tuệ và không thể dạy dỗ được cho tới tận những năm 1970. Trước đó, từ 9 những năm 1880, người khiếm thính được học sử dụng khẩu hình để giao tiếp thay vì dùng ngôn ngữ kí hiệu. Tuy nhiên, một nghiên cứu gần đây chỉ ra rằng não bộ của người điếc không thể liên kết hoàn toàn với ngôn ngữ nói giống như cách ngôn ngữ kí hiệu ăn sâu, bắt rễ vào não bộ của họ. Căn bản vì ngôn ngữ lời nói không thể giúp não bộ của họ xử lý thông tin. Những người khiếm thính bị ép học ngôn ngữ nói sẽ có được ý thức về bản thân và trí nhớ tốt hơn những người không được học một thứ ngôn ngữ nào, tuy nhiên họ cũng không thể khai thác và phát triển được toàn bộ tiềm năng của não bộ như khi học ngôn ngữ kí hiệu. Do vậy ngôn ngữ kí hiệu không những chỉ có vai trò to lớn trong giáo dục mà còn trong nhiều mặt khác và có tầm quan trọng rất lớn trong cuộc sống của những Người khiếm thính. 1.2. Tổng quan về ngôn ngữ ký hiệu Việt Nam Việt Nam có khoảng 2,5 triệu người khiếm thính (Theo số liệu của cuộc tổng điều tra dân số và nhà ở VN tháng 12/2009) trong đó số người khiếm thính chiếm một tỉ lệ tương đối cao bao gồm người Điếc, người nghe kém và người mới bị mất thính lực. Do khả năng nghe bị suy giảm nên khả năng giao tiếp bằng lời nói tự nhiên của người khiếm thính rất hạn chế. Vì vậy, để đáp ứng nhu cầu giao tiếp, người khiếm thính phải sử dụng một thứ ngôn ngữ đặc biệt: Ngôn ngữ kí hiệu. do đó, sự hình thành và phát triển ngôn ngữ kí hiệu ở nước ta cũng là một điều tự nhiên. Trung tâm Nuôi dạy trẻ khiếm thính Thuận An, Bình Dương được coi là cái nôi của nền giáo dục trẻ Điếc ở Việt Nam. Với lịch sử hình thành trên một trăm năm, Trung tâm là nơi đem đến cho cộng đồng người Điếc Việt Nam những ký hiệu ngôn ngữ đầu tiên, giáo dục người Điếc bằng lời nói kết hợp với ngôn ngữ ký hiệu. 10 Điều đó đồng nghĩa với việc ở Việt Nam, người khiếm thính đã sử dụng ngôn ngữ kí hiệu như tiếng mẹ đẻ và ngôn ngữ kí hiệu với tiếng Việt là hai thứ ngôn ngữ riêng biệt. Theo Wikipedi tiếng Việt, ngôn ngữ kí hiệu, ngôn ngữ dấu hiệu hay thủ ngữ là ngôn ngữ chủ yếu được cộng đồng người khiếm thính sử dụng nhằm chuyển tải thông tin qua cử chỉ, điệu bộ, nét mặt thay cho lời nói. Hiện nay, ở Việt Nam, cả ba thuật ngữ ngôn ngữ kí hiệu, ngôn ngữ dấu hiệu hay thủ ngữ đều đang được sử dụng để chỉ hệ thống cử chỉ, nét mặt mà người khiếm thính dùng để giao tiếp. Tuy nhiên, theo tôi, hai thuật ngữ Thủ ngữ và Ngôn ngữ dấu hiệu là không thực sự chính xác vì: Thủ ngữ theo tiếng Hán có nghĩa là “ngôn ngữ của đôi tay, ngôn ngữ bằng tay”. Tuy nhiên tất cả các ngôn ngữ kí hiệu trên thế giới đều có 5 phương tiện và cách thức biểu hiện sau: - Vị trí của bàn tay - Hình dạng bàn tay - Hướng của lòng bàn tay - Hướng của chuyển động lòng bàn tay - Biểu hiện của nét mặt Như vậy, rõ ràng ngôn ngữ của người khiếm thính không chỉ giới hạn trong sự diễn tả bằng tay mà còn có cả sự biểu hiện bằng nét mặt cũng vô cùng quan trọng. Những điểm khác biệt trong ngữ pháp cấu tạo từ của ngôn ngữ kí hiệu và tiếng Việt chứng tỏ ngôn ngữ kí hiệu Việt Nam là một ngôn ngữ đích thực, có ngữ pháp riêng biệt, độc lập với tiếng Việt. Nó hoàn toàn đáp ứng được vai trò là một hệ thống các tín hiệu đáp ứng được nhu cầu giao tiếp và là công cụ tư duy của người khiếm thính. Sử dụng ngôn ngữ kí hiệu, người dạy có thể truyền đạt một cách hữu hiệu nội dung kiến thức đến cho những học trò khiếm thính. 11 1.3. Tính rút gọn trong ngôn ngữ ký hiệu Việt Nam Đặc trưng tư duy của người điếc mang tính cụ thể, nó ảnh hưởng trực tiếp đến cách biểu đạt ngôn ngữ như: trật tự sắp xếp các kí hiệu trong câu, giản lược các thành phần của câu… Ngôn ngữ ký hiệu trong giao tiếp thông thường giữa người điếc với người điếc có một số đặc điểm cơ bản. Đó là câu Ngôn ngữ ký hiệu ngắn gọn hơn câu của ngôn ngữ nói/viết tiếng Việt, bởi được giản lược bớt những giới từ, từ phụ (đứng vai trò là bổ ngữ trong câu, bổ ngữ cho tính từ, bổ ngữ cho động từ). Do bị hạn chế về nhận thức và vốn từ, nên người điếc biểu đạt bằng Ngôn ngữ ký hiệu không theo trật tự ngữ pháp của ngôn ngữ nói/viết tiếng Việt, vị trí của các thành phần câu bị đảo. Câu tường thuật: người điếc thường thay đổi trật tự từ theo mục đích nói và lược bỏ một số thành phần của câu như giới từ, liên từ,.... Câu nghi vấn: trong câu nghi vấn không có lựa chọn, người điếc không bao giờ sử dụng đại từ nghi vấn ở đầu hoặc giữa câu mà luôn đặt ở cuối câu. Đại từ nghi vấn thường đứng liền kề với trọng điểm nghi vấn. Câu nghi vấn có lựa chọn và câu nghi vấn giả thiết thường không được người điếc sử dụng trong giao tiếp, tuy nhiên họ cũng có thể diễn tả giống như ngôn ngữ nói. Còn loại câu nghi vấn dùng ngữ điệu thì không có trong NNKH. Tuy nhiên để làm rõ hơn nội dung truyền đạt, người điếc có thể sử dụng tốc độ ra dấu cộng với sự biểu lộ trên nét mặt. Câu phủ định: vị trí của vị ngữ không thay đổi nhưng vị trí của phụ từ trong câu phủ định thường đứng ở cuối câu. Câu mệnh lệnh: các từ chỉ tình thái thường bị giản lược, trật tự từ trong câu bị đảo vị trí so với ngôn ngữ nói/viết tiếng Việt, từ chỉ hành động sai khiến thường đứng ở cuối câu. 12 Như vậy chúng ta có thể thấy các thành phần được rút gọn trong ngôn ngữ kí hiệu sẽ bao gồm: giới từ, liên từ, các từ chỉ tình thái 1.4. Trật tự cú pháp trong ngôn ngữ ký hiệu Việt Nam Ngôn ngữ kí hiệu của cộng đồng người khiếm thính ở nước ta có sự khác biệt không nhỏ về hệ thống từ vựng. Một trong những đặc trưng cơ bản làm cho ngôn ngữ khác với các hệ thống tín hiệu khác là nó vừa làm công cụ giao tiếp lại vừa làm công cụ tư duy. Công trình nghiên cứu cách biểu đạt ngôn ngữ kí hiệu của người Điếc Việt Nam [8] của Viện Khoa học giáo dục đã bước đầu chỉ ra rằng người khiếm thính biểu đạt bằng ngôn ngữ kí hiệu không theo như trật tự từ thông thường, nhưng chưa có sự phân tích sâu về mặt ngôn ngữ học và cũng chưa đưa ra được những luận giải xác đáng. Các nhà ngôn ngữ học Mỹ cũng đã khẳng định “ngôn ngữ kí hiệu Mỹ không phải là tiếng Anh trên bàn tay”, tức là nó không phải là một sự mô phỏng của ngôn ngữ nói [11, 8]. Ngôn ngữ kí hiệu ở Việt Nam cũng như vậy. Nó có những quy tắc riêng về từ vựng và ngữ pháp, độc lập với tiếng Việt. Điểm dễ nhận thấy nhất là trật tự kí hiệu trong một số loại câu của ngôn ngữ kí hiệu ở Việt Nam khác về cơ bản so với trật tự từ trong câu tiếng Việt. So sánh các câu được thể hiện bằng ngôn ngữ nói thông thường và các câu được thể hiện bằng ngôn ngữ kí hiệu sau: Bảng 1.1. So sánh câu tiếng việt và câu ngôn ngữ ký hiệu STT 1 2 3 4 5 6 7 8 9 Câu tiếng Việt Cô ấy buồn Bạn viết đẹp lắm! Tôi đi học. Trưa nay, tôi ăn hai quả táo xanh. Tôi thương mẹ tôi nhất. Nhà tôi ở Thịnh Đán Con chưa uống sữa. Tôi thích ăn dưa hấu. Tôi không thích ăn vú sữa. Câu bằng ngôn ngữ kí hiệu Cô ấy buồn Bạn viết đẹp + (nét mặt)! Tôi đi học. Tôi táo xanh ăn hai trưa nay. Tôi mẹ thương nhất. Tôi nhà Thịnh Đán Con sữa uống chưa. Tôi ăn dưa hấu thích. Tôi ăn vú sữa không thích. 13 10 11 12 13 14 15 16 17 18 Ai cho bạn mượn sách? Em có bao nhiêu cái kẹo? Bạn thích ăn gì? Gia đình của bạn có mấy người? Sách cho bạn mượn ai? Em kẹo có bao nhiêu? Bạn ăn thích gì? Bạn gia đình người mấy? (14a) Mai thứ 3 đúng sai? Ngày mai là thứ ba đúng không? (14b) Mai thứ ba đúng (+ nét mặt)? (14c) Mai thứ ba (+ nét mặt )? Bạn có người yêu chưa? Bạn người yêu có (+ nét mặt )? (16a) Bạn đen trắng thích cái nào? Bạn thích màu đen hay màu (16b) Bạn đen trắng thích (+ nét trắng? mặt)? Ôi, bông hoa đẹp thế! Hoa đẹp + (nét mặt)! Hãy mở cửa sổ ra! Cửa sổ mở + (nét mặt)! Đối với tất cả các ngôn ngữ, cú pháp là vô cùng quan trọng. Nó phản ánh cách tư duy của người bản ngữ. Nắm được từ nhưng không nắm được ngữ pháp của một ngôn ngữ cũng khó lòng có thể hiểu nhau trong giao tiếp. Đây là một vấn đề rất đáng quan tâm trong việc dạy, học và thông dịch ngoại ngữ nói chung và ngôn ngữ kí hiệu nói riêng. Thiết nghĩ, cũng có thể coi ngôn ngữ kí hiệu - một thứ ngôn ngữ nhân tạo - như một ngoại ngữ và cộng đồng người khiếm thính là người bản ngữ, để việc dạy, học, thông dịch thứ ngôn ngữ này có hiệu quả, cũng là để có thể hiểu, cảm thông và tôn trọng cách nghĩ, cách “nói” của người khiếm thính hơn. 1.5. Ứng dụng công nghệ thông tin trong dịch ngôn ngữ ký hiệu Nhờ sự phát triển của khoa học công nghệ, hiện nay trên thế giới đã và đang nghiên cứu phát triển và đưa ra nhiều dịch vụ thông dịch và sản phẩm công nghệ nhằm hỗ trợ người khiếm thính trong giao tiếp xã hội. Trong đó việc nghiên cứu phương pháp dịch tự động mà trọng tâm là chuyển đổi cú pháp đúng trong ngôn ngữ kí hiệu là vấn đề được các nhà nghiên cứu về ngôn ngữ tự nhiên trên thế giới đặc biệt quan tâm.
- Xem thêm -

Tài liệu liên quan

Tài liệu xem nhiều nhất