NGÔN TỪ TRONG THƠ TỐ HỮU (NHÌN TỪ BÌNH DIỆN TỪ VỰNG)

  • Số trang: 175 |
  • Loại file: PDF |
  • Lượt xem: 19 |
  • Lượt tải: 0
nhattuvisu

Đã đăng 26946 tài liệu

Mô tả:

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM THÀNH PHỐ HỒ CHÍ MINH …o0o… TRẦN THỊ TÍNH NGÔN TỪ TRONG THƠ TỐ HỮU (NHÌN TỪ BÌNH DIỆN TỪ VỰNG) LUẬN VĂN THẠC SĨ NGÔN NGỮ HỌC Thành phố Hồ Chí Minh – 2005 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ một công trình nào khác. Tác giả luận văn Trần Thị Tính 3 DANH MỤC CÁC KI HIỆU, CÁC CHỮ VIẾT TẮT (TRONG LUẬN VĂN) 1. Kí hiệu Chúng tôi dùng số lượng các kí hiệu (*) để phân biệt nghĩa của từ đồng âm. Ví dụ: tranh (nhà tranh), tranh* (tranh giành), tranh** (bức tranh). Thông tin đầy đủ về chú thích này ỏ Phụ lục 9. 2. Danh mục các chữ viết tắt 3. Các ví dụ trích dẫn thơ được in nghiêng, giữa các câu thơ ngăn cách bằng dấu (/). 4 MỤC LỤC LỜI CAM ĐOAN ................................................................................3 DANH MỤC CÁC KI HIỆU, CÁC CHỮ VIẾT TẮT .....................4 MỤC LỤC ............................................................................................5 MỞ ĐẦU ...............................................................................................7 1. Lý do chọn đề tài ............................................................................................. 7 2. Mục đích nghiên cứu....................................................................................... 9 3. Đối tượng và phạm vi nghiên cứu ................................................................. 9 4. Lịch sử nghiên cứu ngôn ngữ thơ Tố Hữu ................................................. 10 5. Nguồn tư liệu và phương pháp nghiên cứu ................................................ 12 6. Bố cục của luận văn ...................................................................................... 14 CHƯƠNG 1: TỔ CHỨC ĐỊNH LƯỢNG VỐN TỪ TRONG THƠ TỐ HỮU .............................................................................................15 1.1. Về tổ chức định lượng của vốn từ............................................................. 15 1.2. Phân tích kết quả định lượng vốn từ........................................................ 16 1.2.1. Độ phân bố và độ phong phú từ vựng trong thơ Tố Hữu (với số liệu thống kê toàn tập) .............................................................................................................. 16 1.2.2. Độ phong phú từ vựng và tốc độ tăng từ mới trong từng tập thơ Tố Hữu (với số liệu thống kê từng tập thơ).......................................................................... 25 1.2.3. Một số cách làm giàu vốn từ trong thơ Tố Hữu .......................................... 30 CHƯƠNG 2: CÁC BÌNH DIỆN CỦA TỪ VỰNG TRONG THƠ TỐ HỮU .............................................................................................32 2.1. Về bình diện cấu tạo .................................................................................. 32 2.1.1. Từ đơn trong thơ Tố Hữu ............................................................................. 33 2.1.2. Từ ghép() trong thơ Tố Hữu ......................................................................... 36 2.1.3. Từ láy trong thơ Tố Hữu .............................................................................. 38 2.1.4. Thành ngữ trong thơ Tố Hữu ...................................................................... 42 2.1.5. Những kết hợp độc đáo ................................................................................. 44 5 2.2. Về bình diện nguồn gốc ............................................................................. 46 2.2.1. Từ thuần Việt................................................................................................. 46 2.2.2. Từ Hán-Việt ................................................................................................... 47 2.2.3. Các lớp từ khác () .......................................................................................... 48 2.2.4. Tên riêng trong thơ Tố Hữu ......................................................................... 49 2.3. Về bình diện phạm vi sử dụng .................................................................. 52 2.3.1. Phạm vi không gian ...................................................................................... 52 2.3.2. Phạm vi xã hội ............................................................................................... 54 2.4. Về bình diện mức độ sử dụng ................................................................... 56 2.4.1. Từ vựng tích cực và từ vựng tiêu cực .......................................................... 56 2.4.2. Từ ngữ cổ....................................................................................................... 57 2.5. Về bình diện màu sắc phong cách - từ văn chương ................................ 58 CHƯƠNG 3: MỘT SỐ TRƯỜNG TỪ VỰNG - NGỮ NGHĨA TRONG THƠ TỐ HỮU ...................................................................60 3.1. Mục đích của việc phân lập trường từ vựng - ngữ nghĩa ....................... 60 3.2. Một số trường từ vựng - ngữ nghĩa trong thơ Tố Hữu .......................... 60 3.2.1. Những từ ngữ thuộc trường nghĩa của từ chỉ con người số đông ............. 60 3.2.2. Từ ngữ thuộc trường nghĩa của từ biểu thị cảm xúc .................................. 64 3.2.3. Từ ngữ thuộc trường nghĩa miêu tả màu sắc .............................................. 69 3.2.4. Những từ ngữ thuộc trường nghĩa chỉ âm thanh ....................................... 78 KÊT LUẬN ........................................................................................85 TÀI LIỆU THAM KHẢO ................................................................87 6 MỞ ĐẦU 1. Lý do chọn đề tài Khi nói đến "văn chương" thì phải nói đến "chữ nghĩa" vì không có thứ văn chương nào lửng lơ ngoài chữ nghĩa... [25, 9]. Thế nhưng, chúng ta đều biết, hình như việc dạy và học văn trong nhà trường hiện nay chưa ý thức rõ sự nỗ lực từ phía ngôn ngữ để khai thác và tiếp cận văn học (trong mối liên hệ chuyển hóa vốn rất sinh động và khách quan giữa hai phạm vi này). Nguyễn Lai đã nhận xét: Trong khi phân tích, bình giảng văn học từ góc độ ngôn ngữ, nhiều người có thiên hướng muốn đẩy sự biến động thực của địa hạt ngữ nghĩa từ vựng sang lĩnh vực tu từ. Họ tự đặt mình phần nào vào chỗ đứng của sự nhầm lẫn không tự giác: tách rời ngữ nghĩa giữa nguồn mạch của tư duy; tách ngôn từ nghệ thuật khỏi sức mạnh cảm xúc theo thói quen hình thức (do nhìn vấn đề một cách tĩnh tại) [11,10-11]. Do vậy, chúng tôi hiểu rằng, để giảng dạy văn học được tốt, người đứng lớp không thể thiếu một số kiến thức tối thiểu về ngôn ngữ học (đặc biệt là từ vựng) trong mối liên hệ với văn học. Đây là lý do chính khiến chúng tôi không ngần ngại khi đến với ngồn ngữ văn chương. Chúng ta đều biết, gần 70 năm qua thơ Tố Hữu luôn là tiếng nói vừa hào hùng vừa đằm thắm về cuộc hành trình đầy thử thách của nhân dân Việt Nam qua những chặng đường lịch sử và giữ một vị trí quan trọng trong quá trình phát triển của văn học Việt và tiếng Việt. Có thể nói rằng, sự nghiệp thơ Tố Hữu gắn liền với sự nghiệp cách mạng, trở thành một bộ phận của sự nghiệp cách mạng. Năm 1937, những bài thơ đầu của Tố Hữu đã đem đến một tiếng thơ mới mẻ cho thơ ca cách mạng đương thời. Vào thời gian ấy, phong trào Thơ Mới đã hoàn toàn thắng thế, công cuộc hiện đại hóa thơ ca đã thực hiện thành công. Là 7 người cùng thế hệ với nhiều nhà Thơ Mới, Tố Hữu trước khi giác ngộ cách mạng cũng nhìn thấy ở họ những tâm trạng gần gũi với mình trong lúc đang "Băn khoăn đi kiếm lẽ yêu đời". Bởi vậy, một cách tự nhiên, Tố Hữu đã tiếp nhận những thành tựu nghệ thuật của Thơ Mới để làm giàu cho thơ ca Cách mạng. Nhưng con đường thơ Tố Hữu đã khác hẳn với con đường của các nhà Thơ Mới, vì nó gắn liền với lý tưởng Cộng sản và cuộc đấu tranh cách mạng. Từ năm 1938 đến năm 2002, Tố Hữu đã để lại cho chúng ta bảy tập thơ gồm 283 bài thơ. Cả bảy tập này đều được chính tác giả chọn lọc lần cuối cùng vào năm 2002 theo cách nhìn khái quát gần trọn cuộc đời thơ, một chặng đường dài gần bảy thập kỷ của một nhà thơ cách mạng. Tập thơ Từ ấy (1937 - 1946), gồm 67 bài thơ, là chặng đường mười năm đầu hoạt động sôi nổi. Tập thơ Việt Bắc (1947 - 1954), gồm 22 bài thơ, là chặng đường trong những năm kháng chiến chống thực dân Pháp. Tập thơ Gió lộng (1955 - 1961), gồm 25 bài thơ, là niềm vui, niềm tự hào, tin tưởng ở công cuộc xây dựng cuộc sống mới xã hội chủ nghĩa trên miền Bắc, tình cảm với miền Nam và ý chí thống nhất Tổ quốc. Tập thơ Ra trận (1961 -1971), gồm 35 bài thơ, là chặng đường thơ trong những năm kháng chiến chống Mỹ là khúc ca ra trận, là mệnh lệnh tiến công và lời kêu gọi. Tập thơ Máu và hoa (1972 1977), với 13 bài thơ, cũng có nội dung như vậy. Tập Một tiếng đơn (1979 1992) gồm 73 bài thơ và tập Ta với ta (1993 - 2002) gồm 48 bài thơ, nhà thơ muốn chiêm nghiệm về cuộc sống, về lẽ đời, hướng tới những quy luật phổ quát và tìm kiếm những giá trị bền vững. Nhiều nhà nghiên cứu nhất trí cho rằng thơ Tố Hữu là sự kiện văn chương quan trọng trong lịch sử văn học Việt Nam và một số nhà nghiên cứu ngôn ngữ học đã chọn thơ ông để nghiên cứu về một số lĩnh vực. Với luận văn này, sự đóng góp của thơ Tố Hữu về mặt ngôn ngữ là nguồn cứ liệu phong phú để giúp chúng tôi bước vào cuộc hành trình đến với ngôn ngữ văn chương. Đây không phải là phép chọn ngẫu nhiên hay tuy tiện mà 8 là một mục tiêu chính đáng. Người viết tin tưởng vào quyết định này, bởi một khối lượng từ vựng khổng lồ trong thơ Tố Hữu là mảnh đất màu mỡ cho việc thực hiện những mục đích nghiên cứu từ vựng trong ngôn ngữ văn chương. Và từ đó, chính luận văn sẽ góp thêm một số kết quả, điều chỉnh, bổ sung hay khẳng định những nhận định trước đây về thơ Tố Hữu (trên ấn tượng chủ quan) để đi đến những kết luận khách quan hơn, có căn cứ cụ thể hơn, góp phần hỗ trợ cho người giảng dạy hay cảm thụ văn học. 2. Mục đích nghiên cứu Vì luận văn nghiêng về thực tiễn hơn là lý luận nên chúng tôi tập trung dựng lại một bức tranh tổng quát về vấn đề ngôn từ trong thơ Tố Hữu (xét trên phương diện từ vựng) thông qua việc thống kê định lượng. Từ đó, người viết mong góp phần làm sáng tỏ hơn đặc điểm của ngôn từ trong thơ Tố Hữu. Độ phong phú của từ vựng cũng như ý nghĩa của sự phong phú ấy cũng cần được nghiên cứu, hoặc chỉ ra một số trường từ vựng - ngữ nghĩa với số lượng từ vựng phong phú và đa dạng về ý nghĩa cũng là mục đích luận văn cần đạt đựơc. Để những mục đích trên được thực hiện, chúng tôi cần đưa ra những kết quả thống kê định lượng là những cứ liệu khách quan, phản ánh bản chất của hiện tượng được khảo sát. Một mặt khác, luận văn cũng cần cung cấp càng nhiều càng tốt các danh sách từ vựng theo từng bình diện hay theo từng trường nghĩa, vì đây là chất liệu cần thiết cho trích dẫn và giảm bớt cho người nghiên cứu công phu truy tìm tra cứu. 3. Đối tượng và phạm vi nghiên cứu Như đã xác định, đề tài khảo sát của luận văn này là: "Ngôn từ trong thơ Tố Hữu (nhìn từ bình diện từ vựng)", tức luận văn phải đạt được những vấn đề cần nghiên cứu như: vốn từ vựng, sự hình thành, sự cấu tạo, sự tồn tại, về cơ cấu nghĩa, về sự biến đổi của từ vựng qua các giai đoạn sáng tác... Tuy vậy, ở công trình này người viết chỉ tập trung khảo sát vốn từ vựng, về sự hình thành và cấu tạo của từ vựng trong thơ Tố Hữu; còn xét ở sự tồn tại của từ vựng thì 9 chúng tôi chỉ đi sâu tìm hiểu phạm vi sử dụng và mức độ sử dụng mà không phân tích từ vựng về mặt phong cách học. về cơ cấu nghĩa, quả đây là một vấn đề phức tạp, vượt ra ngoài khả năng nghiên cứu của chúng tôi. Do vậy, dù đã thật cố gắng nhưng luận văn cũng chỉ tập trung được ở việc nghiên cứu một số trường từ vựng - ngữ nghĩa mà kết quả thống kê đã chỉ ra những "điểm nhấn". Cũng vậy, tác giả luận văn ý thức rằng nghiên cứu sự biến đổi của từ vựng qua các chặng đường sáng tác của tác giả là một việc làm có ích, để có thể có được những nhận xét chính xác về sự nghiệp sáng tác hay dùng làm cứ liệu so sánh với các tác giả khác, nhưng luận văn cũng chưa vượt qua được khó khăn để đạt mục đích này. Tóm lại, luận văn này đã thu thập và xử lý toàn bộ từ vựng trong 283 bài thơ ở bảy tập thơ của nhà thơ Tố Hữu và chỉ tiến hành khảo sát, phân tích những vấn đề được chỉ ra ở Chương 1, Chương 2 và Chương 3 của luận văn. 4. Lịch sử nghiên cứu ngôn ngữ thơ Tố Hữu Từ những năm 40 của thế kỷ XX đến nay đã có hàng trăm công trình nghiên cứu thơ Tố Hữu. Trong đó có công trình bàn nhiều về nhạc điệu (Nguyễn Trung Thu - 1968), về phong vị ca dao dân ca (Nguyễn Phú Trọng 1968), về phong cách (Nguyễn Văn Hạnh - 1970), về thể tài (Trần Đình sử 1985) và về thi pháp (Trần Đình sử - 1987, Đỗ Lai Thúy - 1989),... Về mặt ngôn ngữ, thơ Tố Hữu cũng đã được giới nghiên cứu chú ý. Tuy nhiên, số bài viết không nhiều, đặc biệt là không có bài nghiên cứu kỹ về từ vựng (bằng phương pháp thống kê định lượng). Chỉ có thể kể: Nguyễn Đức Quyền (1970) với bài viết Ta với mình trong bài thơ "Việt Bắc" của Tố Hữu; Lê Anh Hiền (1971), nghiên cứu về cách dùng tính từ chỉ màu sắc của Tố Hữu. Với Trần Đình Sử (1987), mặc dù ông rất thành công với Thi pháp thơ Tố Hữu nhưng ông cũng chỉ dành những dòng ít ỏi để nhận định rằng: 10 Thơ Tố Hữu rõ ràng là tiếng nói lớn của thời đại. Nhưng điều đó không có nghĩa là chúng ta đã rõ các đặc điểm làm nên hình thức của thơ ông, nhận thức đúng sự đổi mới về thơ mà Tố Hữu mang lại cho thơ ca dân tộc cũng như các giới hạn nhận thức và thể hiện đời sống của nó. Đó sẽ là công việc lâu dài của lịch sử. [20, 233-234]... Ngôn ngữ thơ Tố Hữu thuộc ngôn, ngữ thơ trữ tình điệu nói, khác với lời thơ cổ điển thuộc lối thơ trữ tình ngâm vịnh. Là một thành tựu xuất sắc của thơ Việt Nam hiện đại, thơ Tố Hữu khác với thơ cổ điển về một số nguyên tắc tổ chức lời thơ [20, 234-235]. Và như vậy Trần Đình sử cũng chưa đề cập đến một lớp từ vựng cụ thể nào trong thơ Tố Hữu. Xuân Nguyên (1991) cũng chỉ tập trung nghiên cứu một nhóm từ với bài viết Từ địa phương miền Trung trong thơ Tố Hữu. Trần Hữu Tá (2000), trong sách Văn học lớp 12, khi giới thiệu về Tố Hữu cũng chỉ đưa ra một nhận định khái quát về giọng điệu, hơi thơ và thể thơ, chứ không đề cập đến ngôn từ [21, 152]. Gần đây, có Nguyễn Thị Thúy Quỳnh (2003) nghiên cứu vần và hiệp vần trong thơ Tố Hữu; Nguyễn Thị Bích Thủy (2005) nghiên cứu về Tổ chức lời thơ trong thơ Tố Hữu. Nhìn chung, cho đến nay vẫn chưa có công trình nào mang tính toàn diện, sâu sắc và có hệ thống về ngôn từ trong thơ Tố Hữu. Tuy vậy, những ý kiến, những nhận định của các tác giả nghiên cứu thơ Tố Hữu ở mảng văn học hay ngôn ngữ học đều xác đáng, và do đó, có thể làm cơ sở cho quá trình nghiên cứu, đối chiếu, triển khai của chúng tôi. Trên tinh thần kế thừa những kết quả nghiên cứu về thống kê ngôn ngữ học, chúng tôi đã xử lý toàn bộ vốn từ vựng trong thơ Tố Hữu, tổng hợp những tài liệu có liên quan, từ những tài liệu thuộc về văn học đến những tư liệu về ngôn ngữ học như là công cụ để nghiên cứu, để dựng lên một bức tranh tổng thể về ngôn từ trong thơ Tố Hữu trên các bình diện theo lý thuyết của từ vựng học. 11 5. Nguồn tư liệu và phương pháp nghiên cứu Để khảo sát toàn bộ thơ Tố Hữu, chúng tôi sử dụng trực tiếp một số tư liệu sau: - Thơ Tố Hữu (2002), Nxb Văn hóa thông tin, TP HCM. - Từ điển tiếng Việt (2003), Hoàng Phê chủ biên, Nxb Đà Nẵng Trung tâm Từ điển học, HN - ĐN. - Từ điển Thành ngữ - Tục ngữ Việt Nam (2000), Vũ Dung, Vũ Thúy Anh, Vũ Quang Hào, Nxb Văn hóa thông tin, TP HCM. - Từ điển Từ láy tiếng Việt (1995), Viện Ngôn ngữ học, Nxb Giáo dục, HN. - Hán - Việt từ điển (1957) Đào Duy Anh, Nxb Trường Thi, Sài Gòn. - Thực hiện đề tài này, chúng tôi sử dụng một số phương pháp nghiên cứu sau: - Phương pháp thống kê - phân loại: Luận văn đặt vấn đề là tìm hiểu ngôn từ trong thơ Tố Hữu nhìn từ bình diện từ vựng, cho nên phương pháp thống kê - phân loại là phương pháp chủ đạo, giúp chúng tôi đưa ra những chứng cứ cụ thể, khi nghiên cứu. - Văn bản thống kê là toàn bộ 283 bài thơ trong bảy tập thơ của Tố Hữu trong tác phẩm Thơ Tố Hữu, năm 2004, Nxb Văn hóa thông tin. Đơn vị thống kê là từ, từ tổ cố định, thành ngữ, tên riêng, số đếm trong dãy số tự nhiên, cụm từ chỉ con số, cụm con số chỉ ngày tháng năm cụ thể và đơn vị viết tắt. Tuy nhiên, đơn vị từ vựng được chúng tôi xét đến để làm cứ liệu phân tích chỉ là từ, từ tổ cố định và thành ngữ (tên riêng được xét ở một khía cạnh khác). Chẳng hạn trong câu sau đây có 5 đơn vị từ vựng: Mặt trời / chân lý/ chói / qua / tim. Cũng cần nói thêm rằng tất cả các đơn vị từ vựng được thống kê đều được tra cứu và đối chiếu theo các Từ điển công cụ đã chỉ ra ở trên. 12 - Quá trình thống kê của chúng tôi cũng hết sức đơn giản, khả thi với những điều kiện vật chất chấp nhận được: sử dụng phần mềm Excel trên máy vi tính với sự trợ giúp của người làm thống kê. Đó là việc thống nhất và vạch ranh giới đơn vị thống kê để máy tính thực hiện theo yêu cầu. - Phương pháp định lượng: Trong văn bản được thống kê, sau khi xác định đơn vị từ vựng (gồm từ, từ tổ cố định và thành ngữ), chúng tôi ghi số lần xuất hiện của từng đơn vị từ vựng đó (gọi tắt là từ) 1 trên văn bản thống kê gọi là tần số của từ [4, 61]. Đem chia văn bản thống kê ra theo từng bài thơ, số lượng các bài thơ có mặt một từ nào đó là chỉ số độ phân bố của. từ vựng đó. Chẳng hạn từ tôi xuất hiện trong 137 bài thơ, vậy 137 là chỉ số độ phân bố của từ này. Chỉ số về độ phân bố (độ phủ toàn văn bản) R= 𝐿 𝑁 cho biết mức độ sử dụng rộng rãi hay hạn chế (tính phổ biến) của từ. Hai từ có cùng tần số nhưng từ nào có độ phân bố lớn hơn thì từ đó được dùng phổ biến hơn. Điều tra về độ phân bố (hay độ phủ văn bản) của từ có ý nghĩa thực tiễn rất lớn. Điều này sẽ được chúng tôi làm rõ ở các chương sau. - Bậc của một từ, khi so sánh hai từ với nhau, từ nào có tần số lớn hơn thì có bậc cao hơn, có nghĩa là từ nào có tần số cao nhất được xếp ở bậc 1. Như vậy, tiêu chuẩn để xếp hạng cho mỗi đơn vị từ vựng là tần số. Tần số và bậc giúp ta định lượng được vốn từ. Ví dụ về kết quả thống kê một số từ như sau: bậc (1), từ (2), tần số (3), độ phân bố (4): - Bảng 1.1. Kết quả thống kê một số từ trong thơ Tố Hữu (1) 12 11 10 9 8 (2) Ta Anh Người Tôi Cho (3) 821 410 392 333 306 1 (4) 156 79 136 70 80 Từ đây cho đến cuối luận văn khái niệm từ được hiểu là đơn vị từ vựng (gồm từ đơn, từ ghép, từ láy và thành ngữ) 13 7 6 Em Đời 296 253 68 57 - Phương pháp phân tích - tổng hợp: Để đi đến một nhận xét có tính ngôn ngữ có giá trị biểu hiện nghĩa, buộc chúng tôi phải phân tích từng số liệu thống kê để minh xác vấn đề. Phương pháp này tỏ ra rất hiệu quả trong việc đem lại những nhận thức mới từ vấn đề nghiên cứu. - Phương pháp so sánh: Ở một vài chỗ cần so sánh với các thể loại văn bản khác, chúng tôi đã sử dụng phương pháp này đưa ra nhận xét cho kết quả thống kê một cách khách quan hơn. - Bốn phương pháp trên đây không phải thực hiện riêng lẻ, biệt lập mà phối hợp với nhau trong suốt quá trình nghiên cứu, giải quyết những vấn đề mà luận văn đề ra. 6. Bố cục của luận văn - Ngoài phần mở đầu (9 trang), phần kết luận (3 trang), phần phụ lục (84 trang, lo phụ lục) và tài liệu tham khảo (3 trang, 30 tài liệu), luận văn gồm ba chương (86 trang), tập trung vào các vấn đề sau: - Trong chương 1 (19 trang, l0 bảng), luận văn chủ yếu tập trung vào một vấn đề cơ bản là vốn từ vựng. Trong chương 2 (32 trang, 14 bảng), luận văn đi vào khảo sát từ vựng trong thơ Tố Hữu trên các bình diện như cấu tạo, nguồn gốc, phạm vi sử dụng và mức độ sử dụng để qua đó chúng tôi xác định hiệu quả của kết quả thống kê và làm rõ giá trị biểu đạt của những con số ấy. Cuối cùng, ở chương 3 (35 trang, 15 bảng), luận văn chủ yếu khảo sát các chất liệu làm nên bốn trường từ vựng - ngữ nghĩa mà người viết quan tâm như: trường từ vựng chỉ con người số đông, trường từ vựng chỉ cảm xúc, trường từ vựng miêu tả màu sắc và trường từ vựng miêu tả âm thanh. 14 NỘI DUNG CHÍNH CHƯƠNG 1: TỔ CHỨC ĐỊNH LƯỢNG VỐN TỪ TRONG THƠ TỐ HỮU Như chúng ta biết, thơ Tố Hữu đã có những thành công đáng kể trong thơ ca Cách mạng và kế tục một truyền thống tốt đẹp của thơ ca Việt Nam qua nhiều thời đại. Sức thu hút của thơ Tố Hữu với những thế hệ người đọc mấy chục năm qua chủ yếu là ở niềm say mê lý tưởng và tính dân tộc đậm đà trong nội dung và hình thức của thơ ông. Vì vậy đi sâu nghiên cứu tổ chức định lượng vốn từ của thơ Tố Hữu (như: từ, cụm từ cố định, thành ngữ) là việc làm cần thiết. 1.1. Về tổ chức định lượng của vốn từ Vốn từ là số lượng đơn vị từ vựng xuất hiện trên ngữ liệu được khảo sát. Tổ chức định lượng vốn từ là nội dung của quá trình thống kê từ vựng. Tổ chức định lượng vốn từ chỉ có thể được bộc lộ sau khi Từ điển tần số thơ Tố Hữu 2được hoàn thành. Tìm hiểu về tổ chức định lượng vốn từ là chúng tôi xem xét cơ cấu tần số của vốn từ (ví dụ có bao nhiêu từ xuất hiện 1 lần); xem xét kích thước của vốn từ, tức là tìm tổng số từ khác nhau (L); xem xét kích thước của văn bản (độ dài của văn bản), tức là tìm tổng số lượt từ xuất hiện (N).Tại đây, với số liệu thống kê toàn tập, luận văn tập trung nghiên cứu độ phân bố từ vựng (hay độ phủ văn bản của từ) thuộc vùng tần số cao và thấp, giúp người viết có số liệu để kết luận về ý nghĩa của từ thường dùng nhất hay các từ ít dùng có số lượng như thế nào và độ phủ văn bản của chúng ra sao. Luận văn cũng có thể xét độ phong phú từ vựng, vì hướng khảo sát này sẽ cho 2 Ở đây ta xem như vấn đề nhận dạng từ đã được giải quyết, nghĩa là ta có thể nhận dạng được cái gọi là từ trong văn bản. Khi đó ta phải nhận dạng ra được đâu là từ A, đâu là từ B, … và đếm được trên văn bản mà ta khảo sát có bao nhiêu từ A, bao nhiêu từ B, … kết quả đó đếm được phản ánh trong một Từ điển tần số, tức là một danh sách mà ở đó mỗi phần tử mang ít nhất là hai thông tin: dạng thức của đối tượng được thống kê và tần số suất hiện của nó trong văn bản. 15 ra một chỉ số có thể dùng để đánh giá vốn từ cũng như độ phong phú từ vựng và tính dễ hiểu của từ trong thơ Tố Hữu. Đây là nội dung quan trọng của thống kê từ vựng (ở chương này) dựa trên từ điển tần số (có đảm bảo một cách tương đối về tính chân thực của kết quả đo đếm). Cuối cùng, luận văn cũng quan tâm đến từ có tần số xuất hiện cao nhất, vì ở đây người viết có thể chứng minh cho ra một phần ý nghĩa nội dung của văn bản đang xét. Với số liệu thống kê của từng tập, tác giả luận văn chỉ thực hiện hai thao tác, đó là so sánh độ phong phú từ vựng của các tập với nhau (tuy chưa phải là cách làm tối ưu) và có thể theo dõi được tốc độ tăng thêm từ mới khi số lượng tác phẩm tăng dần qua từng chặng đường thơ của Tố Hữu, đồng thời có thể so sánh được tỉ số R= 𝐿 𝑁 (độ phong phú từ vựng) trong chặng đường thơ này với toàn bộ chặng đường thơ khác, khi số lượng các bài thơ tăng dần (tức văn bản dần dài hơn). 1.2. Phân tích kết quả định lượng vốn từ 1.2.1. Độ phân bố và độ phong phú từ vựng trong thơ Tố Hữu (với số liệu thống kê toàn tập) Trong toàn bộ văn bản thơ Tố Hữu, chúng tôi đã thống kê được 60099 đơn vị. Trong số đó có: - 1908 tên riêng, chiếm 3,17% (ví dụ: Hồ Chí Minh, Trường Sơn, Nga, Nguyễn Trãi,...) và 512 đơn vị viết hoa tu từ, chiếm tỉ lệ 0,85%, ví dụ: Chân, Thiện,Mĩ … - 54 số đếm trong dãy số tự nhiên (ví dụ: 50, 29, 71,...) chiếm 0,09%, 16 - 4 cụm số đếm gồm số và chữ, chiếm 0,01% (ví dụ: 31 triệu, 50 triệu, 75 triệu), - 7 cụm số chỉ ngày, tháng, năm cụ thể, chiếm 0,01% (ví dụ: 5-8, 9-8,138 và - 175 cụm từ chỉ số đếm, chiếm 0,29% (ví dụ: sáu trăm triệu, nghìn chín trăm bảy chín, hai mươi lăm triệu,...). Như vậy, tổng số lượt từ không tham gia vào việc định lượng vốn từ trong thơ Tố Hữu (ở chương 1 và chương 2) là 2760, còn N = 57339 lượt từ. Trong số này có L = 6102 từ khác nhau. Như đã chỉ ra ở mục 1.1, ở chương này luận văn tập trung xét độ phân bố và độ phong phú của từ vựng ở các phần sau nay. 1.2.1.1. Độ phân bố của các từ thuộc vùng tần số cao và thấp Theo Từ điển tần số thơ Tố Hữu (phụ lục 10), chúng tôi tạm chia từ vựng trong thơ Tố Hữu thành hai vùng tần số để tiện xem xét độ phân bố (độ phủ văn bản) của chúng: vùng tần số cao (là những từ có tần số lớn hơn 11) và vùng tần số thấp (là những từ có tần số nhỏ hơn 11). a. Độ phân bố của các từ thuộc vùng tần số cao Luận văn xét độ phân bố của từ vựng có tần số cao là nhằm chỉ ra một cách cụ thể mức độ sử dụng rộng rãi (tính phổ biến) của chúng, bằng cách lập bảng gồm 8 vùng tần số. Trong mỗi vùng, chúng tôi tính 7 chỉ số (ở 7 cột) với các ý nghĩa cụ thể như sau (lấy vùng tần số 500 -> 587 trong bảng 1.2 để minh họa): Cột (1): Vùng tần số: Trong vùng này, tần số thấp nhất là là 500 và tần số cao nhất là 587. Cột (2): Số lượng từ khác nhau: Trong vùng này có Li = 2 từ khác nhau. 17 Cột (3): Toàn tập thơ Tố Hữu có L = 6102 từ khác nhau, vậy số lượng các từ khác nhau trong vùng này chiếm một tỉ lệ là: 2 𝐿𝑖 × 100 = × 100 = 0,03% 6102 𝐿 - Cột (4): Tổng số từ khác nhau ở các vùng trước đó và vùng này gộp lại đã chiếm một tỉ lệ: 0,02% 4- 0,03% = 0,05%. - Cột (5): Tổng số lượt từ đã dùng trong vùng này, kí hiệu bằng Li x fi, ta được: Li x fi = 1087. - Cột (6): Ta có N = 57339, vậy tổng tần số ở vùng này đã phủ bao nhiêu phần trăm văn bản? 1087 𝐿𝑖 × 𝑓𝑖 %= × 100 = 1,90% 57339 𝑁 Cột (7): Cho tới vùng này, tổng tần số của các từ của tất cả các vùng đã phủ bao nhiêu phần trăm văn bản: 1,43% + 1,90% = 3,33%. Điều này cho người viết biết rằng 3 từ hay dùng nhất trong toàn bộ sáng tác của Tố Hữu (đó là các từ ta, một, những) đã chiếm tới 3,33% văn bản. Các kết quả thống kê chi tiết được trình bày trong bảng 1.2: Bảng 1.2. Độ phân bố của từ thuộc vùng tần số cao trong thơ Tố Hữu Vùng tần số fi (1) Số lượng từ khác nhau Li (2) Tỉ lệ phần trăm 𝐿𝑖 Số từ 𝐿 (%) (3) Tổng tần số Li x fi Tổng số từ ∑ 𝐿𝑖 (%) 𝐿 (4) Tỉ lệ phần trăm Độ phủ văn bản (%) 𝑁 𝐿𝑖×𝑓𝑖 (5) (6) Độ phủ văn bản tổng cộng ∑ 𝐿𝑖×𝑓𝑖 (%) 𝑁 (7) 821 1 0,02% 0,02% 821 1,43% 1,43% 500587 3 2 0,03% 0,05% 1087 1,90% 3,33% 3 Vùng tần số này được dùng để minh họa cho phần xét độ phân bố từ vựng ở vùng tần số cao. 18 410457 5 0,08% 0,013% 1771 3,09% 6,42% 306392 10 0,16% 0,29% 3430 5,98% 12,40% 205296 22 0,36% 0,66% 5526 9,64% 38,98% 100199 68 1,11% 1,77% 9715 16,94% 38,98% 5099 125 2,05% 3,82% 8132 14,18% 53,16% 1149 662 10,85% 14,66% 14544 25,36% 78,53% (Xin xem Từ điển tần số thơ Tố Hữu - Phụ lục 10 để biết danh sách các từ thuộc 8 vùng tần số cao này) Như vậy số từ có tần số từ 11 đến 821 phủ 78,53% văn bản và tổng số từ khác nhau chiếm tỉ lệ 14,66%. số từ còn lại thuộc vùng tần số thấp. Luận văn tiếp tục xét từ thuộc vùng tần số thấp ở phần sau đây. b. Độ phân bố của các từ thuộc vùng tần số thấp Thực hiện sự tính toán tương tự cho các từ có tần số thấp nhất, từ 10 trở xuống, luận văn có bảng 1.3: Bảng 1.3. Độ phân bố của từ thuộc vùng tần số thấp trong thơ Tố Hữu Vùng tần số fi (1) Số lượng từ khác nhau Li (2) Tỉ lệ phần trăm 𝐿𝑖 Số từ 𝐿 (%) (3) Tổng tần số Li x fi Tổng số từ ∑ 𝐿𝑖 (%) 𝐿 (4) Tỉ lệ phần trăm Độ phủ văn bản (%) 𝑁 𝐿𝑖×𝑓𝑖 (5) (6) Độ phủ văn bản tổng cộng ∑ 𝐿𝑖×𝑓𝑖 (%) 𝑁 (7) 1 2772 45,42% 45,42% 2772 4,83% 4,83% 2 923 15,12% 60,54% 1846 3,22% 8,05% 4 284 4,65% 73,41% 1136 1,98% 12,66% 5 184 3,01% 76,42% 920 1,60% 14,26% 6 171 2,80% 79,22% 1026 1,79% 16,05% 7 135 2,21% 81,44% 945 1,65% 17,70% 8 100 1,64% 83,07% 800 1,40% 19,09% 9 85 1,39% 84,47% 765 1,33% 20,43% 19 10 60 0,98% 85,45% 600 1,05% 21,47% (Xin xem Từ điển tần số thơ Tố Hữu - Phụ lục 10 để biết danh sách của các từ thuộc vùng tần số thấp này) Như vậy số từ có tần số từ 1 đến 10 phủ 21,47% văn bản và tổng số từ khác nhau thì chiếm tỉ lệ đến 85,45% văn bản. Tính đối nghịch giữa tỉ lệ phần trăm tổng số từ khác nhau với tỉ lệ phần trăm độ phủ văn bản tổng cộng của từ có tần số cao và từ có tần số thấp có thể nhìn rõ hơn ở bảng 1.4: Bảng 1.4. Độ phân bố (độ phủ văn bản) từ có tần số cao và từ có tần số thấp trong thơ Tố Hữu Vùng tần số fi CAO (11821) THẤP (110) Tỉ lệ phần trăm tổng số từ khác ∑ 𝐿𝑖 nhau 𝐿 (%) 14,65% 85,45% Tỉ lệ phần trăm độ phủ văn ∑ 𝐿𝑖×𝑓𝑖 bản tổng cộng 𝑁 (%) 78,53% 21,47% Như vậy, xét trong sự đối lập với từ thuộc vùng tần số cao, từ thuộc vùng tần số thấp chiếm 85,45%, tương đương với 5215 từ khác nhau, nhiều gấp 5,88 lần số từ thuộc vùng tần số cao. Hay nói cách khác, số từ xuất hiện từ 11 lần trở lên chỉ chiếm gần một phần sáu tổng số từ khác nhau, tương đương 887 từ khác nhau. Đây chính là số liệu chứng minh cho độ phong phú từ vựng của thơ Tố Hữu mà luận văn sẽ xem xét cụ thể dưới đây. 1.2.1.2. Nội dung ý nghĩa của một số từ có độ phân bố cao Kết quả thống kê độ phân bố của từ có tần số cao ở mục 1.2.1.1 đã giúp ta dễ nhận ra những từ có tần số cao đặc biệt. Chúng tôi thấy có 22 từ xuất hiện hơn 200 lần, 10 từ xuất hiện hơn 300 lần, 4 từ xuất hiện hơn 400 lần, 3 từ xuất hiện trên 500 lần và từ ta xuất hiện đến 821 lần, cụ thể như bảng 1.6: Bảng 1.6: Bảng từ có tần số xuất hiện trên 200 lần (1) ta (2) 821 (3) 1 (4) 1,43% (1) 20 (2) (3) (4)
- Xem thêm -