Vì sao tiếng Việt không cùng nguồn gốc với tiếng Hán?
Nguyễn Hải Hoành
Mối quan hệ giữa tiếng Việt với tiếng Hán là một vấn đề lớn luôn được mọi người quan tâm và là đối tượng nghiên cứu của giới ngôn ngữ học Việt Nam cũng như quốc tế trong gần 150 năm nay. Một số kết quả nghiên cứu liên quan đã được công bố, trong đó tác phẩm xuất bản gần đây nhất là cuốn “Lịch sử ngôn ngữ người Việt” [1] dày hơn 600 trang, ghi lại kết quả ngót 50 năm nghiên cứu vấn đề trên của nhà ngôn ngữ học Việt Nam nổi tiếng – giáo sư, tiến sĩ Trần Trí Dõi. Tác giả đưa ra một số quan điểm đáng chú ý về nguồn gốc tiếng Việt và nguồn gốc dân tộc ta, là những vấn đề mọi người đều rất quan tâm. Vì vậy tuy là kẻ ngoại đạo với ngôn ngữ học nhưng người viết bài này vẫn xin phát biểu một vài ý kiến nhỏ, nếu có sai sót, mong được quý vị chỉ giáo.
Thông thường khi nghiên cứu nguồn gốc của một ngôn ngữ, bao giờ người ta cũng trước hết định vị ngôn ngữ đó thuộc vào nhóm ngôn ngữ nào, nhánh ngôn ngữ nào, cuối cùng thuộc ngữ hệ nào. Hiểu đơn giản, ngữ hệ (họ ngôn ngữ, language family) là tên gọi chung một tập hợp các ngôn ngữ có cùng nguồn gốc; như vậy các ngôn ngữ khác ngữ hệ thì không có chung nguồn gốc.
Sách “Lịch sử ngôn ngữ người Việt” có nêu vấn đề cha cố J. S. Theurel từng đưa ra nhận xét “tiếng Việt phần lớn bắt nguồn từ tiếng Hán” – có ghi trong cuốn Dictionarium Anamitico – Latinum (Từ điển Annam-Latin) của Theurel, ấn hành tại Ninh Phú năm 1877 [2]. Nhận xét này dựa trên chứng cớ hiển nhiên là trong tiếng Việt có rất nhiều từ gốc Hán và có một số hiện tượng ngữ pháp rất giống tiếng Hán, vì thế được một số người tán đồng, hình thành quan điểm cho rằng ngôn ngữ của người Việt có nguồn gốc ở tiếng Hán, tiếng Việt là một ngôn ngữ thuộc nhóm tiếng Hán của ngữ hệ Hán-Tạng (Sino-Tibetan), nghĩa là tiếng Việt, tiếng Hán có chung ngữ hệ, tức chung nguồn gốc. Từ đó suy ra người Việt có nguồn gốc ở phương Bắc, về sau di cư xuống miền Nam. Rốt cuộc vấn đề này có liên quan tới nguồn gốc dân tộc ta.
Năm 1912, nhà khoa học người Pháp ở Viện Viễn đông Bác cổ Henri Maspéro (1883-1945) nhận định tiếng Việt có nguồn gốc nhóm tiếng Thái (Taic). Căn cứ vào những chứng cớ mới rất chi tiết và có tính hệ thống chủ yếu về ngữ âm, dựa trên lập luận chặt chẽ, Maspéro đưa ra những kết luận thuyết phục được giới ngôn ngữ học suốt nửa thế kỷ sau đó, thậm chí sang thế kỷ XXI vẫn có người ủng hộ. Hiện nay ta biết, tiếng Thái thuộc ngữ hệ Tai-Kadai, khác với ngữ hệ của Hán ngữ, như vậy nghĩa là Maspéro cho rằng tiếng Việt không cùng nguồn gốc với tiếng Hán.
Nhưng đến các năm 1953, 1954 và 1966, một nhà ngôn ngữ học người Pháp rất nổi tiếng là André-Georges Haudricourt (1911-1996) công bố mấy bài báo phản bác quan điểm nói trên, cho rằng tiếng Việt có nguồn gốc Môn-Khmer, thuộc ngữ hệ Nam Á (Austroasiatic), nghĩa là không cùng nguồn gốc với tiếng Thái hoặc tiếng Hán. Lập luận của Haudricourt rất vững chắc và có nhiều chứng minh đầy sức thuyết phục, được nhiều nhà ngôn ngữ học Việt Nam và nước ngoài tán thành.
Trong nghiên cứu, các học giả đều xem xét mối quan hệ đối ứng từ vựng giữa tiếng Việt với các ngôn ngữ đối chiếu và chia từ vựng làm hai lớp: từ cơ bản và từ văn hoá. “Từ cơ bản” là những từ vựng thông dụng nhất, như từ mô tả các bộ phận cơ thể con người (chân, tay, mắt, mũi), từ nhân xưng (bố, mẹ, con, tôi, tao, mày), tên các vật xung quanh (nhà, cửa, trời, đất, trăng, sao), số đếm (một, hai, ba), tên gia súc (chó, mèo, trâu, bò, lợn), nhu cầu sống (ăn, uống, bú, ỉa, đái), cảm nhận (đau, giận, vui, buồn), v.v., là những từ liên quan tới nguồn gốc con người, nguồn gốc ngôn ngữ, là những từ con trẻ nói được khi bắt đầu biết nói, chưa bị ảnh hưởng của ngôn ngữ khác. Từ thuần Việt trong tiếng Việt hoặc từ thuần Hán trong tiếng Hán đều thuộc loại từ cơ bản.
Những từ ngữ có được sau khi tiếp xúc với một nền văn hoá khác thì thuộc loại “từ văn hoá”, thường là những từ có tính chất trừu tượng, tư tưởng, khái niệm, thuộc lĩnh vực văn hoá, ví dụ: đông, tây, đạo, lý. Từ văn hoá thường xuất hiện sau từ cơ bản hàng nghìn năm, vì thế nó không có liên quan đến nguồn gốc ngôn ngữ. Khi xác định nguồn gốc ngôn ngữ, nhất thiết phải dựa vào các từ cơ bản mà không dựa vào các từ văn hoá.
Sau khi phân loại từ vựng, Haudricourt nhận thấy số lượng từ thuần Việt tương ứng với từ trong ngôn ngữ Môn-Khmer thì nhiều hơn số lượng từ thuần Việt tương ứng với từ trong tiếng Thái, từ đó ông kết luận tiếng Việt có nguồn gốc Môn-Khmer chứ không phải có nguồn gốc Thái. Khi nghiên cứu vấn đề thanh điệu của tiếng Việt, ông cũng đi tới kết luận như vậy.
Từ vựng tiếng Việt hiện đại gồm từ thuần Việt, từ Việt gốc Hán (tức từ Hán-Việt), và từ ngoại lai. Từ thuần Việt ra đời cùng với tiếng Việt, gắn với nguồn gốc dân tộc, thể hiện tính cội nguồn của ngôn ngữ, thuộc vào lớp từ cơ bản. Từ Việt gốc Hán ra đời sau khi nước ta tiếp xúc nền văn hoá Trung Hoa, cho nên thuộc lớp từ văn hoá. Từ ngoại lai ra đời sau khi Việt Nam tiếp xúc văn hoá Âu Mỹ, ví dụ các từ pho mát, ô tô, sô (show), ây-ai (AI).
Từ Hán-Việt là loại từ vựng do tổ tiên ta sáng tạo ra trong quá trình tiếp nhận chữ Hán. Thông thường người học chữ Hán đều phải đọc chữ theo âm tiếng Hán. Nhưng chữ Hán lại không có phát âm thống nhất trong toàn Trung Quốc, mà mỗi vùng phát âm theo cách riêng gọi là phương ngữ (tiếng địa phương). Người Trung Quốc sang ta nói nhiều phương ngữ khác nhau, người Việt không biết nên đọc chữ Hán theo cách phát âm nào, đây là khó khăn lớn nhất khi họ học chữ Hán.
Để vượt qua khó khăn trên, tổ tiên ta đã sáng tạo ra cách đọc chữ Hán theo âm tiếng Việt mà không đọc theo âm Hán, tức Cách phiên âm chữ Hán thành từ Hán-Việt. Mỗi chữ Hán đơn âm được phiên âm thành một từ Hán-Việt, từ này có âm đọc thống nhất trong toàn dân Việt, gọi là âm Hán-Việt. Âm đọc ấy được chọn gần giống âm đọc từ vựng tiếng Hán, vì thế hầu hết từ Hán-Việt đọc lên nghe gần giống từ tiếng Hán. Ví dụ chữ 文tiếng Hán đọc “uấn”, ta đọc tiếng Việt là “văn”. Qua đó đã thực hiện phiên âm toàn bộ chữ Hán sang tiếng Việt, mượn được toàn bộ kho chữ Hán về dùng, nhưng chỉ mượn chữ Hán mà không mượn tiếng Hán. Do tiếng Hán và tiếng Việt đều là ngôn ngữ đơn âm tiết (đơn lập, monosyllabic) nên việc phiên âm một đối một tương đối thuận tiện. Từ Hán-Việt là kết quả phiên âm chữ Hán, và chữ Hán trở thành ký tự ghi từ Hán-Việt, nhưng không ghi được từ thuần Việt. Ví dụ chữ Hán 文化 ghi từ Hán-Việt “văn hoá”.
Từ Hán-Việt là từ vay mượn của chữ Hán. Nhờ mượn thêm từ ngoại nên kho từ vựng tiếng Việt tăng lên nhiều và ngày càng tăng. Năm 1912 Maspéro nói từ Hán-Việt chiếm 60% tổng số từ tiếng Việt. Năm 2001 Cao Xuân Hạo nói tỷ lệ này là 70%. Nghĩa là chữ Hán vào Việt Nam đã làm số lượng từ tiếng Việt tăng 2,5-3 lần. Trong thực tế, người Việt dùng từ rất linh hoạt, như ghép với từ thuần Việt (tái đàn, cận nghèo) hoặc ghép từ Hán-Việt với nhau không theo quy tắc giữ gốc Hán (bán dẫn, giải ngân), cho nên kho từ vựng tiếng Việt có khả năng tăng vô hạn.
Từ Hán-Việt còn giúp người Việt thuận lợi chuyển ngữ các từ vựng ngoại văn: khi ấy chỉ cần đọc âm Hán-Việt của từ Hán hoặc từ Kanji mà người Trung Quốc hoặc người Nhật chuyển ngữ từ ngoại văn đó, là được kết quả. Ví dụ từ tiếng Anh “pragmatism”, người Nhật chuyển sang chữ Kanji là 實用主義, ta đọc Hán-Việt là “thực dụng chủ nghĩa”, được ngay kết quả cần tìm.
Tóm lại sáng kiến phiên âm chữ Hán thành từ Hán-Việt đã giúp người Việt thuận lợi tiếp nhận chữ Hán mà hoàn toàn không nói tiếng Hán, đồng thời làm cho kho từ vựng tiếng Việt có khả năng phát triển hầu như vô hạn. Đây là một thành tựu kiệt xuất về ngôn ngữ học của tổ tiên ta.
Thế nhưng không thể vì tiếng Việt có nhiều từ gốc Hán mà cho rằng tiếng Việt có nguồn gốc ở tiếng Hán, bởi lẽ từ Hán-Việt không phải là từ cơ bản, mà thuộc lớp từ văn hoá, chỉ xuất hiện sau khi người Việt tiếp xúc văn hoá Trung Hoa, tức khi nước ta bị Triệu Đà thôn tính và người Việt bắt đầu học Hán ngữ, nghĩa là sau từ thuần Việt nhiều nghìn năm, do đó từ Hán-Việt dù nhiều đến đâu cũng không ảnh hưởng gì đến nguồn gốc tiếng Việt.
Khi so sánh các từ thuần Việt với các từ thuần Hán, cũng không thấy từ thuần Việt nào có âm đọc giống với từ thuần Hán tương ứng. Sự khác nhau về từ cơ bản chứng tỏ tiếng Việt không cùng nguồn gốc với tiếng Hán. Điều đó còn được chứng tỏ ở chỗ tiếng Việt có ngữ âm phong phú (gấp 14 lần tiếng Hán) và ngữ pháp khác tiếng Hán. Từ Hán-Việt được dùng theo ngữ pháp tiếng Việt, do đó người Trung Quốc không thể nghe hiểu câu tiếng Việt có nhiều từ Hán-Việt, tuy rằng nhìn chữ thì hiểu. Nghĩa là tiếng Việt tuyệt đối không phải là một phương ngữ của tiếng Hán.
Từ Hán-Việt chỉ là từ vay mượn (loan words) Hán ngữ. Các ngôn ngữ trên thế giới đều có vay mượn từ vựng của các ngôn ngữ khác. Tiếng Trung Quốc hiện đại có khoảng 70% từ thuộc lĩnh vực khoa học xã hội-nhân văn là từ vay mượn tiếng Nhật. Đó là những từ vựng người Nhật chuyển ngữ từ tiếng Anh, Pháp, Tây Ban Nha… sang chữ Kanji (chữ Hán-Nhật), ví dụ các từ government, people, economy chuyển ngữ thành chính phủ, nhân dân, kinh tế. Ngôn ngữ học cho biết: từ văn hoá thường dễ vay mượn, còn từ cơ bản thì hiếm khi có vay mượn. Ví dụ tên tiếng Việt gọi các bộ phận cơ thể con người khác xa tên gọi tương ứng trong các thứ tiếng khác. Thiển nghĩ có thể suy ra ban đầu dân ta chỉ nói các từ thuần Việt, sau khi tiếp nhận chữ Hán thì bắt đầu nói các từ Hán-Việt, và ngày càng nói nhiều, nhất là khi nói đề tài xã hội, thời sự, nghị luận, đặc biệt trong văn bản, sách báo. Như trong Hiến pháp Việt Nam, tỷ lệ từ Hán-Việt lên tới khoảng 90%.
Hiện nay giới ngôn ngữ học chính thống Việt Nam và thế giới xếp tiếng Việt thuộc ngữ hệ Nam Á, nhánh Môn-Khmer, nhóm tiếng Việt (Vietic, Việt-Mường); Hán ngữ thuộc ngữ hệ Hán-Tạng. Việc tiếng Việt, tiếng Hán thuộc hai ngữ hệ khác nhau chứng tỏ ngôn ngữ Việt không cùng nguồn gốc với ngôn ngữ Hán. Đây là một kết luận quan trọng thu được sau 150 năm nghiên cứu vấn đề nguồn gốc tiếng Việt. Trên cơ sở ấy GS Trần Trí Dõi nhận định: Như vậy thì cội nguồn văn hoá Việt Nam cũng không thể chung nguồn gốc với văn hoá Hán.
Thiển nghĩ vì tiếng Việt khác ngữ hệ với các ngôn ngữ Bách Việt, suy ra tiếng Việt cũng không cùng nguồn gốc với các ngôn ngữ Bách Việt, ví dụ nghiên cứu của Lương Đình Vọng cho rằng Tráng ngữ là hậu duệ của ngôn ngữ Lạc Việt [3] thuộc ngữ hệ Tai-Kadai, các ngôn ngữ khác của Bách Việt đều thuộc ngữ hệ Hán-Tạng.
Tác giả sách Lịch sử ngôn ngữ người Việt còn đưa ra một nhận định quan trọng: Về mặt ngôn ngữ, đã có đủ cơ sở để cho rằng cộng đồng người nói tiếng Việt thực sự là một trong những cộng đồng cư dân bản địa chính từ thời tiền sử của vùng Đông Nam Á văn hoá, chứ hoàn toàn không phải là những cư dân di cư từ phương Bắc tới. Đây là một quan điểm đúng đắn về lịch sử dân tộc Việt, là kết quả nghiên cứu dựa trên sự tìm hiểu nguồn gốc ngôn ngữ của dân tộc trong sự so sánh với ngôn ngữ các dân tộc ở gần, tức dựa trên các nguyên tắc có căn cứ khoa học tin cậy của ngôn ngữ học lịch sử và so sánh (Historical-Comparative Linguistics).
Kết luận nói trên cho thấy dân tộc Việt được hình thành trên mảnh đất này từ thời tiền sử, tức khoảng hơn 20 nghìn năm trước. Theo thuyết “Đi khỏi châu Phi” (Out of Africa), có thể trước đó tổ tiên ta từ châu Phi di cư tới đây. Năm 1923, nhà khảo cổ Madeleine Coloni phát hiện di cốt người Việt cùng nền văn hoá của họ trong hang đá ở tỉnh Hoà Bình, các di vật này có niên đại 18.000 năm trước Công nguyên. Hiện nay Trung tâm Nghiên cứu Tiền sử Đông Nam Á của Tiến sĩ Nguyễn Việt vẫn tiếp tục khai quật di vật của nền Văn hoá Hoà Bình.[4].
Lịch sử lâu đời giúp cho người Việt có đủ thời gian tạo được một ngôn ngữ chín muồi, cực giàu âm tiết (syllable). So với Hán ngữ, tiếng Việt có số âm tiết cơ bản nhiều gấp 10 lần, số âm tiết chi tiết gấp 14 lần. [5], [6], [7]. Ưu thế đó làm cho tiếng Việt trở nên vững bền không dễ bị đồng hoá bởi các ngôn ngữ nghèo ngữ âm như Hán ngữ.
Thiển nghĩ, kết luận người Việt “hoàn toàn không phải là cư dân di cư từ phương Bắc tới” cho thấy dân tộc ta thời cổ không có quan hệ gần gũi với các dân tộc ở phía Bắc biên giới Trung-Việt, với nhóm bộ tộc gọi là “Bách Việt”, chẳng những về địa lý ở xa cách họ mà về ngôn ngữ hoàn toàn không chung nguồn gốc: ngôn ngữ các tộc đó đều thuộc ngữ hệ khác ngữ hệ của tiếng Việt. Có thể suy ra người Việt nguyên thuỷ sống ở vùng núi Sơn La-Hoà Bình-Thanh Hoá, về sau các bộ tộc người Kinh di chuyển dần xuống vùng trung du Yên Bái, Phú Thọ, trong khoảng 2000 năm gần đây di chuyển dần xuống vùng châu thổ sông Hồng sau khi con sông này hoàn thành việc bồi đắp vùng cuối sông. [8]. Riêng các bộ tộc người Mường anh em gần nhất của người Kinh thì vẫn ở lại vùng núi cho đến nay.
Cần nhấn mạnh, việc người Việt dùng chữ Hán nhưng hoàn toàn không nói tiếng Hán đã mang lại kết quả tất nhiên là tuy văn hoá Việt trong hơn 1000 năm Bắc thuộc từng bị Hán hoá mạnh mẽ, nhưng tiếng Hán không thể đồng hoá được ngôn ngữ của người Việt. Nhờ giữ được nguyên vẹn tiếng mẹ đẻ mà dân tộc cùng quốc gia này tồn tại đến ngày nay – đây là thắng lợi vĩ đại nhất trong lịch sử dân tộc Việt Nam. Ai cũng biết văn hoá Hán có sức đồng hoá rất mạnh. Ví dụ dân tộc Mãn từng chiếm đóng cai trị Trung Quốc 276 năm, thời kỳ đầu họ ra sức Mãn hoá ngôn ngữ và văn hoá của người Hán, nhưng chỉ sau một thế kỷ, chính họ lại bị Hán hoá, toàn bộ dân tộc Mãn chỉ nói tiếng Hán, dùng chữ Hán.
Thời Bắc thuộc có nhiều người Bách Việt (chủ yếu là binh lính) sang Việt Nam định cư, ngôn ngữ của họ có tác động đến kết quả phiên âm chữ Hán, tức từ Hán-Việt. Ví dụ chữ Hán 学习tiếng Quảng Đông là “hoọc chập”, từ Hán-Việt là “học tập”, tuy rằng tiếng Bắc Kinh là “xuế xí”. Nhưng vì họ nhanh chóng bị Việt Nam hoá (lấy vợ Việt, con cháu nói tiếng Việt) cho nên ảnh hưởng của ngôn ngữ Bách Việt đối với tiếng Việt hầu như không có gì đáng kể.
Tóm lại, tiếng Việt là ngôn ngữ gần gũi nhất với Hán ngữ và chịu ảnh hưởng lớn của Hán ngữ nhưng lại không cùng nguồn gốc với Hán ngữ và không bị Hán hoá cho dù Việt Nam từng là quận huyện của Trung Quốc trong hơn 1000 năm. Chẳng rõ còn có dân tộc nào khác từng làm được điều kỳ diệu tương tự?
NGUYỄN HẢI HOÀNH
Ghi chú:
[1] Trần Trí Dõi: “Lịch sử ngôn ngữ người Việt – Góp phần tìm hiểu văn hoá Việt Nam”, Nxb ĐHQGHN, 2022.
[2] Joseph Simon Theurel, 1829-1868, người Pháp, Giám mục Giáo phận Hà Nội 1859-1868. Nhà thờ Kẻ Sở (Ninh Phú) ở thị trấn Kiện Khê, Hà Nam thuộc Giáo phận Hà Nội là một trong bốn nhà thờ ở Việt Nam được phong là Vương cung Thánh đường.
[3] 梁庭望: 《骆越方国研究》民族出版社, 2017年.
[4] “Văn hoá Hoà Bình: Nền văn hoá tiền sử độc đáo”. Báo Điện tử Chính phủ, 30/8/2023.
[5] Nguyễn Quang Hồng: “Âm tiết và loại hình ngôn ngữ”, Nxb ĐHQG Hà Nội, 1995.
[6] 苏培成: “二十世纪的现代汉字研究”, 书海出版社, 2001年.
[7] Nguyễn Hải Hoành: “Một vài tìm tòi về ngôn ngữ”, tạp chí Tia Sáng số 11/2020.
[8] Li Tana: “A Historical Sketch of the Landscape of the Red River Delta” Cambridge University Press, 2016.
Nguồn: Văn Việt