Đôi khi tôi nghĩ về sự linh động của tiếng Việt.
Ở đây có hai điểm tôi muốn đào sâu. Một là tiếng Việt linh động bởi nó thiếu đi sự khắt khe của các hàm ngữ nghĩa và cú pháp. Vì thế, đôi khi ta nói vậy mà không phải vậy. (Ví dụ, “Chết thật! Chết thật!”, hay “cái thằng trời đánh”). Câu nghe càng xuôi trong tiếng Việt lại càng khó để dịch sang tiếng khác. Đôi khi, khái niệm chỉ sự vật không trỏ đến đúng y và duy nhất một sự vật. Tôi đã từng viết về chuyện hoa cúc trong tiếng Việt là một khái niệm rất mông lung. Nó cùng trỏ đến nhiều loại, thậm chí nhiều chi cây cỏ khác nhau.
Từ đó, chúng ta có thể đặt ra một câu, về mặt phân loại học rất logic nhưng về mặt ngữ nghĩa thì gần như ngớ ngẩn: Trong họ Cúc có chi Cúc, chi Cúc vạn thọ, lẫn chi Cúc vạn thọ tây. Trong chi Cúc vạn thọ có loài Cúc vạn thọ nhỏ.
(đọc lại bài “hoa cứt lợn”)
Sự mông lung trong tiếng Việt không phải chủ đề mới, nhất là với những ai hay làm công việc chuyển đổi qua lại giữa tiếng Việt và ngôn ngữ nước ngoài. (Không chỉ là với người làm nghề dịch đâu, mà cả báo chí và dân viết PR, copywriter nữa. Tôi từng rất chật vật để viết một đoạn ngắn mô tả một dòng rượu whisky, nào là “đậm vị khói”, “nốt có vị hạt dẻ” hay “hậu vị của hoa oải hương”, kiểu kiểu vậy — rất khó truyền đạt những ý tưởng đó bằng tiếng Việt thuần.)
Nhưng điểm thứ hai thú vị hơn và ít có ai nhắc đến. Sự mông lung của tiếng Việt phải chăng là một hình thứ phản-độc đoán, sự chống lại một thứ bạo quyền về ngôn ngữ?
Tiếng Việt luôn bị ảnh hưởng đậm (với hàm lượng ở mỗi thời điểm khác nhau) từ tiếng Trung và tiếng Tây (Pháp, Anh, Nga, etc.). Chúng ta luôn cần phải mượn những thuật ngữ từ tiếng nước ngoài, cụ thể là từ những nước có vòng ảnh hưởng văn hóa mạnh. Về mặt lịch sử chúng ta có dòng chảy về mặt tri thức và tư tưởng từ Trung Quốc và Nga vào Việt Nam. Nốt gắn bó chủ đạo là các âm Hán Việt mà đa số người Việt đều cảm thấy gần gũi. Vì thế dễ dàng nhất là dùng chữ Hán để chuyển tải một khái niệm phức tạp. (“Chủ nghĩa xã hội khoa học” là ví dụ về mượn có ích; “thu dung”, hay “di biến động dân cư” gần đây là ví dụ về mượn hỏng).
Có những thứ ít gặp hoặc giả như cảm thấy không cần thiết thì chúng ta cũng không mượn làm gì. Ta có một loạt danh từ liên quan đến các loại cây trái hay rau củ mà các cụ nhà ta chỉ việc thêm vào chữ “tây” là sáng tạo ra từ chỉ một loài mới:
hành tây (onion)
tỏi tây/ hành boa rô (leek)
cần tây (celery)
dâu tây (strawberry)
khoai tây (potato)
măng tây (asparagus)
Chúng ta cũng biết rằng đối trọng với khoai tây thì “khoai ta” cũng có nhiều loại, phổ biến nhất là khoai lang mà tiếng Anh gọi là “sweet potato”. Những từ dịch phiên phiến như nhóm từ “tây” trên đây được sinh ra từ nhu cầu phân loại (để giao thương, tức là lý do kinh tế?), nhưng cụ thể đối tượng cần phân loại thì lại không cần thiết lắm. Những thứ như “tỏi tây” hay “măng tây” thực sự chúng ta rất ít dùng. “Khoai tây” hay “hành tây” về sau này lại dùng nhiều, thế nên ở thời đại này khi thử cắt nghĩa những thành tố của “khoai tây” hay “hành tây” ta cảm thấy có gì đó không đúng lắm. Có gì đặc biệt mà phải gọi là “tây”?
Phân loại cơ bản của Linnaeus
Việc Việt hóa những khái niệm đời thường, không nhất thiết phải mượn tiếng nước ngoài (hành tây tiếng Trung là “dương thông” và tỏi tây là “cửu thông”), một mặt phản ảnh sự linh động (đôi khi là dễ dãi) trong cách định danh sự vật, mặt khác cho thấy tiếng Việt có sự phản kháng nhất định đối với các niêm luật, quy tắc định danh đến từ những vùng có ảnh hưởng văn hóa mạnh hơn — thậm chí, các niêm luật vốn đã trở thành phổ quát ở nhiều nước.
Ta thử xét một niêm luật được dụng rất rộng rãi trong phân loại học ở các nước, đó là cách định danh bằng hai phần: chi (genus) + loài (species).
Carl Linnaeus hay Carl von Linné là nhà sinh học Thụy Điển, cha đẻ của cách phân loại bằng tiếng La-tinh dựa vào danh pháp hai phần (binomial nomenclature), mà ta hay gọi là “danh pháp khoa học”. Chẳng hạn, người hiện đại được gọi là Homo sapiens, được kết hợp bởi homo (người) và sapiens (thông thái). Hay ai xem Công Viên Kỷ Jura hẳn biết con khủng long bạo chúa T-Rex, viết tắt của Tyrannosaurus rex.1 Phần thứ nhất là tên chi (genus), phần kế sau đó là tên loài (species). Rex tiếng La tinh là vua.
Hay trong bài “hoa cứt lợn” có nhắc đến, Calendula officinalis là danh pháp khoa học của “cúc tâm tư” hay loài hoa marigold. Calendula là tên chi, officinalis là tên loài. Chi và loài là hai bậc thấp nhất trong các cấp bậc phân loại gồm: giới (kingdom), ngành (phylum), lớp (class), bộ (order), họ (family), chi (genus) và loài (species). Dùng hai cấp thấp nhất này để đặt danh pháp đảm bảo rằng đối tượng được gọi tên có được sự riêng biệt nhất định. Người đặt tên sẽ mong muốn rằng cái tên ấy trỏ về một vật duy nhất trong giới tự nhiên. Bằng cách truy về các cấp bậc cao hơn, ta có được cái nhìn tổng thể, rằng những chi + loài ấy thuộc họ nào, các họ ấy thuộc bộ nào.
Như vậy, khi gọi một loại hoa là hoa cứt lợn, ta khó có thể hình dung rõ ràng là nó thuộc nhóm nào, ngoại trừ nó là một loài hoa. Và “hoa” là khái niệm rất rộng. Tôi không rõ, “hoa” là lớp hoặc bộ, vì chỉ riêng hoa cúc đã bao gồm rất nhiều loài cúc khác nhau.
Sự phản kháng lại niêm luật
Tiếng Việt rõ ràng trong nhiều trường hợp không hề màng đến cách đặt tên nói trên, hoặc không cần đến. Đó là lý do chúng ta đôi khi thiếu đi cảm giác về sự phân loại (ta hay nói “hoa nào chẳng là hoa”, “cúc nào chẳng là cúc”). Vì thế nên khi cần cắt nghĩa “tỏi tây” hay “cần tây”, chúng ta thấy ngay sự nhập nhằng vì hai đối tượng đó chẳng liên quan gì đến “tỏi” và “cần”. Tương tự, khi ta du nhập nhiều loại dâu khác nhau, như dâu tằm, mâm xôi, việt quất, chữ “dâu tây” toát lên sự mông lung vì hiểu khái quát, nó chỉ trái dâu được du nhập từ phương Tây, nhưng nếu dâu tây là strawberry thì blackberry là gì. Tiếng Việt là “mâm xôi đen”, nhưng rất không liên quan.
Việc tiếng Việt phản kháng lại một số niêm luật tương đối phổ quát trong phân loại học, nhìn rộng ra, nếu chúng ta thu thập đủ bằng chứng (mà tôi nghĩ là được thôi), có thể phản ảnh một ý thức phá bỏ tôn ti và trật tự, ít nhất về mặt ngôn ngữ. Tôn ti là “hierarchy”. Trật tự là “order”. Phân loại là một cách áp đặt tôn ti và trật tự lên sự vật và hiện tượng. Sự vật và hiện tượng thì thiên biến vạn hóa. (Dĩ nhiên ta có thể phân biệt được giữa một quả strawberry và blackberry, nhưng ở cấp bậc các hạt thì sao? Phân tử được cấu thành từ nguyên tử, nguyên tử từ nucleus và electron, nucleus từ proton và neutron, proton và neutron được nối bởi gluon, rồi đến quark, rồi sao nữa?)
Phân loại là một cách áp đặt trật tự lên các vật. Áp đặt trật tự để chống lại sự ngẫu nhiên, biến hóa và trên hết là khả năng bất tuân của các vật. Chính phương pháp phân loại của Linnaeus cũng gặp phải sự lúng túng khi các nhà khoa học thời kỳ sau phát hiện ra một loài cây cỏ/ loài thú đáng ra phải nằm ở một chi khác, nhưng cái tên chi + loài ở chi khác đó đã được đặt mất rồi. Các vấn đề kiểu “phân loại nhầm” như vậy rất thường xảy ra ở bất cứ hệ thống nào, vì hệ thống (system) suy cho cùng được sinh ra nhằm sắp xếp lại các ý nghĩ của con người. Về cơ bản ta có ý nghĩ và ý tưởng. Và con người cần hệ thống để trỏ ý tưởng đến các vật.
Sức mạnh của việc đặt tên
Hồi tôi còn học về khoa học thư viện ở Pháp, có một cụm từ ghim vào tâm trí tôi rất lâu là “the power to name”. Tức là, người thiết lập danh mục các vật, đặt từ khóa cho các vật (sách toán, sách lịch sử, sách self-help), hay nhân viên lưu trữ, có một quyền lực rất lớn. Đó là quyền lực được đặt tên và niêm cái tên đó lên sự vật. Xét về mặt kỹ thuật, nó nôm na như sau. Giả sử tôi tìm quyển “Tuyên ngôn Đảng Cộng sản” của Karl Marx và Friedrich Engels trong thư viện tỉnh Vĩnh Phúc, tôi có “thẻ sách”:
Ta thấy một số từ khóa do người quản thủ nhập vào. Thật kỳ lạ khi người quản thủ (hay gọi đúng hơn, người nhập liệu này là indexer) lại nhập vào từ khóa “tuyên ngôn độc lập”. Khi người đọc muốn tìm các sách liên quan đến “tuyên ngôn độc lập”, đầu sách này sẽ hiện ra. Hai từ khóa liên quan đến tác giả là “Mác.C” và “ừnghen.F” (sic). Các bạn đừng vội bất ngờ vì Engels được phiên âm là “ừnghen”. Đây là một lỗi có tính dây chuyền vì ngay cả thẻ sách ở thư viện quốc gia cũng gọi tên tác giả như vậy. Một cuốn sách quan trong nhưng tên tác giả bị nhập liệu lỗi từ trên xuống dưới, cho thấy, đúng là những quản thủ thư viện của chúng ta không thật xem trọng việc sắp xếp và phân loại.
Lập trật tự là mong muốn khó cưỡng
Không phải lúc nào tiếng Việt cũng phản kháng lại được các niêm luật chặt chẽ. Mong muốn được thiết lập trật tự là mong muốn rất khó cưỡng. Một ví dụ khác của việc dịch các loại rau củ quả sang tiếng Việt (nhưng ở mặt ngược lại) liên quan đến các loại hạt ngũ cốc.
Tôi soạn ra bảng như sau, gồm các thuật ngữ tương ứng của tiếng Việt, Anh, Pháp, Đức và Trung:
Ta thấy khi tiếng Việt mượn được từ tiếng Trung, các thuật ngữ trở nên tỏ tường và có trật tự hơn rất nhiều. Đây là ví dụ của việc mượn thành công, một cách có hệ thống. Nếu các bạn hay đọc tiểu thuyết Nga do thế hệ dịch giả trước đây dịch, các loại ngũ cốc được dịch rất thống nhất. Ví dụ.
Một thời gian dài, món ăn thường xuyên của phần đông dân chúng là cháo kê và súp đầu cá trích. Mình cá trích đem rán lên làm món chính của bữa ăn. Người ta ăn lúa mạch đen chưa xay và lúa tiểu mạch để nguyên hạt. Người ta dùng chúng nấu cháo. (Bác sĩ Zhivago, Phần VI, Chương 10, Lê Khánh Trường dịch từ tiếng Nga, 1988)
Tương ứng trong bản tiếng Anh:
For a long period the invariable food of the majority was boiled millet and fish soup made from herring heads. The bodies of the herring were fried as a second course. People ate unground rye and wheat. They boiled the grain into a porridge. (Richard Pevear và Larissa Volokhonsky dịch từ tiếng Nga, 2010)
Hoặc là
Tiết trời đã thuận. Đây là thời vụ tốt nhất để gieo lúa xuân, lúa yến mạch hoặc gieo kê. Còn đối với lúa kiều mạch thì còn sớm. Ở vùng quê tôi, người ta gieo kiều mạch vào dịp lễ Thánh ãculina. (Bác sĩ Zhivago, Phần VIII, Chương 2, Lê Khánh Trường dịch từ tiếng Nga, 1988)
The weather’s settled. It’s the perfect time for sowing the spring crops—oats, summer wheat, or, say, millet. It’s too early for buckwheat. We sow buckwheat on St. Akulina’s day. (Richard Pevear và Larissa Volokhonsky dịch từ tiếng Nga, 2010)
Hạt “kê” hay millet là ngoại lệ vì tiếng Trung dịch là “tắc”
Ngôn ngữ, đặc biệt là ngôn ngữ của văn chương và khoa học, luôn là sự giao thoa giữa các nền văn hóa. Sự định danh một sự vật trong thứ tiếng này cho tương ứng với sự vật ấy trong thứ tiếng khác là việc cần thiết. Trái dâu tây (strawberry) cho dù trồng ở Đà Lạt hay ở Tây Ban Nha thì vẫn là trái dâu tây, cho dù kích thước và hương vị của chúng có khác nhau chăng nữa. Dòng chảy văn hóa lại như dòng nước chảy từ chỗ cao đến chỗ trũng. Nơi bị ảnh hưởng luôn là nơi cần phải mượn, cụ thể ở đây là mượn những từ và khái niệm. (“Di biến động dân cư” luôn là ví dụ tốt cho việc mượn hoặc nương nhờ chữ Hán một cách bộp chộp. Tôi không biết có phải mượn hay không vì không biết ở Trung Quốc gọi khái niệm này như thế nào.)
***
Thế nhưng, ta có thể bắt gặp trong tiếng Việt rất nhiều ví dụ về bất tương thích. Các loại ớt chẳng hạn: trái paprika ta lại gọi là ớt Đà Lạt. (Từ “ớt chuông” hợp lý hơn.) Như vậy Đà Lạt đóng vai trò gì? Chữ “tây” trong hành tây, tỏi tây, dâu tây đóng vai trò gì? Từng tên gọi ấy ra đời vào thời điểm nào?
Nếu ta coi phân loại là độc đoán, việc sắp xếp theo tôn ti, trật tự là độc đoán, thì tiếng Việt phản ánh một sự bất tuân, đôi khi là mong muốn nằm ngoài tôn ti, trật tự. Đặt lăng kính hậu thuộc địa trong bối cảnh của Google, AI và học máy, các cỗ máy tự động rõ ràng rất khó để đọc đúng, hiểu đúng, nắm bắt đúng sắc thái tiếng Việt. Google và các cỗ máy dùng thuật toán luôn có lợi trong việc đồng bộ hóa thống kê và xác suất, do đó thứ tiếng nào càng sát với “trật tự phổ quát”, thứ tiếng đó càng dễ có nhiều ứng dụng.
Ngược lại, bất lợi của các cỗ máy là chúng loại bỏ tính biến thiên lịch đại. Chúng sẽ không bao giờ hiểu được vì sao trái paprika lại được gọi là ớt Đà Lạt. Chúng sẽ không bao giờ có thể dùng bộ lọc để tìm thấy quyển “Tuyên ngôn Đảng Cộng sản” của Karl Marx và Friedrich Engels trong thư viện tỉnh Vĩnh Phúc khi mà từ khóa tên tác giả là “ừnghen.F”. Chúng lại càng không bao giờ hiểu được khi nào cucumber là dưa leo, và khi nào là “dưa chuột bao tử”.
Tiếng Việt, vì thế còn có quá nhiều tiềm năng để phản kháng lại cái trật tự đang chiếm lĩnh của Google Translate, máy học, hay ChatGPT và, quan trọng hơn, để làm đa dạng chính nó mà không phải nương nhờ vào một nhóm văn hóa thống trị nào.
Nói một cách lãng mạn: tiếng Việt là một vị khách không mời.