Chỉ trong vòng một tháng qua chúng ta đã được nghe quá nhiều luồng ý kiến về ChatGPT. Tôi thấy mình không nhất thiết tham gia vào cuộc tranh luận đó, vì những gì cần nói, dường như mọi người đều đã nói hết.
Tôi nhắc lại một vài phán đoán của mình từ khi ChatGPT vừa mới xuất hiện. Một là, những công cụ AI và học máy như ChatGPT sẽ dần thay thế những công việc thường ngày, đôi khi lặp lại nhàm chán, của chúng ta một cách hiệu quả. Người ta sẽ tìm ra những cách để cheating với các công cụ này. Điều đó không thể tránh khỏi, như việc sinh viên sẽ dùng ChatGPT phục vụ việc viết luận, hoặc xử lý từng công đoạn của việc viết luận. Chỉ cần khéo léo một tí, có trời mới truy ra được.
Dạo này tôi dùng ChatGPT nhiều nhất trong việc học ngoại ngữ. Tôi sẽ prompt giả dụ như:
Tôi hay dùng ChatGPT để tạo ra các mẫu câu và sửa chính tả. Các mẫu câu có thể cứng nhắc hơn một người thật bản địa nói, nhưng tôi thấy mượt hơn Google translate nhiều. Dùng để sửa chính tả, chẳng hạn như đổi một đoạn văn sang thì quá khứ hay thì tương lai, tôi có cảm giác như trở lại thời xưa cũ, có một cô giáo ngồi trước mặt mình và sửa từng lỗi chính tả. Thi thoảng cũng có lỗi sai, chẳng hạn về cách (case) nhưng theo tôi thấy khả năng này rất thấp, còn thấp hơn một cô giáo thạo ngoại ngữ mắc lỗi sai.
Người dùng tiếng Việt rất thích đùa nghịch với ChatGPT và chụp màn hình những đoạn anh chàng này mắc lỗi, thường là tính toán sai, hoặc đưa ra dữ liệu không đúng về một nhân vật người Việt nào đó, hoặc đối thoại lòng và lòng vòng với người dùng. Tôi thấy các bạn í một là rảnh quá, và hai là… cũng chỉ đùa thôi. Chỉ cần nắm khái quát rằng công cụ ấy được “tôi rèn” dựa trên một khối dữ liệu khổng lồ, và vì thế vai trò của nó là nắm bắt các mấu liên kết giữa khối từ, chứ không phải tạo ra một kiến thức mới, là chúng ta đã biết cách gợi ý (prompt) cho nó vận hành hiệu quả.
Máy học từ khối dữ liệu lớn, nghĩa là ta nên prompt cho máy bằng tiếng Anh. Hỏi nó tiếng Việt để cho nó trả lời sai, tôi nghĩ là hơi bully cỗ máy. (Có lần tôi hỏi bằng tiếng Anh về các nhân vật Trotskyist ở Việt Nam và ảnh hưởng từ Đệ Tam Cộng sản, nó trả lời không sai đâu.)
Từ cách mà cỗ máy học được “tôi rèn”, và cách nhiều dùng Việt Nam chứng minh rằng nó là một cỗ máy nói xạo (a liar!), cho tôi thấy phán đoán thứ hai của tôi là đúng. Tôi đã từng nói ở bài trước rằng tiếng Việt là “khách không mời”. Các cỗ máy AI tân tiến nhất đều sẽ gặp khó khăn trong việc xử lý tiếng Việt, vì (1) tiếng Việt vốn không phải ngôn ngữ lớn trên thế giới, nhưng đồng thời (2) nó lại được sử dụng thuần thục bởi một trăm triệu người, ngụ ở một diaspora tương đối đa dạng, và (3) bởi lý do lịch sử tiếng Việt còn là kết quả của sự giao thoa khá lạ lùng (và cả ngẫu nhiên) của tiếng Trung, Nga, Pháp, Anh và Đức.1
Người dùng tiếng Việt sẽ cảm thấy may mắn vì điều đó. Vì chúng ta vẫn làm chủ được ngôn ngữ. Chúng ta vẫn còn bản sắc và cá tính khi cất một câu đùa, thay vì bảo ChatGPT tạo một câu đùa rồi ta đọc từ nó. Chúng ta không cảm thấy bị đe dọa lắm từ cỗ máy, khi càng ngày càng có nhiều ví dụ cho thấy (nếu hỏi bằng tiếng Việt) nó ngu si, đần độn, bên cạnh việc nói dối như cuội.
Tất nhiên, nói tiếng Việt là “khách không mời” không có nghĩa tiếng Việt sẽ trở thành ngoại lệ. Chỉ vài năm nữa, sẽ có cỗ máy khác (hoặc chính là ChatGPT) học sâu, học đến nơi đến chốn và học trực tiếp từ corpus tiếng Việt. Đến lúc ấy, nó sẽ trả lời vanh vách các câu hỏi bằng tiếng Việt của bạn thôi.
Điều tôi muốn nhấn mạnh trong bài này là thế giới, các ngôn ngữ, và cách chúng ta sử dụng ngôn ngữ đang dần thay đổi với sự ra đời của AI, học máy. Chúng ta có nên giữ cái nhìn hẹp hòi về những cỗ máy, hay là cứ bơ đi và sống và học cách dùng chúng hiệu quả hơn để cuộc sống của chúng ta thêm màu?
Để chỉ trích AI hay ChatGPT không khó. Bạn có thể nghe một lượt podcast này của Ezra Klein với Gary Marcus, một nhà phê bình hàng đầu về AI. Tháng trước, tôi nghe cuộc tranh luận về ChatGPT của một vài giáo sư đến trường tôi workshop. Đa số họ đều chỉ ra rằng cách tạo ra những công cụ AI như ChatGPT trong nhiều thập niên qua là sai về nền tảng, rằng ta muốn tạo ra cỗ máy giống như người, nhưng hệ quả là ta có những con người ngày càng giống như máy. Thì cũng giống như những hoài nghi tôi đã từng viết trên substack, âu cũng chẳng có gì mới.
Nhưng tôi mới hiểu ra một điều rằng: ChatGPT có nói ba lăng nhăng, cũng chính là vì nó học cách nói ba lăng nhăng từ con người. Nó học cách nói ra những điều dường như là khả tín, là tin được. Người làm phần mềm không dạy chúng nói dối, họ chỉ đưa cho chúng khối ngôn ngữ khổng lồ và bảo học đi. Một cách nào đó, chúng học “gạo” và có thể nói tràng giang đại hải những điều dung nạp trong “đầu” mà không thực sự hiểu mình đang nói gì. ChatGPT không nói được là mình không biết thứ gì đó, vì bất kỳ một thứ gì đó đều có thể “hành văn” được. Ta bảo nó nói mà. Ta hỏi nó sự khác nhau giữa Lê Duẩn và Lê Lợi chẳng hạn, có món học gạo nào trong đầu thì nó nói thôi. Và đấy cũng là một cách “hành văn” rất con người.
Kể cả các giáo sư tôi nhắc đến ở trên, bảo họ cắt nghĩa những điều họ thực sự nói, tôi nghĩ rằng rất ít người hiểu chính xác điều mình nói là gì, và rằng có có chính xác và có ý nghĩa không, hay chỉ dường như là một phát ngôn nghe có vẻ khả tín. Ngay cả chính giới khoa bảng, học thuật cũng hay nói và viết ba lăng nhăng lắm. Hơn phân nửa lượng chất xám của họ là dành cho việc viết grant proposal, nghĩa là chém gió, thứ gì cũng nói được.

Hiện tượng ChatGPT làm tôi liên tưởng đến nhân vật chính, hoàng thân Leo Myshkin trong truyện Gã khờ (hay Chàng ngốc) của Fyodor Dostoevsky. Tôi dám chắc là ai đọc xong truyện này cũng thấy nhân vật Myshkin giống y như mình, một cá nhân khờ khạo trong thế giới đầy cạm bẫy, mang những mơ tưởng viển vông và đầy ắp lý tưởng không đủ điều kiện để dựng xây thành hiện thực. Vì đầy lý tưởng, lại còn dại dột, nên khi được đặt đúng chỗ anh ta có thể giãi bày hàng giờ về mọi chuyện. Một anh khờ được lý tưởng hóa. Bị gọi là “khờ” nhưng lại là một hình tượng đẹp.
Rất nhiều người đọc nghĩ về Gã khờ của Dos như vậy. Một hình tượng đẹp và một phần của chính mình ở trong đó. Nhưng rồi tôi nghĩ, Myshkin có thực sự hiểu những gì anh ta đang nói là gì không? (Tôi chợt nảy ra ý nghĩ đó khi đọc đến đoạn, Myshkin nói về sự vượt trội của Chính thống giáo với Công giáo La Mã.) Hoàng thân Myshkin có lẽ là phiên bản “người” nhất của ChatGPT, được sáng tạo ra từ năm 1869.
Ta cũng hiểu rằng (nhìn rộng lượng hơn), Myshkin lắm lúc nói quàng xiên chỉ vì anh thiếu sự va chạm; quàng xiên nhưng mà thật (đây là yếu tố làm nên cái đẹp của Gã khờ, và thứ tôi nghĩ nó chạm vào hầu hết người đọc). Nhưng với tôi, Myshkin khá giống cỗ máy ở chỗ anh không có luồng cảm xúc chủ đạo. Cảm xúc với nhân vật này mới là thứ không thật. Ta thấy rõ anh yêu Nastasya, nhưng đồng thời ta cũng thấy rõ anh ta yêu Aglaya. Thế là thế đéo nào? Ở phân đoạn kịch tính nhất, anh ta không phân định được rõ mình yêu cô nào (để cho một cô người yêu chạy rẽ đất), không phải vì anh không thực sự yêu ai, mà là vì cảm xúc trong anh ta, nhất là thứ gọi là tình yêu, hoàn toàn không có thật.
Tác giả Dostoevsky vừa “hơi thiếu” thuyết phục, vừa thần kỳ ở chính điểm này. Ông tạo ra một nhân vật trường tồn với thời đại, vừa có thể phát biểu rất chân thật khối ý nghĩ rối rắm trong đầu mình, được hun đúng bởi một tinh thần thời đại (một dạng corpus), nhưng đồng thời lại mang cách hành xử rất máy móc, thống nhất từ đầu chí cuối, vì cơ thể anh ta là một khối trơ lì không mang những cảm xúc thật. Mỗi khi đến lúc cơ thể ấy không thể chịu được sức nặng của những cảm xúc thật, anh ta lại lăn đùng ra đất.
Ở đây cách xử lý của Dos khá giống với một lập trình viên. Cũng như khi lập trình, chương trình chạy không nổi nữa, ta đành phải gõ lệnh exit() hoặc bấm Ctr-Z.2
Có bạn sẽ hỏi vì sao tiếng Việt chịu ảnh hưởng từ tiếng Đức. Lý do vì, tiếng Đức là ngôn ngữ của Marx và Engels. Tiếng Đức, dầu không nhiều, thâm nhập vào Việt Nam qua ngả tiếng Nga, và ảnh hưởng tới tiếng Việt nằm ở mặt ý hệ.
Lệnh này dùng cho Python