Nói vui chứ giới AI toàn cầu cuối năm nay hẳn đang xôn xao hệt như những “tay chơi chứng khoán” chứng kiến một cổ phiếu lạ vừa chào sàn với lời quảng cáo: “Chi phí đầu tư chỉ vài triệu USD mà cạnh tranh ngang ngửa với mấy gã khổng lồ đã đốt hàng chục tỷ đô.” Đọc qua, ai cũng bán tín bán nghi: “Thật hay xạo?”, “Đáng để chờ đợi, hay chỉ là một quả pháo hoa quảng cáo rồi tắt ngấm?”
Câu chuyện “DeepSeek của Trung Quốc” khiến người ta nghĩ ngay đến mấy lần “cú đảo chiều” mà công nghệ Trung Quốc đã làm được trong quá khứ. Nhưng công bằng mà nói, họ cũng từng “chưng hửng” trong các dự án công nghệ mà ai cũng hy vọng một cuộc “đổi ngôi”. Vậy đứng giữa rừng thông tin trái chiều, chúng ta bàn chuyện gì cho vui, cho sâu – rồi… cho đáng chờ?
1. Số lượng tham số vs. Chất lượng dữ liệu
Giáo sư Vũ Hà Văn chia sẻ rằng “số lượng tham số” trong mô hình AI càng lớn thì độ “biết tuốt” và năng lực xử lý ngôn ngữ, xử lý hình ảnh… càng mạnh. OpenAI khoe những mô hình tầm hàng tỷ tham số – thậm chí càng về sau con số cứ tăng theo thời gian, cứ như “nhân đôi” theo định luật Moore. Trong khi AI của Vin (mà Giáo sư Văn nhắc đến) dù đầu tư không nhỏ, vẫn dừng ở mức độ vài triệu tham số.
• Chuyện tham số: Có người hỏi “Tham số là gì, ghê gớm ra sao?” Nôm na nó là các con số (weights) ẩn trong từng “nơ-ron” của mạng AI, quyết định cách mô hình phản ứng, suy luận và tạo đầu ra. Tham số càng nhiều => “độ phức tạp” và “khả năng tiến hoá” càng khủng, nhưng… cũng càng ngốn điện, ngốn chip, ngốn tiền.
• Chuyện dữ liệu: Về mặt “big data”, Trung Quốc rất có lợi thế. Thứ nhất, dân số tỷ rưỡi, thông tin tràn ngập. Thứ hai, việc gom dữ liệu cũng khá “nhanh gọn” – một khi “được lệnh” thì xong. Thành ra nếu muốn đào tạo mô hình, họ khó mà thiếu đầu vào.
Tuy nhiên, nhiều dữ liệu chưa chắc “chất lượng” – vì để AI học tốt thì dữ liệu cũng phải chuẩn, đa dạng, ít nhiễu và dán nhãn chính xác. Chỉ “gom bừa” vô tội vạ thì AI dễ bị rơi vào lỗi thiên kiến, sai sự thật, hoặc chuyên “chém gió” sai bét.
2. “Phép mầu” của AI giá rẻ – hoang đường hay tương lai?
Nhóm ủng hộ ý tưởng “AI giá rẻ” ví von với phong trào mã nguồn mở (Linux, Android, v.v.) hồi xưa, từng có thời người ta nghĩ phần mềm miễn phí sẽ “đánh bật” Microsoft hay Apple. Trên thực tế, mã nguồn mở đã tạo nên ảnh hưởng lớn, nhưng thị phần desktop cuối cùng Windows vẫn thống lĩnh. Tương tự, Android thì chiếm ưu thế trên di động, nhưng cũng không phải “một mình một chợ” – Apple iOS vẫn cứ bền bỉ ở phân khúc riêng.
Với AI cũng thế: có thể một “AI lõi” do TQ phát triển, chi phí thấp, triển khai dễ dàng, “just enough” tính năng – nhưng để “chiến” được với các mô hình khổng lồ như GPT-4 thì ta vẫn phải chờ độ “chín” cả về tư duy công nghệ, phần cứng, phần mềm, cộng đồng phát triển, và đặc biệt là hiệu suất thực tế.
3. Bài toán phần cứng và bàn tay nhà nước
Muốn huấn luyện (training) AI “khủng”, trước hết cần GPU (hoặc chip AI chuyên dụng) cực xịn. Trên đời này, NVIDIA A100 hay H100 đã quá nổi tiếng. Nhưng lệnh cấm xuất khẩu chip cao cấp sang Trung Quốc đang là “rào cản” lớn. Liệu DeepSeek có chip “nhà trồng” hay có “ông anh” bí mật tài trợ GPU? Vì nếu chỉ chạy CPU thông thường thì coi chừng… con AI ấy “chậm như rùa” lúc huấn luyện mô hình lớn.
Dĩ nhiên, nếu “đằng sau” DeepSeek có một quỹ nhà nước dồi dào sẵn sàng bù lỗ, cấp chỗ hạ tầng, GPU xịn (hoặc phiên bản chip “lách luật”),… thì chi phí niêm yết trên giấy (6 triệu USD) chỉ là một phần. Mặt khác, TQ cũng có lúc nêu tham vọng “tự chủ công nghệ”. Song trên thực tế, phát triển chip bán dẫn tiên tiến là “cuộc chơi đường dài”, không dễ “một sớm một chiều” – khi mà công nghệ lithography tối tân vẫn phụ thuộc phương Tây.
4. Yếu tố chính trị – đòn bẩy cho những “cú nhảy” trên sàn chứng khoán
Câu chuyện đằng sau hay ho ở chỗ, chỉ một dòng tin “DeepSeek” ít tháng tuổi mà dám cạnh tranh với “cụ tổ” OpenAI, chẳng phải rất kích thích giới đầu tư? Họ lao xao: “Nếu Trung Quốc thành công, có phải mấy gã AI ở Mỹ bị định giá quá cao?” Rồi kiểu gì bên Mỹ cũng có “đòn đáp trả”, ví dụ “đồng chí cựu Tổng thống” hoặc “đương kim Tổng thống” lên tiếng “cấm cản, dọa phạt” – thế là cổ phiếu công ty Mỹ lại “tăng phi mã”.
Trên phương diện thị trường, giới đầu tư luôn muốn một “câu chuyện mới” (new narrative) để kích giá hoặc dìm giá. “DeepSeek” hiện đang làm tốt vai trò một “kẻ khuấy động”, thúc đẩy giới quan sát, nhà đầu tư tò mò, tranh luận. Ai “điên tiết” thì tháo vốn, ai “lạc quan” thì mua thêm. Thị trường chứng khoán vốn dĩ là vậy.
5. Trung Quốc “so le” công nghệ – nhưng không thể coi thường
• Chip & Hệ điều hành: TQ nhiều năm tìm cách thoát khỏi Windows, Android, Cisco, Intel… nhưng hành trình còn dài. Hệ điều hành HarmonyOS của Huawei là một thí nghiệm đáng khen ở khía cạnh “lòng quyết tâm”, nhưng độ phổ biến so với Android hay iOS thì quá chênh lệch.
• Không gian & hạ tầng viễn thông: Tuy vậy, đừng quên TQ cũng có những thành tựu kiểu tàu vũ trụ, trạm Thiên Cung,… và lắm dự án “khủng” (hệ thống đường sắt cao tốc, 5G, siêu máy tính…). Tư duy “làm lớn, làm nhanh” khiến họ đôi lúc vượt trước trên một số mũi nhọn.
Nhìn chung, năng lực công nghệ của TQ luôn là bức tranh có mảng rực rỡ, có mảng còn thô sơ, đang bị cấm vận hoặc phải nhập công nghệ cốt lõi. AI có thể ở vị trí “chông chênh” ấy: vừa là mũi nhọn (nhờ dữ liệu khổng lồ, quyết tâm chính trị, lực lượng lập trình viên đông đảo), vừa bị hạn chế (phần cứng, lệnh cấm, rào cản quốc tế).
6. Đâu là kịch bản thú vị?
1. DeepSeek là “bom xịt”: Sau vài tháng ồn ào, người dùng thử phát hiện chất lượng chẳng bằng ChatGPT-3.5, nhiều thứ ngớ ngẩn, phản hồi chậm,… Thị trường hạ kỳ vọng, ai lại về nhà nấy.
2. DeepSeek là “kẻ phá bĩnh”: Nó có 1-2 tính năng “độc chiêu”, chi phí triển khai thấp, phù hợp nhu cầu thị trường châu Á, hay tạo ra những ứng dụng “niche” (kiểu “AI cắt tóc” ngon-bổ-rẻ chẳng hạn). Dần dà, nó chiếm lĩnh một phần phân khúc AI thực tiễn, khiến các công ty khác phải “xuống giá”.
3. DeepSeek được “chống lưng” và bí mật sử dụng hạ tầng khủng do nhà nước hỗ trợ: Tốc độ cải thiện, mở rộng tham số rất nhanh, tạo ra cú “sốc” cho thị trường. Khi đó, chắc chắn phương Tây không ngồi yên. Thế giới AI có thể bước vào cuộc chạy đua – vừa là công nghệ, vừa là địa chính trị.
7. Tóm lại, niềm vui của chúng ta là… chờ xem!
• Chờ xem DeepSeek có thực sự là một “cú đột phá” hay chỉ “tiếng trống kèn” PR.
• Chờ xem Trung Quốc có chạy được đường dài khi vấp phải rào cản chip, lệnh cấm, thiếu “core technologies” để nâng cấp AI khủng.
• Chờ xem thị trường bị tác động ra sao – cổ phiếu AI “nhảy múa” thế nào, và các ông lớn ở Mỹ, châu Âu sẽ phản ứng gì.
Chắc chắn: Dù con đường nào xảy ra, đằng sau đó sẽ là thêm “một chương nữa” trong cuộc đua AI toàn cầu: kể chuyện giá rẻ, hay chính sách cấm cản, hay siêu sản phẩm… Tất cả đều vừa kịch tính, vừa hài hước – đúng chất “drama” thời đại 4.0.
Kết: Cứ như “bà vợ bình dân” nói – người Trung Quốc xưa nay có cách làm “vừa đủ dùng” để bán rẻ, bất chấp ai nghĩ sao. Và trong AI, “vừa đủ” đôi khi là bí kíp thành công trong phân khúc riêng, thay vì “lấy thịt đè người” bằng mô hình khổng lồ đốt điện, ngốn CPU/GPU. Chỉ cần thêm thời gian để xem DeepSeek ra ngô ra khoai thế nào. Nói chi thì nói, giới công nghệ toàn cầu (và cả giới đầu tư) chưa bao giờ buồn – tin tức bùng nổ mỗi ngày, cứ xoay xoay như trò đu quay giữa Tập – Mỹ – châu Âu – Big Tech, và giờ có thêm DeepSeek làm vai cameo, chúng ta ở đây tha hồ… tám chuyện xuyên Tết!
Nguồn: Trên mạng và xào lại bằng O1