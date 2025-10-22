Mới đây tại một sự kiện do Citadel Securities tổ chức, CEO Jensen Huang của Nvidia đã nói thẳng: "Chúng tôi đã từng chiếm 95% thị phần ở Trung Quốc, giờ con số đó là 0%."

Câu nói này chẳng khác nào một sự thừa nhận Trung Quốc đang nổi lên như một hiện tượng công nghệ đáng chú ý nhất trong khu vực, chứng minh khát vọng không chỉ đuổi kịp mà còn vượt qua phương Tây trong cuộc đua Trí tuệ Nhân tạo (AI) toàn cầu.

Lực đẩy này đến từ hai chiến tuyến: một bên là sức mạnh phần cứng đầy tham vọng của Huawei, và bên kia là tốc độ tăng trưởng ứng dụng phần mềm chóng mặt, thể hiện qua lượng tiêu thụ token.

Quy mô bù hiệu năng

Sự kiện Huawei Connect vừa qua đã chứng kiến màn ra mắt đầy ấn tượng của dòng chip AI Ascend 950, đặt ra thách thức trực tiếp với gã khổng lồ Nvidia của Mỹ.

Với băng thông liên kết nội bộ lớn, được hãng công bố là 2 TB/s cho thế hệ 950, và lộ trình tiếp nối tới Ascend 960 (2027) và 970 (2028), đây không phải chỉ là nâng xung hay thêm core mà điểm nhấn là hỗ trợ các định dạng số ít bit hơn như FP8/MXFP8, và thiết kế để dễ mở rộng thành các "SuperPoD" hay "SuperCluster".

Trong khi các lệnh cấm vận của Washington vẫn là rào cản lớn đối với việc tiếp cận công nghệ chip tiên tiến, Huawei đã tìm ra một con đường riêng: chiến lược "SuperNode + Cluster" hay nói cách khác là "lấy quy mô bù hiệu năng".

Thay vì cố gắng chế tạo một con chip đơn lẻ vượt trội hơn sản phẩm của Nvidia (thực tế, các nhà phân tích thừa nhận chip Ascend vẫn còn tụt hậu), Huawei tập trung vào việc tạo ra các siêu cụm (SuperPoD) khổng lồ.

Hệ thống Atlas 950 SuperPoD mới được thiết kế để kết nối tới hơn 8.000 chip Ascend, và các phiên bản tương lai như Atlas 960 còn có thể kết nối gần 16.000 chip. Huawei tự tin tuyên bố rằng ở cấp độ hệ thống, SuperPoD của họ mang lại sức mạnh tính toán và băng thông liên kết dữ liệu vượt trội, thậm chí gấp hàng chục lần so với các hệ thống sắp ra mắt của đối thủ Mỹ.

Đây là một nước cờ táo bạo, tận dụng kinh nghiệm về kết nối và cơ sở hạ tầng mạng của Huawei để biến sự hạn chế về công nghệ chế tạo chip thành lợi thế về quy mô hệ thống.

Trong khi đó, nếu cuộc chiến chip là sân chơi căng thẳng của phần cứng, thì lĩnh vực ứng dụng AI tại Trung Quốc lại chứng kiến sự bứt phá của phần mềm. Tốc độ tăng trưởng đáng kinh ngạc trong việc sử dụng "token", đơn vị đo lường cơ bản cho hoạt động của các mô hình ngôn ngữ lớn (LLMs), cho thấy AI đang được triển khai trên quy mô cực lớn trong đời sống và kinh doanh của quốc gia này.

Token là đơn vị nhỏ nhất đo "lượt việc" mà mô hình ngôn ngữ thực hiện, tức là ngày càng nhiều người dùng, dịch vụ, bot, hệ thống tự động đang vận hành ở quy mô lớn.

Chỉ trong vòng 18 tháng (từ đầu năm 2024 đến giữa năm 2025), mức tiêu thụ token AI hàng ngày của Trung Quốc đã tăng vọt 300 lần, từ 100 tỷ lên hơn 30 nghìn tỷ. Dù các gã khổng lồ công nghệ Mỹ như Google hay Microsoft cũng ghi nhận mức tăng trưởng lớn, tốc độ tăng trưởng của Trung Quốc được cho là đã vượt xa.

Tờ TechCrunch cho hay Google đã công bố tăng từ khoảng 9,7 nghìn tỷ token/tháng vào tháng 4/2024 lên khoảng 480 nghìn tỷ token/tháng vào tháng 4/2025, tương đương mức tăng 50 lần, trong khi đó Microsoft báo Azure AI xử lý hơn 100 nghìn tỷ token trong Quý I/2025, tương đương mức tăng 5 lần.

Ngoài ra, thị trường AI của Trung Quốc năm 2023 ước tính khoảng 60 tỷ USD, thấp hơn so với 87 tỷ USD của Mỹ nhưng tốc độ rút ngắn khoảng cách đang rất nhanh. Trong nghiên cứu học thuật, Trung Quốc cũng tăng nhanh về số lượng bài báo AI từ chưa đến 5% số lượng năm 2000 lên khoảng 36% năm 2025.

Theo Cục Dự trữ Liên bang Mỹ (Fed), một yếu tố quan trọng nữa là Trung Quốc vẫn có dư địa lớn để mở rộng hạ tầng AI so với Mỹ, trong khi các dự án AI tại nền kinh tế số 1 thế giới đang gặp nhiều thách thức về cơ sở hạ tầng.

Những con số ấn tượng của Trung Quốc phản ánh việc ứng dụng AI không chỉ dừng lại ở các phòng thí nghiệm mà đã được tích hợp sâu rộng vào các dịch vụ như chatbot, dịch thuật, tự động hóa quy trình, và viết nội dung, tạo ra một hệ sinh thái AI đang bùng nổ.

Việc tiêu thụ token AI đang trở thành một thước đo mới, sánh ngang với các chỉ số kinh tế truyền thống, thể hiện quy mô thực tế của việc triển khai LLMs. Đây là bằng chứng rõ ràng nhất cho thấy dù Mỹ có thể vẫn dẫn đầu về đầu tư tuyệt đối và chất lượng mô hình đơn lẻ, Trung Quốc đang dẫn đầu về tốc độ chuyển đổi và phạm vi ứng dụng AI vào nền kinh tế thực.

Rõ ràng, Huawei đang thực hiện một chiến thuật độc đáo, thay vì đua từng teraflop hay mỗi tiến trình sản xuất, họ đầu tư vào giải pháp toàn hệ thống bao gồm chip và HBM (bộ nhớ băng thông cao) nội địa cùng mạng liên kết siêu tốc để gom hiệu năng lại thành một thực thể duy nhất có thể huấn luyện và phục vụ mô hình cỡ trăm tỷ tới nghìn tỷ tham số.

Khi token usage bùng nổ, nhu cầu về I/O, băng thông và khả năng phân phối tải là rất lớn. Đây chính là chỗ Huawei tin họ có lợi thế nếu triển khai SuperPod/Cluster đủ lớn.

Bài toán bền vững

Sự phát triển mạnh mẽ của AI cũng đang tạo ra một hiệu ứng kinh tế vĩ mô độc đáo tại Trung Quốc. Trong bối cảnh nền kinh tế đang đối mặt với nguy cơ giảm phát (giá cả giảm), theo lý thuyết kinh tế truyền thống, các doanh nghiệp thường sẽ cắt giảm sản xuất.

Tuy nhiên, nhờ có AI được áp dụng rộng rãi, nhiều ngành nghề tại Trung Quốc, từ du lịch văn hóa đến sản xuất, vẫn duy trì được mức cung và sản lượng ổn định, bất chấp việc tỷ lệ việc làm giảm và giá cả đi xuống.

Công nghệ AI đã đóng vai trò là "chất xúc tác" giúp giảm chi phí và tăng hiệu quả hoạt động một cách mạnh mẽ. Điều này cho phép doanh nghiệp duy trì năng suất ngay cả trong giai đoạn kinh tế khó khăn, báo hiệu một sự thay đổi cơ bản trong mối quan hệ truyền thống giữa lao động, sản lượng và chu kỳ kinh tế.

Tuy nhiên, mọi thứ không chỉ là con số và máy móc. Lệnh hạn chế từ Mỹ và chuỗi cung ứng toàn cầu đặt ra giới hạn thực tế khi nhiều ước tính cho thấy Huawei có thể sản xuất không quá 200.000 chip AI cao cấp trong 2025 do hạn chế công nghệ đóng gói và tiếp cận node tiên tiến. Con số này không đủ để đáp ứng nhu cầu toàn quốc nếu mọi bên cùng đua nhau và điều này phơi bày lỗ hổng của chiến lược "quy mô" khi thiếu nguồn cung vật lý bền vững.

Ngoài ra, hệ sinh thái phần mềm như trình biên dịch, thư viện tối ưu, hệ thống phân tán, và nhất là "mô hình" vẫn là rào cản. Nvidia có CUDA, hệ sinh thái phong phú và hàng nghìn nhà phát triển đã tối ưu cho GPU. Huawei cần hơn cả chip để thuyết phục các nhà phát triển chuyển sang nền tảng mới, nếu chỉ có phần cứng mà không có phần mềm dễ dùng và cộng đồng, hiệu quả quy mô có thể khó đạt mục tiêu đề ra.

Câu chuyện AI của Trung Quốc lúc này có hai mạch song song và đan chặt: một mạch là tốc độ ứng dụng phần mềm như người dùng, dịch vụ và token tăng phi mã và mạch kia là nỗ lực kéo phần cứng về phía mình bằng quy mô siêu lớn.

Nếu hai mạch này hòa hợp, nghĩa là phần cứng đủ để phục vụ nhu cầu và phần mềm đủ phong phú để tận dụng nguồn lực, Trung Quốc có thể duy trì lợi thế về tốc độ triển khai ứng dụng. Trái lại nếu chuỗi cung ứng hoặc hệ sinh thái phần mềm sụt giảm, thì quy mô lớn cũng sẽ vấp phải giới hạn siêu thực tế.

Tóm lại, thông qua chiến lược phần cứng "lấy thịt đè người" của Huawei và sự bùng nổ của các ứng dụng AI, Trung Quốc không chỉ đang củng cố vị thế mà còn đang tạo ra một mô hình tăng trưởng kinh tế mới, trong đó AI đóng vai trò là động lực then chốt. Thế giới sẽ phải theo dõi sát sao bởi cuộc đua AI đã không còn là cuộc đua một chiều.

