Tại Hội nghị công nghệ GPU (GTC), Nvidia công bố GPU Blackwell Ultra mới, được cho là mang lại hiệu suất suy luận AI và hiệu quả năng lượng tốt hơn so với các thế hệ trước đây. Trong khi đó, CPU Vera dựa trên Arm và GPU Rubin sẽ được công ty chính thức ra mắt vào nửa cuối năm 2026, hứa hẹn hiệu suất đào tạo AI và suy luận tốt hơn so với chipset Grace-Blackwell.

“Lượng tính toán mà chúng ta cần tại thời điểm này đã dễ dàng gấp 100 lần so với thời điểm này năm ngoái”, Huang, mặc chiếc áo khoác đen đặc trưng của mình, nói với khán đài chật kín.

AI lý luận đề cập đến các hệ thống trí tuệ nhân tạo có thể mô phỏng quá trình suy nghĩ của con người. Thay vì chỉ đơn giản lấy câu trả lời từ cơ sở dữ liệu hoặc rút ra kết luận từ nhận dạng mẫu, AI lý luận sao chép các khả năng nhận thức của con người, hiểu mối quan hệ nhân quả và đưa ra quyết định dựa trên ngữ cảnh.

Theo Huang, sự phổ biến gia tăng của AI suy luận sẽ tiếp tục giúp chip Nvidia bay xa. Hãng cho biết chipset GB300 mới -- với CPU Grace và GPU Blackwell Ultra -- sẽ có thể cắt giảm thời gian tạo phản hồi R1 xuống còn 10 giây từ một phút rưỡi nếu chạy trên chip Hopper 100.

Bên cạnh đó, gã khổng lồ chip cũng công bố một phần mềm suy luận AI nguồn mở mới có tên Dynamo. Phần mềm này sẽ giúp tăng hiệu suất suy luận và giảm chi phí tính toán cho các mô hình suy luận.

Nvidia cho biết Dynamo có thể giúp tăng số lượng mã thông báo do mỗi GPU tạo ra lên 30 lần khi chạy mô hình DeepSeek R1 trên GB200. Để so sánh, R1 có giá 2,19 USD/ 1 triệu mã thông báo đầu ra, rẻ hơn khoảng 96% so với o1 của OpenAI.

Trong bài phát biểu quan trọng của mình, Huang cũng hé lộ một con chip AI thế hệ tiếp theo có tên là Feynman, sẽ được phát hành sau Rubin vào khoảng năm 2028.

Quay về năm 2009, thời điểm Nvidia tổ chức hội nghị dành cho nhà phát triển lần đầu tiên, hàng chục học giả đã lấp đầy một khách sạn ở San Jose, California. Jensen Huang, giám đốc điều hành của nhà sản xuất chip, khi ấy đi khắp sân khấu như một ‘thẩm phán’.

Năm nay, hội nghị của Nvidia hoành tráng hơn nhiều.

Hơn 25.000 người có mặt tại GTC, với số lượng đủ lớn để lấp đầy một đấu trường National Hockey League, để nghe bài phát biểu về tương lai trí tuệ nhân tạo từ ông Huang - người được mệnh danh là ‘A.I. Jesus’. Nvidia, nhà phát triển chip A.I hàng đầu thế giới, đã phủ kín San Jose bằng sắc xanh lá neon và đen quen thuộc, tạm dừng một số tuyến đường và khiến giá khách sạn tăng vọt lên tới 1.800 USD/đêm.

Một số nhà lãnh đạo trong ngành dự kiến sẽ tham dự, bao gồm Michael Dell, giám đốc điều hành của Dell Technologies; Jeffrey Katzenberg, đồng sáng lập DreamWorks và WndrCo, một công ty đầu tư mạo hiểm; và Bill McDermott, giám đốc điều hành của ServiceNow.

“Nvidia tạo ra những con chip như oxy cho A.I., vì vậy mọi người luôn sẵn sàng tìm hiểu về những sản phẩm mới nhất và tuyệt vời nhất của họ”, Ali Farhadi, giám đốc điều hành của Viện trí tuệ nhân tạo Allen, người cũng tham dự, cho biết. “Sự rộng lớn của công nghệ trưng bày tại đó sẽ vô cùng phi thường”.

Sự kiện, kéo dài 1 tuần về robot, mô hình ngôn ngữ lớn và xe tự hành, cho thấy cú chuyển mình ngoạn mục của Nvidia. Khi A.I. trở nên phổ biến, nhà sản xuất chip này được định giá gần 3 nghìn tỷ USD, tăng từ mức 8 tỷ USD vào năm 2009.

Tuy nhiên, sự trỗi dậy của Nvidia cũng làm dấy lên nhiều câu hỏi.

Trí tuệ nhân tạo tạo sinh, có thể trả lời câu hỏi, tạo hình ảnh và viết mã, đã được ca ngợi vì tiềm năng cải thiện doanh nghiệp và tạo ra hàng nghìn tỷ USD giá trị kinh tế. Microsoft, Amazon, Google, Meta và các công ty khác đang chi hàng trăm tỷ USD để biến ý tưởng đó thành hiện thực.

Dẫu vậy, khoản chi này đã gây ra mối lo ngại trên khắp Phố Wall và Thung lũng Silicon, rằng liệu trí tuệ nhân tạo có mang lại đủ doanh thu để bù đắp cho những chi phí khổng lồ mà nó đòi hỏi.Quỹ đạo của công nghệ có thể bị đảo lộn bởi những người mới tham gia như DeepSeek - startup Trung Quốc thành công tạo ra một hệ thống trí tuệ nhân tạo tiên tiến chỉ với một phần nhỏ chip Nvidia.

Tại Nvidia GTC, ông Huang sẽ tìm cách trấn an mọi người rằng trí tuệ nhân tạo sẽ phát huy hết tiềm năng của nó, Patrick Moorhead, người sáng lập công ty nghiên cứu công nghệ Moor Insights & Strategy cho biết. Vị CEO này dự kiến trình bày chi tiết cách các hệ thống trí tuệ nhân tạo cung cấp dịch vụ, cũng như nhiều ứng dụng mang tính tương lai hơn cho A.I. như phát triển các robot có kích thước bằng người.

