Tại hội nghị Morgan Stanley gần đây, CEO NVIDIA Jensen Huang đã chia sẻ góc nhìn về giai đoạn mới của ngành trí tuệ nhân tạo, nơi các hệ thống "agentic AI" đang bắt đầu đảm nhiệm những công việc trước đây cần đến chuyên môn của con người. Trong cuộc thảo luận này, ông đặc biệt nhắc đến OpenClaw và gọi đây là một trong những bản phát hành phần mềm quan trọng nhất từng xuất hiện.

Theo Jensen Huang, tốc độ lan rộng của OpenClaw vượt xa những cột mốc từng thấy trong lịch sử phần mềm mã nguồn mở. Linux - hệ điều hành nền tảng của phần lớn hạ tầng máy chủ hiện nay - phải mất khoảng 30 năm để đạt được mức độ phổ biến như hiện tại. Trong khi đó, OpenClaw chỉ mất khoảng ba tuần để đạt lượng tải về vượt qua Linux, trở thành phần mềm mã nguồn mở được tải xuống nhiều nhất trong lịch sử.

Lý do khiến OpenClaw thu hút sự quan tâm lớn nằm ở cách các hệ thống AI dạng "agent" có thể xử lý các nhiệm vụ phức tạp thông qua chuỗi lệnh nhắc. Những tác vụ vốn cần chuyên gia hoặc nhiều giờ làm việc như tìm kiếm dữ liệu trên web, phân tích thông tin, tạo nội dung hình ảnh hoặc tổng hợp báo cáo giờ đây có thể được tự động hóa.

Jensen Huang cho biết sự phổ biến của các AI agent đang làm thay đổi hoàn toàn nhu cầu tính toán của ngành công nghệ. Theo ông, lượng token được xử lý trong các hệ thống AI đã tăng khoảng 1.000 lần so với trước đây. Điều này tạo ra một "khoảng trống tính toán" khi nhu cầu tài nguyên tăng nhanh hơn khả năng triển khai phần cứng.

Các hệ thống agent có thể thực hiện nhiều tác vụ đồng thời như tìm kiếm web hàng loạt, tạo hình ảnh, phân tích dữ liệu phức tạp hoặc xử lý ngữ cảnh dài.

Trong mô hình phát triển AI mà Jensen Huang mô tả là "chiếc bánh 5 lớp", lớp ứng dụng được xem là nơi tạo ra giá trị kinh tế lớn nhất cho các phòng thí nghiệm AI và những nhà cung cấp hạ tầng điện toán quy mô lớn.

Về phía hạ tầng, NVIDIA đang chuẩn bị các kiến trúc tính toán mới để phục vụ nhu cầu AI ngày càng phức tạp. Các nền tảng Hopper và Blackwell chủ yếu được tối ưu cho huấn luyện mô hình. Trong giai đoạn tiếp theo, kiến trúc Vera Rubin sẽ tập trung xử lý khối lượng công việc liên quan đến ngữ cảnh dài và tác vụ của agentic AI bằng cách tăng dung lượng bộ nhớ tích hợp và phát triển các nền tảng như ICMS.