Tại sao giấc mơ trợ lý ảo toàn năng cần ít nhất 5 năm nữa để thành hiện thực?
Trong khi các gã khổng lồ công nghệ đua nhau ra mắt AI với lời hứa hẹn về năng suất vượt trội, thực tế lại phũ phàng hơn nhiều. Những hạn chế cốt lõi về công nghệ đang biến các "trợ lý toàn năng" này thành nỗi thất vọng lớn, đòi hỏi một bước nhảy vọt về kỹ thuật.
Trong hơn một năm qua, các ông lớn công nghệ như Microsoft, Salesforce hay ServiceNow đã liên tục trình làng các "tác nhân AI" (AI agents) với cam kết tự động hóa quy trình làm việc và tối ưu hóa năng suất doanh nghiệp.
Tuy nhiên, đằng sau những lời quảng cáo hào nhoáng, các chuyên gia cảnh báo rằng những công cụ này vẫn chỉ là những phiên bản sơ khai, còn rất xa mới đạt được định nghĩa chuẩn mực của một tác nhân thực thụ.
Thực tế ảm đạm của các "tác nhân" hiện đại
Vấn đề cốt lõi nằm ở khả năng vận hành. Một tác nhân AI thực thụ phải có khả năng hoạt động trong thời gian dài, tự đặt ra mục tiêu, tương tác linh hoạt với môi trường, sử dụng công cụ và tự điều chỉnh chiến lược.
Nhưng thực tế, những gì chúng ta đang có, như "tác nhân" trong Microsoft 365, về cơ bản chỉ là công cụ tự động tạo văn bản Word. Chúng giới hạn trong các cuộc trò chuyện và thường xuyên thất bại khi phải xử lý các tác vụ nằm ngoài ngữ cảnh hẹp được lập trình sẵn.
Số liệu thị trường cũng phản ánh sự thờ ơ này. Báo cáo từ Menlo Ventures cho thấy sự tăng trưởng chủ yếu tập trung vào các công cụ hỗ trợ đơn giản (co-pilot) như ChatGPT Enterprise, chứ không phải các nền tảng tác nhân phức tạp. Đáng ngại hơn, Judson Althoff - Giám đốc điều hành mảng kinh doanh thương mại của Microsoft - gần đây thừa nhận rằng tỷ lệ thất bại của các dự án AI lên tới hơn 80%.
Các nhà nghiên cứu từ Đại học Stanford cũng chỉ ra rằng, dù các mô hình ngôn ngữ lớn (LLM) có khả năng suy luận ấn tượng, chúng vẫn "vỡ vụn" khi đối mặt với các kế hoạch đa bước phức tạp. Những giải pháp chúng đưa ra thường mong manh và dễ dàng sụp đổ chỉ với những thay đổi nhỏ trong dữ liệu đầu vào.
Hai rào cản kỹ thuật khổng lồ
Để biến giấc mơ AI tác nhân thành hiện thực, ngành công nghiệp cần vượt qua hai thách thức kỹ thuật nền tảng: Học tăng cường (Reinforcement Learning - RL) và Bộ nhớ (Memory).
Về học tăng cường, thành tựu lớn nhất hiện nay là AlphaZero của Google DeepMind, vốn đã làm chủ cờ vua và cờ vây. Tuy nhiên, áp dụng RL vào các tác vụ doanh nghiệp phức tạp và mở là một bài toán hoàn toàn khác.
Các dự án mới như Agent-R1 của Trung Quốc hay Sophia của Đại học Westlake đang nỗ lực đưa RL vào LLM để tạo ra sự tự chủ, nhưng tất cả vẫn chỉ dừng lại ở mức "sơ khai". Một hướng đi hứa hẹn là DiscoRL của Google DeepMind, nơi AI tự thiết kế thuật toán học tập cho chính nó, nhưng khả năng khái quát hóa của nó sang các quy trình kinh doanh thực tế vẫn là một ẩn số.
Về bộ nhớ, các LLM hiện tại đang mắc kẹt trong giới hạn của "cửa sổ ngữ cảnh". Chúng không thể duy trì mạch thông tin trong các tác vụ kéo dài. Một báo cáo từ Stanford cho thấy AI vượt trội hơn con người trong các tác vụ ngắn hạn (dưới 2 giờ), nhưng lại thua kém hoàn toàn khi thời gian kéo dài lên 32 giờ do khả năng ghi nhớ kém.
Để khắc phục, AI cần một cơ chế quản lý bộ nhớ hoàn toàn mới, cho phép truy xuất thông tin từ các tương tác trong quá khứ một cách thông minh, chứ không chỉ dựa vào dữ liệu vừa nhập vào.
Chờ đợi một bước nhảy vọt
Sự bế tắc này tạo ra một vòng luẩn quẩn: Học tăng cường cần bộ nhớ tốt hơn để tiến bộ, nhưng việc phát triển bộ nhớ mới lại phụ thuộc vào khả năng học của chính AI. Ngay cả Trí tuệ nhân tạo tổng quát (AGI) cũng không phải là cây đũa thần có thể giải quyết vấn đề này trong một sớm một chiều.
Nhìn lại lịch sử phát triển từ mô hình Transformer (2017) đến ChatGPT (2022), các chuyên gia ước tính lạc quan rằng chúng ta cần ít nhất 5 năm nữa để chứng kiến sự ra đời của các tác nhân AI thực sự đáng tin cậy. Cho đến lúc đó, các doanh nghiệp có lẽ nên chuẩn bị tinh thần để không bị vỡ mộng trước những lời hứa hẹn quá sớm từ các nhà cung cấp công nghệ.
Thanh niên Việt