Một tình huống trớ trêu vừa xảy ra với hệ thống bảo mật CAPTCHA: AI mới của OpenAI không chỉ vượt qua lớp bảo vệ của Cloudflare, mà còn tự tường thuật lại hành động “giả làm người” một cách trôi chảy.

Mới được OpenAI triển khai cách đây không lâu, tính năng ChatGPT Agent,cho phép AI truy cập Internet thực qua một trình duyệt ảo riêng biệt. Người dùng có thể theo dõi các bước làm việc của tác nhân AI này, tham gia vào những quyết định ảnh hưởng tới thực tế như đặt hàng, thanh toán, v.v...

Trong một thử nghiệm được người dùng Reddit chia sẻ, Agent đã dễ dàng vượt qua bước kiểm tra “Xác minh bạn là con người”, vốn nhằm ngăn chặn chính những chương trình tự động truy cập trang web. Tác nhân AI của OpenAI tuyên bố một cách tự nhiên rằng nó sẽ tick vào ô "Tôi không phải robot", để xác nhận rằng mình không phải máy móc, trong khi mình là một hệ thống AI nhân tạo.

Link đã được chèn, nên giờ tôi sẽ click vào hộp thoại "Xác nhận bạn là người" để hoàn thành bài kiểm tra của Cloudflare. Bước này cần thiết để chứng minh tôi không phải bot và thực hiện hành động tiếp theo", AI của ChatGPT tuyên bố.

"Thử thách của Cloudflare đã xong. Giờ tôi sẽ bấm vào nút Convert để chuyển tới bước tiếp theo của tiến trình".

Cloudflare sử dụng hệ thống Turnstil, vốn phân tích hành vi như chuyển động chuột và thời gian nhấp để quyết định hiển thị "bài kiểm tra" CAPTCHA hay không. Dù Agent chưa phải đối mặt với bài kiểm tra hình ảnh phức tạp, việc vượt qua lớp sàng lọc đầu tiên đã cho thấy mức độ tinh vi trong khả năng tự động hóa trình duyệt của AI.

Trong khi CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart, hay "Phép thử Turing công cộng hoàn toàn tự động để phân biệt máy tính với người") từng được xem là tấm khiên bảo vệ Internet khỏi bot tự động, ngày nay, nó giống một công cụ làm chậm và tăng chi phí cho kẻ tấn công hơn. Thậm chí, những bài kiểm tra như reCAPTCHA còn phục vụ mục đích huấn luyện AI cho chính Google, nghĩa là con người càng chứng minh mình không phải robot, AI càng trở nên giỏi hơn trong việc giả làm người.

ChatGPT Agent còn chứng minh khả năng xử lý quy trình đa bước, như đặt mua hàng tạp hóa theo yêu cầu người dùng. Tuy nhiên, nó không hoàn hảo: một số giao diện website vẫn đủ “rối” để khiến AI lúng túng.

Tình huống này không chỉ hài hước, mà còn đặt ra câu hỏi lớn về tương lai của các hệ thống xác minh: khi AI đủ “giống người” để đánh lừa cả công cụ phát hiện bot, liệu còn ranh giới nào giữa người thật và phần mềm thông minh?