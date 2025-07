Gần đây, khi Việt Nam thực hiện sáp nhập đơn vị hành chính, trên mạng xuất hiện hàng loạt ý kiến cảnh báo:"Đừng hỏi ChatGPT về tỉnh thành mới, toàn trả lời sai" . Quả thực, khi hỏi số lượng tỉnh thành hiện tại, hầu hết mô hình AI phổ biến đều trả lời con số 63 thay vì 34 theo Nghị quyết mới. Vậy AI thực sự "vô dụng" đến thế, hay vấn đề nằm ở cách chúng ta đang sử dụng công cụ này?

Theo nghiên cứu FRESHLLMS được công bố tại Hội nghị Ngôn ngữ học tính toán ACL 2024, hầu hết các mô hình ngôn ngữ lớn (LLMs) không được cập nhật dữ liệu theo thời gian thực. Ví dụ, GPT-4 Turbo chỉ có mốc cutoff dữ liệu (thời điểm mà AI không còn được cập nhật kiến thức) đến tháng 4/2023, tương tự mô hình GPT-4o phổ biến nhất của ChatGPT có mốc cutoff dữ liệu là tháng 6/2024. Thông tin này người dùng hoàn toàn có thể hỏi thẳng ChatGPT bằng một lệnh ví dụ như"Dữ liệu của bạn được cập nhật tới ngày nào?". Điều này có nghĩa, mọi sự kiện hành chính sau thời điểm đó sẽ không xuất hiện trong bộ dữ liệu huấn luyện của AI.

Với một câu prompt đơn giản, bạn sẽ biết được kiến thức của AI bị cutoff tại thời điểm nào - Ảnh: Thế Duyệt

Nghiên cứu cũng chỉ ra rằng, trong bài benchmark FRESHQA gồm 600 câu hỏi kiểm tra khả năng trả lời kiến thức cập nhật, mọi mô hình AI không được tích hợp tìm kiếm web đều có accuracy (độ chính xác câu trả lời) dưới 32% ở chế độ STRICT (đòi hỏi câu trả lời không sai lệch hoặc "hallucination", hiện tượng "ảo giác" của AI). Thậm chí với câu hỏi thuộc nhóm fast-changing (thay đổi nhanh), accuracy trung bình chỉ khoảng 15% dù là GPT-4 hay các LLM lớn khác.

Tuy nhiên, khi kết hợp với công cụ tìm kiếm, kết quả thay đổi rõ rệt. Phương pháp FRESHPROMPT, tích hợp dữ liệu mới từ Google Search vào prompt của GPT-4, giúp accuracy tăng từ 28,6% lên 75,6% ở chế độ STRICT, và giảm mạnh tỷ lệ những câu trả lời outdated (lỗi thời, không phù hợp với bối cảnh hiện tại) hoặc bịa đặt do "ảo giác". Đây là minh chứng rõ rệt cho thấy AI không yếu, vấn đề nằm ở cách khai thác.

Nếu hiểu bản chất AI là gì và cách mà chúng được huấn luyện, bạn hoàn toàn có thể cải thiện câu trả lời của AI. Ví dụ, nếu chỉ sử dụng dữ liệu được huấn luyện sẵn của AI mà không dùng tính năng "Tìm kiếm", AI có thể trả lời sai vì dữ liệu đã cũ, không còn phù hợp với bối cảnh hiện tại. Nhưng chỉ với một click, cho phép AI có khả năng tìm kiếm trên môi trường internet, lúc này AI đã có thể cải thiện câu trả lời một cách chính xác hơn nhiều. Tính năng "Tìm kiếm" được tích hợp ở hầu hết các mô hình AI phổ biến hiện nay, bao gồm ChatGPT, DeepSeek, Gemini... - Ảnh: Thế Duyệt

Với Gemini 2.5 Flash, mô hình này thậm chí không cần tới người dùng kích hoạt thủ công chức năng tìm kiếm, bản thân AI sẽ sử dụng luôn tính năng Google Search để lấy dữ liệu tham chiếu - Ảnh: Thế Duyệt

Ngoài ra, hầu hết AI hiện nay đều đính kèm cảnh báo "AI can make mistakes. Use with your own risk" (AI có thể mắc lỗi. Hãy tự chịu trách nhiệm khi sử dụng). Đây không chỉ là câu từ chối trách nhiệm mang tính pháp lý mà còn phản ánh bản chất: AI là công cụ hỗ trợ, tổng hợp và tham khảo, không thay thế nguồn dữ liệu chính thức và bản thân người sử dụng PHẢI nhận thức được vấn đề này.

AI chỉ là công cụ hỗ trợ, không thể tin tưởng hay phụ thuộc 100% vào AI được - Ảnh: Thế Duyệt

Thực tế, việc AI trả lời sai về tỉnh thành mới không chứng minh công nghệ này vô dụng hay không đáng tin. Ngược lại, AI vẫn là công cụ cực kỳ mạnh mẽ khi bản thân người dùng biết cách sử dụng và khai thác: đặt câu hỏi đúng, bật tính năng tìm kiếm web, sử dụng tính năng nghiên cứu sâu khi cần nghiên cứu về một vấn đề nào đó và luôn kiểm chứng thông tin trước khi đưa ra quyết định quan trọng. Đừng kỳ vọng AI "biết tất cả", nhưng cũng đừng bỏ qua tiềm năng của nó chỉ vì những giới hạn vốn có hay chỉ vì bạn không biết cách sử dụng sao cho đúng.