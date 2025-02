Bạn có bắt đầu quen với sự "toàn năng" của DeepSeek không? DeepSeek dường như có thể mang tới cho bạn mọi câu trả lời: viết một bản kế hoạch; tra cứu một vấn đề y khoa; tìm mộ lời khuyên hay ngay cả giải mã một giấc mơ... Nhưng không ai có thể ngờ rằng DeepSeek, vốn đang ngày càng được nhiều người tin tưởng, lại thực sự có thể nói những điều vô nghĩa một cách nghiêm túc.

AI không phải công cụ toàn năng, nó thậm chí còn gây hoang mang vì cung cấp thông tin sai lệch

"DeepSeek không đáng tin cậy cho việc tìm kiếm tài liệu", một giáo sư từ một trường đại học nổi tiếng ở Quảng Châu (Trung Quốc) gần đây đã lên tiếng phàn nàn. Ban đầu, giáo sư muốn sử dụng DeepSeek để tìm kiếm thông tin về "Tiếng Quảng Đông toàn cầu: Sự lan tỏa của ngôn ngữ và văn hóa Quảng Đông". Tuy nhiên, sau khi xác minh, ông phát hiện tác giả mà DeepSeek cung cấp là giả mạo, năm không đúng và nhà xuất bản hoàn toàn không liên quan. Sau khi trao đổi thêm, DeepSeek thừa nhận thông tin đó là sai, cảm ơn ông đã sửa lỗi và bày tỏ lời xin lỗi.

Gần đây, Zhan Guoshu, một nhân vật truyền thông nổi tiếng và là cựu tổng biên tập của ấn bản nước ngoài của tờ Nhân dân Nhật báo, cũng đã đăng một bài viết có tựa đề: Sai sót chết người của DeepSeek - thông tin bịa đặt.

Zhan Guoshu đã trích dẫn kinh nghiệm cá nhân của mình trong bài viết và yêu cầu DeepSeek viết "Sử ký của Đại sử gia: Tiểu sử của Chiêm Quốc Thư". Tuy nhiên, thông tin cơ bản như nơi sinh và họ mẹ được hiển thị trong câu đầu tiên đã bị ghi sai. Sau đó, ông yêu cầu DeepSeek viết một bài tường thuật của một phóng viên nào đó, với phong cách sống động và nhiều ví dụ. Tuy nhiên, khi nó được chuyển cho chính phóng viên, anh ta đã phủ nhận hoàn toàn mọi thứ.

Người ta nói rằng DeepSeek có kỹ năng viết tuyệt vời và trình độ văn chương cao, nhưng tác phẩm nổi tiếng "Thế giới bình thường" của Lục Dao lại bị nhầm lẫn là tác phẩm tiêu biểu của Chiêm Quốc Thư. Điều này cực kì nguy hại, bởi nếu không có kiến thức nền vững vàng, người dùng rất dễ bị "đánh lừa" bởi những thông tin sai lệch.

Trên thực tế, việc thể hiện thông tin không chính xác gần như đã trở thành một trong những vấn đề bị phàn nàn nhiều nhất của DeepSeek. Trong đó, việc nhầm lẫn "râu ông nọ cắm cằm bà kia" của các tác phẩm và tác giả là điều thường xuyên diễn ra. Bởi vậy, nhiều người đã cho rằng DeepSeek chỉ phù hợp để viết mã và tính toán, và hoàn toàn không thân thiện hoặc hữu ích với sinh viên chuyên ngành nghệ thuật tự do.

Một số người đã thử sử dụng DeepSeek để ôn thi cấp quốc gia và cấp tỉnh đã phải học lại sách giáo khoa bởi những thông tin cơ bản đều bị sai lệch lớn.

Một số cư dân mạng cố gắng giải phóng nhân lực thông qua DeepSeek cũng bị ăn "quả lừa thậm tệ". Ví dụ, một người đã sử dụng DeepSeek để viết một bài báo và trích dẫn bốn ví dụ, nhưng khi xác minh lại thông tin, anh ta không thể tìm thấy ba trong số đó. Cuối cùng, anh ta phát hiện ra rằng tất cả chúng đều do chính DeepSeek tạo ra. "Tôi nghĩ rằng tôi đến đây để giải thoát bản thân, nhưng không ngờ tôi phải tốn nhiều năng lượng hơn để xác minh thông tin" - người dùng này than vãn.

Nhưng điều đáng sợ nhất lại là: Sự bịa đặt

Một người dùng ở Thiểm Tây (Trung Quốc) luôn bối rối trước thực tế là quy hoạch đường bộ ở Tây An đòi hỏi phải đi đường vòng qua An Định Môn. Khi anh hỏi cảnh sát giao thông địa phương và tài xế taxi đang làm nhiệm vụ, nhưng họ không thể trả lời. Thấy DeepSeek được ưa chuộng, anh quyết định thử và hỏi DeepSeek, "Trong quy hoạch đường bộ của Tây An, tại sao các anh không đi thẳng từ phần phía bắc của Đường vành đai Tây đến phần phía nam của Đường vành đai Tây, mà lại phải đi đường vòng qua An Định Môn?"

DeepSeek lần đầu tiên đề xuất khái niệm "Khu vực hạn chế tiếng ồn của thành phố" trong phần giải thích của mình, nêu rằng theo "Kế hoạch bảo vệ thành phố lịch sử và văn hóa Tây An (2020-2035)", các khu vực bảo vệ cấp một và cấp hai được chỉ định xung quanh An Định Môn. Bản chất của việc này là bảo vệ các di tích văn hóa và ngăn ngừa rung động quá mức. Nó thậm chí còn liệt kê dữ liệu không gian cụ thể, chẳng hạn như khoảng cách tăng bao nhiêu và độ sâu truyền rung động thay đổi ra sao.

Thoạt nhìn, lời giải thích này có vẻ rất hợp lý! Với các lý thuyết, dữ liệu và chính sách có độ tin cậy cao. Tuy nhiên, khi cư dân mạng kiểm tra, họ phát hiện ra rằng không hề có khái niệm "khu vực hạn chế tiếng ồn" trong văn bản "Kế hoạch bảo vệ thành phố văn hóa lịch sử Tây An (2020-2035)". Câu trả lời có vẻ cực kỳ chuyên nghiệp và hợp lý này thực chất là "bịa đặt".

Người dùng đã phản hồi cho DeepSeek và họ rất trung thực và chân thành thừa nhận lỗi của mình. Thực sự không có đề cập nào đến "vùng hạn chế tiếng ồn" trong tài liệu. Đôi khi, để làm cho câu trả lời của mình có vẻ sâu sắc, DeepSeek sẽ sử dụng một số thuật ngữ chuyên môn. Khi "ngôn từ" vượt quá nhận thức của người dùng, nó có thể thực sự gây hoang mang cho mọi người và khiến họ khó phân biệt thật giả.

Câu hỏi đặt ra là, tại sao DeepSeek lại giả vờ biết điều gì đó khi nó không biết, thậm chí còn nói dối?

Nguyên nhân là do ảo giác của AI. Ngành công nghiệp sử dụng thuật ngữ này để mô tả hiện tượng AI "nói dối", tức là câu trả lời đầu ra có vẻ hợp lý và mạch lạc về nội dung, nhưng "không nhất quán với ý định của câu hỏi đầu vào, không nhất quán với kiến thức thế giới, không nhất quán với thực tế hoặc dữ liệu đã biết hoặc không thể xác minh được".

Đây không chỉ là lỗi của DeepSeek. Tháng 8 năm ngoái, Arthur AI, một công ty khởi nghiệp về trí tuệ nhân tạo và nền tảng giám sát máy học có trụ sở tại New York, đã công bố một báo cáo so sánh khả năng xuất hiện ảo giác trong các mô hình ngôn ngữ lớn do OpenAI, Meta, Anthropic và Cohere phát triển. Báo cáo nghiên cứu cho thấy những mô hình lớn này sẽ gây ra ảo giác.

Tuy nhiên, so với các thiết bị tương tự, hiện tượng "ảo giác" của DeepSeeK-R1 rõ ràng hơn. Trong thử nghiệm ảo giác Vectara HHEM AI (một thử nghiệm có thẩm quyền trong ngành đánh giá tỷ lệ ảo giác của mô hình bằng cách phát hiện xem nội dung do mô hình ngôn ngữ tạo ra có phù hợp với bằng chứng ban đầu hay không, giúp tối ưu hóa và lựa chọn mô hình), DeepSeek-R1 cho thấy tỷ lệ ảo giác là 14,3%. Con số này không chỉ cao hơn gần 4 lần so với thế hệ trước là DeepSeek-V3 mà còn vượt xa mức trung bình của ngành.

Bản thân DeepSeek cũng thừa nhận rõ ràng "những hạn chế về mặt kỹ thuật" bao gồm: logic cơ bản của việc tạo nội dung mô hình quy mô lớn hiện nay dựa trên xác suất và thực sự có một thách thức về độ tin cậy không đồng đều của thông tin được tạo ra. Nói một cách đơn giản, nó không "chính thống". Bất kỳ nội dung nào trên Internet, dù đúng hay sai, đều có thể trở thành tài liệu tham khảo cho DeepSeeK và DeepSeeK chỉ chịu trách nhiệm suy luận dựa trên nội dung hiện có và không chịu trách nhiệm về thông tin đó.

Lý do khiến ảo giác của DeepSeek-R1 nghiêm trọng hơn là vì nó tăng cường "chuỗi suy nghĩ" (CoT) và khả năng sáng tạo. Ví dụ, DeepSeek-R1 không chỉ có thể viết năm chữ khổ thơ và bảy chữ khổ thơ, mà còn viết rất trôi chảy, có hiểu biết riêng về quan niệm nghệ thuật của thơ ca. Khả năng sáng tạo mạnh mẽ như vậy là do tính sáng tạo của mô hình liên tục được khuyến khích trong quá trình đào tạo tăng cường DeepSeek-R1 trong các nhiệm vụ nghệ thuật tự do.

Tuy nhiên, nó cũng đi kèm với "tác dụng phụ". Ví dụ, trong quá trình tăng cường "chuỗi tư duy", DeepSeek-R1 không tối ưu hóa các tác vụ tương đối đơn giản như tóm tắt, dịch thuật và viết tin tức, mà bổ sung tư duy ở nhiều cấp độ khác nhau và sẽ tiếp tục mở rộng. Do đó, khi đối mặt với các vấn đề phức tạp hoặc khó khăn, nó có thể thực hiện vượt quá mức bình thường và thậm chí đưa ra những câu trả lời bất ngờ. Tuy nhiên, khi đối mặt với một số nhiệm vụ đơn giản, DeepSeek-R1 có thể thực hiện vượt mức vì nó đã quen với tư duy sâu.

Làm thế nào để tránh được những "cú lừa tức tưởi"?

Khi so sánh, DeepSeek-R1 thực sự logic hơn trong "khoa học", nhưng trong "nghệ thuật tự do", nó có thể liên kết nội dung không liên quan và bịa ra câu chuyện. Vì lý do này, khi kỷ nguyên AI ngày càng phát triển, chúng ta cần tìm kiếm sự thật hơn bao giờ hết và nâng cao khả năng phân biệt đúng sai và suy nghĩ độc lập.

Hiện tượng này chỉ ra chính xác những rủi ro và gióng lên hồi chuông cảnh báo cho kỷ nguyên AI sắp tới. Với tư cách là người dùng, điều chúng ta có thể làm là tìm ra cách sử dụng AI đúng cách và không để bị lừa. Ví dụ, phương pháp đơn giản nhất là phải siêng năng và tiến hành tìm kiếm so sánh thông qua các công cụ tìm kiếm khác. Hoặc bạn có thể nhấp vào nguồn web được DeepSeek trích dẫn trong câu trả lời để xem trường hợp được đề cập có thực sự tồn tại hay không.

Trong môi trường bùng nổ thông tin ngày nay và khó phân biệt sự thật và sự dối trá, mọi người nên liên tục tăng cường nhận thức về bản thân. Một suy nghĩ độc lập hơn có nghĩa là ít có khả năng bị lừa dối hơn. Cuối cùng, AI không thể giải quyết vấn đề một lần và mãi mãi. Thay vào đó, nó đặt ra những yêu cầu cao hơn, bao gồm cách đặt câu hỏi, cách giao tiếp với AI và cách phân biệt thông tin.

Theo Sohu