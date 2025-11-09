Công nghệ "mind captioning" đang khiến giới khoa học sửng sốt khi có thể biến tín hiệu não bộ thành những câu mô tả chính xác về hình ảnh hoặc khung cảnh mà con người đang nghĩ tới. Đây là công nghệ mới do nhóm nhà khoa học Mỹ công bố - một bước tiến đáng chú ý trong lĩnh vực trí tuệ nhân tạo và khoa học thần kinh: Công nghệ “mind-captioning” (tạm dịch: “chú thích suy nghĩ”).

Hệ thống này có thể giải mã hoạt động của não và chuyển đổi những gì con người nhìn thấy hoặc tưởng tượng trong đầu thành câu mô tả bằng chữ với độ chính xác đáng kinh ngạc.

Công trình được công bố trên tạp chí Science Advances, mở ra viễn cảnh mới trong việc hiểu cách não bộ con người diễn giải thế giới xung quanh. Đồng thời, công nghệ mới này cũng gợi mở tiềm năng ứng dụng trong hỗ trợ người mắc các chứng rối loạn ngôn ngữ, chẳng hạn như sau đột quỵ.

Công nghệ “mind-captioning” có thể giải mã hoạt động não và chuyển đổi những gì con người nhìn thấy hoặc tưởng tượng trong đầu thành câu mô tả bằng chữ với độ chính xác cao. (Ảnh: Nature.com)

Theo nhóm nghiên cứu tại Đại học California, Berkeley (Mỹ), kỹ thuật này sử dụng công nghệ chụp hình não không xâm lấn để ghi nhận hoạt động thần kinh. Sau đó, các nhà khoa học dùng mô hình ngôn ngữ AI tiên tiến để dự đoán và mô tả chính xác điều mà người tham gia đang nhìn hoặc tưởng tượng.

“Hệ thống có thể dự đoán ở mức độ chi tiết rất cao những gì một người đang nhìn thấy. Đây là điều chưa từng có tiền lệ” , nhà khoa học thần kinh tính toán Alex Huth khẳng định.

Trong hơn một thập kỷ, giới nghiên cứu đã tìm cách dự đoán hình ảnh hoặc âm thanh dựa trên tín hiệu não. Tuy nhiên, việc “dịch” những nội dung phức tạp như video hoặc hình dạng trừu tượng thành ngôn ngữ vẫn là một thách thức lớn.

Các phương pháp trước đây chỉ nhận diện được từ khóa đơn lẻ thay vì toàn bộ ngữ cảnh như chủ thể, hành động và môi trường xung quanh.

Để vượt qua giới hạn này, nhóm nghiên cứu của ông Tomoyasu Horikawa – nhà khoa học thần kinh tại Phòng thí nghiệm Khoa học truyền thông NTT (Nhật Bản) đã phát triển mô hình AI ngôn ngữ sâu. Đầu tiên, họ sử dụng một mô hình ngôn ngữ sâu để phân tích phụ đề của hơn 2.000 video, chuyển mỗi đoạn thành một “chữ ký ý nghĩa” – biểu đồ số thể hiện nội dung video.

Sau đó, nhóm huấn luyện một hệ thống AI khác nhận diện mối liên hệ giữa các “chữ ký ý nghĩa” này và hoạt động não của 6 người tham gia khi họ xem video.

Kết quả cho thấy, AI có thể “dịch” chính xác những gì người tham gia đang xem hoặc tưởng tượng thành câu mô tả hoàn chỉnh, không chỉ liệt kê từ khóa.

Các chuyên gia nhận định, công nghệ “mind-captioning” không chỉ là cột mốc trong nghiên cứu khoa học thần kinh mà còn mở ra khả năng ứng dụng thực tiễn rộng lớn. Trong tương lai, kỹ thuật này có thể hỗ trợ người mất khả năng nói, giúp họ giao tiếp thông qua tín hiệu não.

Dù còn ở giai đoạn đầu, “mind-captioning” đánh dấu bước tiến lớn trong hành trình giải mã ngôn ngữ của tư duy con người, đưa viễn cảnh “đọc suy nghĩ” vốn chỉ có trong các bộ phim khoa học viễn tưởng đến gần hơn với thực tế.