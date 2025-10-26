Cuộc thi giao dịch do Alpha Arena tổ chức đang biến những cuộc tranh luận về “AI có thực sự thông minh trong ngành tài chính hay không” thành phép thử bằng tiền thật.

Jay Azhang, một kỹ sư sống ở New York, là người khởi xướng và điều phối hạ tầng thí nghiệm: mỗi mô hình AI hàng đầu – Claude Sonnet, DeepSeek, ChatGPT, Gemini, Grok và Qwen – được cấp 10.000 USD tiền vốn thực để tự giao dịch hợp đồng tương lai tiền mã hóa trên Hyperliquid, hoàn toàn không có bàn tay con người can thiệp trong khâu ra quyết định.

Mọi vị thế mở và thay đổi danh mục đều được nền tảng Nof1.ai theo dõi theo thời gian thực, qua đó biến cuộc thi thành một bảng chấm điểm công khai về năng lực lập luận, quản trị rủi ro và thích ứng của từng mô hình trước một thị trường nổi tiếng khó lường.

Vào ngày thứ hai của cuộc đua, các mô hình GPT-5 và Gemini 2.5 là những người dẫn đầu

Ngay sau khi khởi động vào ngày 17-10, cục diện ban đầu khiến nhiều người sững sờ. DeepSeek chọn chiến lược đánh cược mạnh mẽ vào xu hướng tăng, phối hợp với Grok để cùng “tất tay” ở phía mua khi biên độ dao động bùng nổ.

Đà hồi phục của thị trường trong 24 giờ đầu tiên đã đẩy cả hai lên nhóm dẫn đầu, trong đó DeepSeek nhanh chóng nâng số dư tài khoản lên xấp xỉ 14.000 USD, tức lãi khoảng 40% chỉ sau 2 ngày - một con số đủ gây chú ý ngay cả với những nhà giao dịch dày dặn kinh nghiệm.

Trái ngược, Gemini khởi đầu bằng quan điểm bi quan, bán khống gần như mọi thứ rồi quay xe sang mua lên khi đà tăng kéo dài, khiến tài khoản trượt dốc khoảng 35% và thể hiện rõ dấu hiệu “hoảng loạn chiến lược”. GPT-5 của OpenAI bắt đầu dịch chuyển theo hướng tương tự, như thể đang học bài học vỡ lòng rằng thị trường tiền mã hóa luôn có thể tạo ra tương lai ngoài khuôn mẫu.

Các mô hình khác phác họa những tính cách giao dịch riêng. Grok được chính Jay Azhang nhận xét là có “nhận thức ngữ cảnh vi mô của cấu trúc thị trường” tốt, và số liệu thực chiến củng cố nhận định đó khi mô hình này thắng ở toàn bộ năm vòng gần nhất tính cả giai đoạn thử nghiệm, qua đó cho thấy độ ổn định hiếm thấy trong một môi trường nhiễu động.

Đến ngày 20-10, DeepSeek vẫn là người dẫn đầu với lợi nhuận hơn 18%. Dường như việc có nguồn gốc từ những người lập nên quỹ phòng hộ đã mang lại cho DeepSeek nhiều lợi thế hơn các đối thủ khác

Claude Sonnet lại điềm tĩnh hơn nhiều: danh mục luôn duy trì số vị thế mở ít, nhịp giao dịch chậm rãi và ưu tiên kiểm soát rủi ro, đúng với phong cách cẩn trọng mà người dùng quen thuộc ở sản phẩm của Anthropic. Ở chiều ngược lại, Qwen thời điểm ấy có dấu hiệu hụt hơi khi chỉ còn duy trì một vị thế, như thể đang “cắt lỗ sự chú ý” để chờ cơ hội khác.

Thế nhưng, vài phiên trôi qua đã đủ để thị trường trình diễn bài học muôn thuở về tính bất định. Đến ngày 24-10, bảng xếp hạng ghi nhận cú lội ngược dòng ngoạn mục: Qwen 3 Max của Alibaba vươn lên dẫn đầu với số dư 17.150 USD, tương đương mức sinh lời hơn 70%.

DeepSeek Chat giữ vị trí thứ hai ở 13.747 USD, tức lợi nhuận xấp xỉ 37,4%. Hai đại diện đến từ Trung Quốc vì thế đã áp đảo loạt mô hình phương Tây như GPT-5, Gemini hay Grok trong chặng đánh giá này, qua đó thắp lên cuộc tranh luận sôi nổi về lợi thế thiết kế, dữ liệu huấn luyện và chiến lược tối ưu hóa khi AI bước vào tài chính tự động.

Thật bất ngờ khi vào những ngày cuối cùng của cuộc đua, Qwen-3 của Alibaba mới là người chiến thắng cuối cùng

Bối cảnh thị trường trong giai đoạn chấm điểm nói trên không hề “dễ chịu”. Những thông tin bất ngờ về chính sách thuế quan và điều chỉnh quy định xuất khẩu của Trung Quốc đã làm thay đổi kỳ vọng rủi ro, qua đó khuếch đại biến động ở các token vốn nhạy cảm như Solana và Ethereum.

Hiệu ứng dây chuyền này trở thành phép thử áp lực đối với hệ thống quản trị rủi ro của từng mô hình. Claude Sonnet 4.5 là trường hợp điển hình cho mặt trái của đòn bẩy cao: mô hình này bị thanh lý sau khi mở vị thế mua Ethereum với mức đòn bẩy 20 lần, chỉ vài giờ trước khi tin xấu ập đến.

Sự cố cho thấy dù khả năng dự báo và thích ứng đã tiến bộ, các thuật toán giao dịch tự chủ vẫn rất tổn thương trước cú sốc thông tin ngoài mẫu, đặc biệt khi kết hợp với mức rủi ro khuếch đại bởi đòn bẩy.

Từ một thử nghiệm mang tính giải trí, Alpha Arena đang trở thành dấu mốc cho thấy sự thay đổi cán cân quyền lực trong lĩnh vực tài chính tự động. Các mô hình AI do Trung Quốc phát triển đang tiến nhanh, thậm chí vượt qua cả những hệ thống đến từ Mỹ về khả năng thích ứng và lợi nhuận thực tế.

Nhà sáng lập Jay Azhang cho biết cuộc thi sẽ tiếp tục trong vài tuần tới để kiểm tra tính ổn định dài hạn của các mô hình, trong khi cộng đồng đầu tư toàn cầu đang dõi theo sát sao. Ngay cả CZ – nhà sáng lập Binance – cũng bình luận rằng “sẽ có rất nhiều người bắt đầu nghiên cứu AI cho giao dịch sau sự kiện này,” dự báo làn sóng giao dịch tự động có thể sớm bùng nổ trên quy mô toàn cầu.