VinBigdata tung "ChatGPT phiên bản Việt": Biết nói đùa, phát hiện nói ngọng, "chỉ thua bản của OpenAI ở khoảng cách rất nhỏ"
VinBigdata sẽ cho phép 1.000 người đầu tiên đăng ký trải nghiệm ViGPT trong vòng 15 ngày, sau đó sẽ tiến hành tinh chỉnh, cập nhật
Sáng ngày 28/12, VinBigdata đã chính thức ra mắt ViGPT, được giới thiệu là "ChatGPT phiên bản Việt" đầu tiên dành cho người dùng cuối.
Tại đây, ông Đinh Tiến Dũng – người còn được biết đến với biệt danh "Giáo sư Cù Trọng Xoay" kiêm MC chương trình Ai là triệu phú, đã trực tiếp lên sân khẩu trải nghiệm ViGPT. Ông đặt ra nhiều câu hỏi trong các lĩnh vực từ pháp lý, văn hóa, xã hội và ViGPT đều trả lời trơn tru. Không chỉ vậy, MC chương trình Ai là triệu phú còn thử ViGPT bằng câu nói sai chính tả: "Hà Lội có phải Thủ đô của Việt Lam không?". Tuy nhiên, công cụ này cũng nhanh chóng phát hiện ra lỗi sai và phản hồi hài hước: "Bạn phát âm chưa được chính xác lắm. Bạn nói ngọng rồi, lêu lêu".
Theo Giáo sư Vũ Hà Văn – Giám đốc Khoa học Viện Nghiên cứu Dữ liệu lớn VinBigData, tiền thân của Công ty Cổ phần VinBigData, mặc dù nhiều mô hình ngôn ngữ khác đã hỗ trợ tiếng Việt nhưng "không có lý gì để nước ngoài tạo ra một công cụ tốt hơn mà chúng ta không thể cạnh tranh được". Người Việt đã có thể nắm quyền chủ động. Đồng thời, sở hữu một mô hình ngôn ngữ lớn của Việt Nam là cách để bảo tồn văn hóa, lịch sử dân tộc.
"Sản phẩm đến được người dùng cuối, lần đâu tiên chúng tôi dám đưa sản phẩm như thế này. Nói thẳng là liều. Nhưng đây là sự liều có tính toán, là việc cần phải làm. VinBigdata là công ty về dữ liệu lớn, có lợi thế về dữ liệu hơn nhiều công ty nước ngoài cũng như ở Việt Nam. Chúng tôi sở hữu đội ngũ rất giỏi và tâm huyết trong lĩnh vực này", Giáo sư Vũ Hà Văn nói.
Trước mắt, VinBigdata sẽ cho phép 1.000 người đầu tiên đăng ký trải nghiệm ViGPT trong vòng 15 ngày, sau đó sẽ tiến hành tinh chỉnh, cập nhật. Công ty thuộc hệ sinh thái Vingroup này cũng cho biết sẽ cung cấp phiên bản cộng đồng cho các tổ chức phi lợi nhuận mà không thu phí.
Trong khi đó, VinBigdata cung cấp một phiên bản khác dành cho cộng đồng khoa học.
Ngoài ra, còn có một phiên bản dành cho doanh nghiệp với mục tiêu đảm bảo an toàn dữ liệu, chi phí vận hành thấp, tối ưu hóa và "cá nhân hóa" yêu cầu nghiệp vụ của doanh nghiệp. Công nghệ học có giám sát giúp doanh nghiệp có câu trả lời chính xác và chắc chắn nhất, giảm thiểu khả năng tự suy diễn, bịa. Đồng thời, công nghệ học tăng cường giúp công cụ liên tục học từ phản hồi của người dùng.
"Chúng tôi xây dựng mô hình cho doanh nghiệp với 1,6 tỷ tham số, rất nhỏ. Khối lượng dữ liệu khoảng 600 GB dữ liệu tiếng Việt, liên quan đến lĩnh vực văn hóa lịch sử, bảo hiểm, ngân hàng, logistics, y tế, sức khỏe, bất động sản,… Chúng tôi so sánh với rất nhiều mô hình, trong đó là ChatGPT 4, ChatGPT 3.5 và nhiều mô hình khác phát triển cho tiếng Việt với 7 tỷ tham số, ViGPT bản 1,6 tỷ tham số chỉ thua bản của OpenAI ở khoảng cách rất nhỏ", ông Nguyễn Kim Anh – CEO VinBigdata giới thiệu.
Cách đây không lâu, VinAI - một công ty thuộc hệ sinh thái Vingroup cũng từng nhá hàng về dự án nghiên cứu mã nguồn mở về mô hình ngôn ngữ lớn cho riêng tiếng Việt, có tên PhởGPT. Đích thân Tiến sĩ Bùi Hải Hưng - Tổng Giám đốc VinAI cũng trình diễn công nghệ của PhởGPT, yêu cầu nền tảng này làm thơ, trả lời câu hỏi. Vị Tổng giám đốc cho biết thêm, vì là mã nguồn mở nên VinAI không giới hạn về tính thương mại, tất cả các bên đều có thể sử dụng PhởGPT để phát triển các ứng dụng cho riêng mình, kể cả phục vụ mục đích thương mại. Đây như là một platform mà VinAI cung cấp cho cộng đồng đang phát triển các ứng dụng liên quan đến công nghệ AI ở trong nước.
An ninh tiền tệ