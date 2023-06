*CEO Nguyễn Vũ Anh là Việt kiều Pháp

Sự ra mắt của sản phẩm ChatGPT vào cuối năm 2022 đã tạo ra một cú nổ trong ngành công nghệ và từ đó đến nay vẫn thu hút được rất nhiều sự quan tâm, ngay cả với những người không biết gì nhiều về công nghệ thì cũng có thể sử dụng ChatGPT. Trước sự kiện này, anh có suy nghĩ gì?

Trong lịch sử sản phẩm công nghệ, ChatGPT trong vòng hai tháng đã đạt được mốc 100 triệu người dùng, nhanh nhất trong lịch sử. Để đạt được con số đó, Facebook mất hơn 4 năm.

Theo tôi, sự đột phá này đến từ việc, mô hình ngôn ngữ lớn (large language model - LLM), nếu so với các sản phẩm xử lý nội dung trước đây là cực kỳ xuất sắc.

Về bản chất, LLM đã tạo ra trải nghiệm người dùng và giao diện người dùng (UX/UI) mới. Như Microsoft đã chỉ ra, có 3 cuộc cách mạng về giao diện người dùng (user interface revolution). Cuộc cách mạng đầu tiên là khi người dùng tiếp cận với thông tin bằng bàn phím và chuột (PC), sau đó là màn hình cảm ứng (điện thoại thông minh) và giờ là chat.

Giao diện mới này có thể sẽ thay đổi hoàn toàn cách tương tác với nội dung của người dùng, điều đó là vô cùng quan trọng với các công ty công nghệ.

Sự đón nhận của người dùng Việt Nam với các sản phẩm AI Chat ra sao?

Thật ra ChatGPT vẫn chưa chính thức hoạt động tại Việt Nam (người dùng chưa thể tạo tài khoản và thanh toán ở Việt Nam), nên cũng có thể thấy là họ chưa tập trung vào Việt Nam. Nhưng chúng tôi theo dõi thấy, cũng có khá nhiều người sử dụng ChatGPT ở Việt Nam thông qua trình duyệt Cốc Cốc.

Chúng tôi thấy thị trường khá mới, và cũng nhiều cơ hội, nên nhảy vào, với hai định hướng: một là tập trung vào thị trường Việt Nam, hai là tích hợp với công cụ tìm kiếm, ví dụ ChatGPT nếu bạn hỏi thông tin sau năm 2021 thì sẽ không có câu trả lời.

Cốc Cốc sẽ có định hướng gì khác với các đối thủ khi triển khai sản phẩm của mình?

Nếu so sánh, sản phẩm của Cốc Cốc sẽ gần hơn với sản phẩm của Microsoft là Bing AI, vì họ cũng sử dụng mô hình ngôn ngữ lớn, tích hợp với công cụ tìm kiếm.

Tôi đoán rằng, chỉ là đoán thôi, chatbot và công cụ tìm kiếm có thể sẽ hợp nhất một ngày nào đó trong tương lai. Xuất phát điểm là tóm tắt thông tin của một trang, sau đó mở rộng ra tóm tắt thông tin của nhiều trang, và tiến tới việc chatbot có thể giải đáp tốt mong muốn của người dùng nhanh hơn nhiều so với các công cụ tìm kiếm.

Hiện nay, có thể thấy Bing AI đang hợp nhất hai tính năng này, trong khi đó, chúng tôi thì cố tình tách biệt hai tính năng đó ra thành Cốc Cốc AI Chat và Cốc Cốc AI Search.

Nếu bạn dùng thử chatbot AI của Bing sẽ thấy nó khá hạn chế trong việc sản xuất nội dung có tính sáng tạo cao, vì cơ chế luôn dựa trên công cụ tìm kiếm. Nhưng generative AI cũng hay ở chỗ sẽ có lúc nó go crazy (trở nên điên rồ). Một chatbot nếu chỉ dựa trên công cụ tìm kiếm thì sẽ yếu về sáng tạo.

Kỳ vọng của người dùng về công cụ tìm kiếm là phải chính xác, trong khi đó chat thì lại nên sáng tạo. Để tạo ra được một công cụ tối ưu cũng là việc rất khó.

Sự khác biệt khi triển khai sản phẩm mới này cho với sản phẩm trước đó là gì?

Sản phẩm trước đây chúng tôi triển khai là công cụ tìm kiếm, hay trình duyệt, thì không phải mới, nên chúng tôi đã có hình dung rõ ràng về người dùng và mô hình kinh doanh, để biết sẽ có thể cạnh tranh ra sao. Nhưng chatbot AI thì mới hoàn toàn và nhiều người dùng thực ra còn chưa biết làm thế nào để có thể tận dụng nó hiệu quả.

Vậy mô hình kinh doanh khả thi cho các sản phẩm chatbot AI dựa trên LLM, theo anh có thể là gì?

Nếu nói về mô hình kinh doanh thì ngay cả những người chơi lớn cũng chưa rõ ràng đâu, OpenAI mở ra ChatGPT Plus giá 20 USD/tháng cũng là thử nghiệm vậy thôi, vẫn lỗ nặng.

Vì chưa có mô hình kinh doanh rõ ràng, nên triển vọng doanh thu hiện nay không hề khả quan. Đầu tư cho lĩnh vực này, đối với một số ông lớn như Microsoft, mục tiêu còn được cho là để đánh bại mô hình kinh doanh của Google.

Như tôi đã nói, LLM tạo ra một giao diện người dùng mới. Giao diện mới này có thể sẽ thay thế các công cụ chính hiện nay của internet là trình duyệt và công cụ tìm kiếm, vì đây là hai công cụ cơ bản để truy cập nội dung.

ChatGPT có xuất sắc không? Rất xuất sắc. Có thể đạt được con số 100 triệu người dùng nhanh như vậy, vì nó tương tác với người dùng theo cách rất tự nhiên. Tiếng Việt thì có thể chưa "mượt" lắm nhưng tiếng Anh thì phải nói là rất ổn, rất dễ để ứng dụng, nên rủi ro bị thay thế của các công cụ tìm kiếm trong tương lai là khá dễ thấy.

Do đó, nhiều nhà phân tích cũng cho rằng Google chưa làm sản phẩm này cũng bởi vì nó có thể sẽ phá vỡ chính mô hình kinh doanh của họ, họ sẽ phải cân nhắc vì công cụ tìm kiếm đang là cỗ máy kiếm tiền của họ. Nếu không vì lý do đó thì có lẽ chính Google mới là người ra sản phẩm chat dựa trên LLM trước.

Với việc tiêu tốn nhiều nguồn lực như vậy, kịch bản mà dễ xảy ra, theo tôi là sẽ chỉ tồn tại vài công ty duy trì mô hình LLM trên thế giới, sau đó họ đi bán dịch vụ cơ bản là LLM. Còn việc sử dụng LLM tạo ra sản phẩm với mô hình kinh doanh của riêng mình thì rất nhiều công ty có thể sáng tạo.

Nếu như anh nói, chatbot AI có thể sẽ vô hiệu hoá mô hình kinh doanh của công cụ tìm kiếm, thì có khi nào Cốc Cốc cân nhắc là sẽ không tiếp tục phát triển AI chat?

Không, phải làm chứ. Nếu bạn nhìn từ phía nhà đầu tư thì cũng sẽ thấy AI đang rất hot (nóng). Nếu làm AI, tự nhiên sẽ có được sự quan tâm của họ. Cốc Cốc là nhà cung cấp dịch vụ B2C, mà sản phẩm AI có thể tương tác trực tiếp với người dùng cuối thì lại không nhiều lắm đâu.

Hướng đi hiện tại của Cốc Cốc là công cụ tìm kiếm nội dung, tương tác với nội dung, mà generative AI đang thay đổi cơ bản điều đó, đứng ngoài cuộc chơi là không hợp lý.

Còn nếu so với Google, Cốc Cốc không phải người chơi thống trị thị trường nên sẽ dễ hơn để sáng tạo cái mới, và sẵn sàng phá vỡ mô hình kinh doanh hiện có. Nên chắc chắn phải chơi thôi, và tìm hướng đi của mình.

Tinh thần đội ngũ Cốc Cốc ra sao khi phát triển một sản phẩm rất mới và nhiều thách thức như vậy?

Mấy ông kỹ sư thì cứ được làm cái mới là thích rồi. Họ thích thách thức mà (cười).

Chúng tôi đã quen với thách thức rồi. Cạnh tranh với Google, hay sự thay đổi của mô hình kinh doanh, thì cũng đều thách thức như nhau. Chúng tôi nhìn nhận xu hướng này như một cơ hội khác để cạnh tranh với Google.

Cách tiếp cận của Cốc Cốc sẽ là gì khi sản phẩm chưa có mô hình kinh doanh rõ ràng?

Cách tiếp cận của chúng tôi là cứ ra mắt sản phẩm trước. Mục tiêu đầu tiên là để học cách áp dụng công nghệ mới này. Quan trọng hơn, Cốc Cốc muốn tìm hiểu về người dùng. Khi người dùng dùng thử sản phẩm, Cốc Cốc sẽ biết họ dùng như thế nào, và sản phẩm mang lại giá trị cho họ theo cách nào, để tìm ra các usecase.

Một số usecase thật ra đã phổ biến ở các nước, ví dụ như trong lĩnh vực giáo dục, hay ngành sáng tạo nội dung, ngành phần mềm... Những ứng dụng đang sử dụng ChatGPT như Duolinguo (tích hợp ChatGPT vào nội dung học ngoại ngữ), Snapchat… đã tìm ra usecase của họ rồi. Ở điểm này, thế mạnh của Cốc Cốc là đã có sản phẩm trình duyệt và tập người dùng khá lớn để phân phối công cụ AI Chat.

Theo tôi, mô hình kinh doanh hiệu quả có thể vẫn sẽ là quảng cáo nhưng phải tìm ra cơ chế hợp lý, và cùng với đó là việc bán tài khoản (subscription).

Hiện nay, các tác động của ChatGPT vẫn còn gây tranh cãi khi có thể khiến nhiều việc làm trong xã hội bị thay thế, gây ra thất nghiệp. Nhiều nơi ủng hộ công cụ này, trong khi cũng có những nơi thì cấm. Khi phát triển một công cụ tương tự, Cốc Cốc nghĩ gì về điều này?

Quan trọng là khung pháp lý của chính phủ. Trung Quốc đi trước về vấn đề này vì họ rất thận trọng, tất nhiên đổi lại sẽ hạn chế đổi mới sáng tạo ở mức độ nhất định.

Những rủi ro như sử dụng AI để tạo tin giả và thao túng thì rất nguy hiểm. Nhưng thật ra chưa cần AI thì mạng xã hội cũng đã có rủi ro đó rồi. Công nghệ thì không có cách nào để đi ngược chiều, mà sẽ phát triển thôi. Quan trọng là các chính phủ cần có khung pháp lý để bảo vệ người dùng.

Với mục tiêu là tạo ra AI Chat mạnh về tiếng Việt, định hướng của Cốc Cốc sẽ là fine tuned hay tự chạy LLM của mình?

Một mình Cốc Cốc thì chắc chắn là không đủ khả năng để phát triển LLM như OpenAI, câu chuyện hiện tại là tìm ra một usecase để fine tuned và tự vận hành nó.

"Ask me anything" (Hỏi tôi bất cứ điều gì) như Open AI đang làm, thực ra mới chỉ là khởi đầu, vì chưa thực sự mang lại giá trị hàng ngày cho số đông người dùng. Việc cần làm là phải khám phá điều đó và mang nó đến cho người dùng.

Còn trong tương lại, thật ra chúng tôi cũng có một mong muốn, tuy nhiên chưa thể khẳng định tương lai của nó sẽ ra sao.

Rõ ràng, có thể thấy tất cả các LLM đều gặp vấn đề là tiếng Việt chưa tốt. Ví dụ như trong dữ liệu được huấn luyện của OpenAI, thì chỉ có 1% là dữ liệu tiếng Việt thôi, còn lại chủ yếu là tiếng Anh và các tiếng khác. Tiếng Việt sẽ là "low resource language", tức là không có nhiều tài nguyên thông tin.

Thật ra ý tưởng này cũng có hạn chế ở việc, LLM của OpenAI xuất sắc vốn bởi vì được huấn luyện bởi rất nhiều ngôn ngữ. Nếu chỉ huấn luyện bằng tiếng Anh thì không thể xuất sắc được như vậy.

Chúng tôi đang thảo luận với một số đối tác của Việt Nam, đang làm AI, để xem có thể có cơ hội xây dựng một LLM với dữ liệu được huấn luyện bằng tiếng Anh và tiếng Việt, trong đó tỷ lệ sử dụng tiếng Việt cao hơn các LLM hiện có hay không hay không.

Đường thì còn dài, và tôi cũng không kỳ vọng là chất lượng nội dung có thể bằng, vì chi phí để chạy LLM như OpenAI là một con số điên rồ luôn.

Chúng tôi biết việc này một mình Cốc Cốc khó có khả năng làm, nên sẽ cần phối hợp với các đối tác. Hiện tại đang có một dự án opensource tại Mỹ, được phát triển bởi các bạn Việt kiều, phía Cốc Cốc đang cùng tham gia để chuẩn bị dữ liệu. Dữ liệu tiếng Việt thì đúng là hạn chế, nhưng chúng tôi cũng có điểm mạnh là nền tảng công cụ tìm kiếm. Chúng tôi sẽ chia nhỏ usecase để làm, ví dụ như trong từng chuyên ngành.

Với LLM thì chúng tôi nhìn vào hai vấn đề cốt lõi: một là chất lượng, hai là chi phí. Chất lượng thì chắc chắn phụ thuộc vào lượng dữ liệu được dùng để huấn luyện. Nếu đầu vào có nhiều dữ liệu bằng tiếng Việt thì kỳ vọng là các nội dung tiếng Việt sẽ tốt hơn. Mặt khác, việc chỉ huấn luyện hai ngôn ngữ sẽ giúp chi phí thấp hơn. Nếu ra được một mô hình xử lý tiếng Việt tốt hơn, có ích cho người Việt hơn, thì chắc chắn là nên làm.

Cảm ơn chia sẻ của anh!