ELSA, tên viết tắt của English Language Speech Assistant (Trợ lý phát âm tiếng Anh) là sản phẩm của người Việt đầu tiên giành giải nhất tại Triển lãm công nghệ giáo dục SXSWedu (Mỹ) năm 2016. Xuất phát từ chính nhu cầu của cá nhân, đến nay, Văn Đinh Hồng Vũ, Founder của ELSA nói rằng mơ ước của cô là muốn người dân quê nhà có thể học tốt hơn tiếng Anh để nắm bắt những cơ hội mới trong đời.
Ý tưởng xây dựng ELSA của chị đến từ đâu?
ELSA là ý tưởng mình ấp ủ từ rất lâu rồi. Động lực ban đầu xuất phát từ chính cuộc sống cá nhân trên đất Mỹ. Từ vựng, ngữ pháp, đọc viết tiếng Anh của mình khá tốt nhưng gặp khó khi đi tìm việc vì giao tiếp chưa tốt. Khi mình hỏi bạn bè, thầy cô thì mọi người bảo không phải là người ta không tin tưởng, nhưng do họ mất quá nhiều thời gian, công sức để hiểu ý mình nói trong khi họ cũng ngại không hỏi lại vì sợ mình xấu hổ. Cuối cùng thành không thoải mái nói chuyện hay cộng tác.
Từ đó, mình quyết tâm phải cải thiện bằng được tiếng Anh. Cũng may mắn mình được một người bạn thân là người Mỹ giúp đỡ, chỉnh sửa liên tục về phát âm trong 6 tháng nên khả năng nói dần tốt lên. Đến khi đi làm, mình cứ trăn trở là làm sao để bạn bè học tiếng Anh trên thế giới có thể tìm được một "gia sư" tận tâm như chị đã có.
Mình cũng thấy là công nghệ nhận diện giọng nói đã được ứng dụng ở nhiều nơi, đặc biệt là tại Silicon Valley trong rất nhiều lĩnh vực khác nhau nhưng chưa có ai sử dụng vào việc dạy ngoại ngữ. Nếu làm được chuyện này thì sẽ tạo ra sức ảnh hưởng rất lớn cho cộng đồng người học tiếng Anh trên thế giới. Đó chính là lý do mình bắt tay vào nghiên cứu công nghệ này với ước muốn tạo ra một người bạn tận tâm, chuẩn xác như bạn mình.
Không phải dân công nghệ nhưng khởi nghiệp trong lĩnh vực công nghệ, còn là lĩnh vực AI, làm thế nào để chị thuyết phục những chuyên gia trong ngành về với mình?
Thực tế thì nhân tài trong lĩnh vực AI và nhận diện giọng nói rất hiếm, chỉ có một số "người khổng lồ công nghệ" như Microsoft, Google, hay Apple mới đủ nguồn lực để chiêu mộ. Tuy nhiên, có thể nói rằng thứ mà khiến mình kêu gọi được đội ngũ, sau này có thêm các nhà đầu tư chính là những giá trị có khả năng mang lại cho cộng đồng và thay đổi toàn cầu.
Mình cứ nhớ mãi những ngày đầu tiên khi ELSA bắt đầu, mình tìm đến một người thầy, vốn được nhiều chuyên gia trong lĩnh vực nhận diện giọng nói gọi là "huyền thoại", để mời thầy làm tư vấn kỹ thuật.
Lúc đó, mình cũng chưa biết nhiều nên không biết thầy nổi tiếng như thế đâu, chỉ thấy là thầy có nhiều kinh nghiệm, mình học hỏi, xin lời khuyên được thì muốn mời thôi. Sau một thời gian thuyết phục, thầy đã đồng ý. Đó cũng là một trong những yếu tố quyết định làm nên thành công của ứng dụng đến bây giờ. Nhiều người khi biết tin thì ngạc nhiên lắm vì thầy rất bận, thầy cũng đã từ chối nhiều lời mời của các tập đoàn lớn nhất thế giới với những khoản thù lao cực lớn.
Sau này làm với thầy nhiều rồi, mình mới dám hỏi lý do thầy nhận lời. Thầy chỉ bảo là: "Vì thầy thấy em rất tuyệt vọng và cần được giúp đỡ".
Vậy ứng dụng được xây dựng như thế nào?
Ban đầu tụi mình dùng API của Google để phát triển ELSA. Nhưng điểm mấu chốt là công nghệ nhận diện giọng nói của Google có độ chấp nhận sai số rất lớn. Nghĩa là mình có nói sai thì máy vẫn hiểu và thực hiện mệnh lệnh. Điều này hỗ trợ rất lớn cho cuộc sống hiện đại, tuy nhiên, nó là trở ngại của việc học ngôn ngữ vì người học không biết đúng sai thế nào.
Do đó, cái mà tụi mình có thể sử dụng lúc đó và việc Google có thể nhận diện được các từ mà người dùng nói "không giống" với tiếng Anh bản xứ rồi từ đó xây dựng thuật toán mới hoàn toàn. Team cũng thu thập rất nhiều dữ liệu để tạo ra khả năng độc quyền nhận diện lỗi sai và hướng dẫn sửa từng âm tiết.
Sau bao lâu thì chị đưa ra được phiên bản đầu tiên?
Sau khi thành lập năm 2015, tụi mình không tung ra sản phẩm ngay mà dành thời gian để nghiên cứu, phát triển công nghệ. 1 năm sau thì ra mắt phiên bản đầu tiên.
Trong vòng 24 tiếng đầu tiên khi đưa ELSA lên App Store thì có hơn 30.000 người tải về. Toàn bộ mạng sập hết vì không chuẩn bị cho lượng người đăng ký đông như vậy. Cả nhóm sau đó ngày đêm sửa sản phẩm để mọi người được sử dụng ngay lập tức.
ELSA cũng liên tiếp lọt vào top các ứng dụng AI hàng đầu, đứng chung với các sản phẩm của Microsoft, Apple, Amazon. Mọi thứ thực sự vượt ngoài mong đợi!
Vậy điểm khác biệt của công nghệ nhận diện giọng nói của ELSA so với những công nghệ tương tự đang được các tập đoàn lớn phát triển là gì?
Tụi mình đã xây dựng công nghệ nhận diện giọng nói có khả năng phát hiện lỗi sai trong phát âm rất riêng biệt. Như vậy, khi người học phát âm, app có thể chỉ ra cho họ chuẩn xác những điểm sai đến từng âm tiết và hướng dẫn sửa chi tiết. Thuật toán này là độc nhất và được đội ngũ ELSA xây dựng từ đầu, vì như mìh đã nói, các công nghệ như của Google được xây dựng với độ chấp nhận lỗi sai trong phát âm rất lớn.
ELSA cũng thu thập được dữ liệu khổng lồ từ người dùng nói tiếng Anh với nhiều ngữ điệu khác nhau.
Điều này giúp công nghệ của tụi mình có được khả năng đặc biệt để nhận diện lỗi phát âm của người dùng chuẩn xác hơn rất nhiều so với công nghệ nhận diện giọng nói truyền thống của những công ty khổng lồ trong ngành như Google Assistant, Alexa hay Siri.
Bước vào một ngành mà ban đầu chưa biết gì, đến giờ, khi nhìn lại sản phẩm của mình một cách tổng thể, chị cảm thấy như thế nào?
Khi mình nói là sẽ xây dựng công nghệ nhận diện giọng nói giúp cho việc học phát âm tiếng Anh, nhiều người không tin. Họ bảo chỉ có giáo viên mới làm được.
Lúc đó, tụi mình cũng không dám nói sẽ làm tốt hơn giáo viên hay không. Nhưng sau 3 năm, thì công nghệ AI của nhóm rất "quyền lực". Nó làm được những việc mà ngay cả chuyên viên ngữ âm cũng không làm được. Ví dụ khi hướng dẫn một người phát âm, trong 1 giờ đầu tiên, các chuyên viên hay giáo viên ngoại ngữ có thể nhận diện rất chính xác vì độ tập trung còn cao. Nhưng nếu việc đó kéo dài trong nhiều giờ đồng hồ, họ sẽ mệt, chán, nghe sẽ chỉ qua loa thôi. Còn máy móc thì khác. Máy không biết mệt.
Nhưng ở thời điểm này, ELSA đã làm được bằng, thậm chí tốt hơn giáo viên bản ngữ với chi phí hoàn toàn có thể với mọi người.
ELSA đã nhận được vốn 7 triệu USD từ Google. Theo chị, điều gì đã khiến Google chọn rót vốn vào ELSA?
Mình sẽ không bao giờ biết được rõ ràng tại sao họ chọn mình. Nhưng đương nhiên, mình đoán được một số yếu tố khiến cho Grandient Venture, quỹ mạo hiểm chuyên đầu tư vào AI của Google, muốn đầu tư vào ELSA.
Thứ nhất, sứ mệnh của Grandient Venture là tập trung chủ yếu vào các startup giai đoạn đầu (early stage) với tiềm lực AI mạnh mẽ.
ELSA đã đưa được công nghệ nhận diện giọng nói để giúp mọi người học tiếng Anh theo phương pháp rất mới mà chưa ai từng làm. Hồi trước công nghệ này chủ yếu sử dụng cho đời sống hàng ngày, như vào nhà hô bật, tắt đèn, chứ chưa được sử dụng để thay đổi cuộc sống con người một cách triệt để. Mình nghĩ Google thích ý tưởng này.
Thứ hai mình nghĩ Google nhìn thấy tiềm năng thị trường lớn và kỳ vọng ELSA sẽ trở thành một kỳ lân trong tương lai. Trên thế giới, có hơn 1,5 tỷ người đang có nhu cầu học tiếng Anh, đó quả thực là một thị trường khổng lồ.
Cuối cùng, mình tin rằng Gradient Ventures thực sự hứng thú với ELSA vì họ rất thích đội ngũ của tụi chị, và họ rất tin tưởng vào khả năng vận hành cũng như phát triển ELSA ở quy mô toàn cầu.
Chị có cảm thấy bất ngờ khi nhận được khoản đầu tư từ Google?
Tụi mình tin là sẽ có nhà đầu tư tốt chọn mình vì sản phẩm đã khá trưởng thành, có những kết quả nhất định. Giai đoạn gọi vốn Google thì đấy không phải vòng đầu tiên, lúc này ELSA đã có lượng user trên toàn thế giới, phản hồi rất tốt. Nên không phải mình không có gì để mà bất ngờ.
Đương nhiên việc kỳ vọng có nhà đầu tư tốt tìm đến với mình và việc thực sự nhận được vốn thì là niềm vui lớn rồi. Bất ngờ thì mình nghĩ không phải, nhưng vui thì có.
ELSA là sản phẩm được sinh ra ở Mỹ. Điều đó có thuận lợi gì so với một sản phẩm công nghệ được sinh ra ở Việt Nam?
Ở Mỹ thì cũng có một số thuận lợi. Khi tụi mình xây dựng sản phẩm ngay ở Sillicon Valley, cái nôi của những đột phá, sáng tạo thì nó giúp cho mọi người trong team tìm tòi những thứ mới lạ thay vì chỉ coi người ta làm cái gì thì mình bắt chước làm. Mình cũng dễ tìm được những người có chung suy nghĩ kiểu vậy.
Mình là người Việt Nam, từ ngày đầu xây dựng ELSA, mình đã nghĩ dù là sản phẩm toàn cầu nhưng bước đầu, chị muốn giúp người Việt học tiếng Anh tốt nhất. Mình hiểu rõ những khó khăn của người Việt khi học tiếng Anh như thế nào. Vậy nếu có giúp được họ học tốt hơn, từ đó có thêm cơ hội mới nhờ tiếng Anh, tại sao lại không muốn giúp cho cộng đồng mình trước.
Sản phẩm trọng tâm là cho người Việt ngay lúc đầu, nhưng mình dùng cách của người Mỹ để làm.
Mình nghĩ không cần phải ở Việt Nam mới làm ra sản phẩm phục vụ người Việt. Ở đâu không quan trọng, quan trọng là khi xây dựng sản phẩm mình muốn làm cho ai, mình có hiểu họ hay không.
Vậy số lượng học viên của ELSA ở Việt Nam hiện đang là bao nhiêu?
Tính đến hiện tại thì ELSA có 2 triệu người dùng tại Việt Nam trên tổng số 5 triệu người dùng toàn cầu. Việt Nam vẫn là thị trường phát triển nhanh nhất. Trong vòng 12 tháng vừa rồi ở Việt Nam, công ty tăng trưởng gần 700%, năm 2020 dự kiến vẫn tiếp tục tăng trưởng nhanh.
Chị có nghĩ rằng thị trường học tiếng Anh rồi cũng sẽ đến ngưỡng bão hoà?
Cái đó tuỳ thuộc mình định nghĩa như thế nào là thị trường bão hoà. Đối với mình, nhu cầu nói tiếng Anh và nói một cách tự tin thì sẽ không bao giờ mất và giảm xuống, nhất là trong nhiều năm sắp tới.
Ngay cả khi mọi người bảo là tại sao phải nói tiếng Anh trong khi các công cụ dịch thuật trở nên tốt hơn, ví dụ thông qua Google. Nhưng thực ra không gì tốt hơn nếu nói chuyện trực tiếp với người ta cả. Nhu cầu học nói tiếng Anh sẽ không giảm xuống.
Thị trường bão hoà nằm ở chỗ sẽ có nhiều công ty đưa ra các giải pháp mới. Trách nhiệm của mình sẽ là làm thế nào để luôn đi trước, đón đầu, đưa ra những giải pháp đột phá cho thị trường.
Mình nghĩ còn rất nhiều thứ để làm. Ví dụ từ giờ đến cuối năm, tụi mình sẽ đưa ra một số tính năng mới như không cần mở ứng dụng ELSA để đọc từ mới trên mạng hay luyện phỏng vấn bằng tiếng Anh. AI cũng sẽ đưa ra những phản hồi cho người dùng, giải thích được là tại sao họ được nhận hoặc không cho vòng phỏng vấn đó.
Tại sao chị lại muốn khởi nghiệp với giáo dục, lĩnh vực này có ý nghĩa như thế nào với chị?
Với mình, giáo dục là lĩnh vực có ảnh hưởng đến nhiều thế hệ. Giáo dục thì có nhiều mảng. Mình thì đam mê ngoại ngữ từ bé. Mình cũng nhận được nhiều cơ hội mà người khác không có đến từ việc nói ngoại ngữ tốt hơn.
Tại sao ai cũng học tiếng Anh nhưng chỉ một số người dùng được nó làm bàn đạp cho một cơ hội mới, còn nhiều người đó mãi mãi là nỗi sợ. Mình muốn thay đổi điều đó.
Mình cũng hi vọng là việc học tiếng Anh là bình đẳng cho mọi người, dù các bạn ở vùng sâu, vùng xa, điều kiện thế này kia. Tiếng Anh với mình là một thứ giúp tạo ra sự công bằng trong việc tiếp cận cơ hội nhanh nhất có thể. Chúng ta không thể thay đổi được điều kiện sống, hoàn cảnh gia đình nhưng nếu có công cụ giao tiếp, chúng ta sẽ tự mở được cánh cửa mới cho mình. Đó chính là ý nghĩa lớn nhất mà mình hướng đến khi chị làm ELSA.
Từ bỏ công việc ở tập đoàn lớn, danh giá ở Mỹ để khởi nghiệp, cảm nhận của chị như thế nào khi từ làm thuê sang làm chủ?
Thứ cảm nhận rõ nhất là áp lực. Nếu ở công ty lớn, áp lực là làm vừa lòng sếp, được thăng chức, làm đúng deadline mà người khác đặt ra, kỳ vọng cũng đến từ người khác.
Còn khi mở công ty riêng, tất cả những thứ đó đều đến từ chính bản thân. Thời gian đầu, nguồn lực nhân sự, tài chính, thời gian xung quanh mình rất hạn chế. Ở công ty lớn, mình giỏi hay dở thì công ty cũng không chết được, nhưng với startup của mình, tuỳ vào nỗ lực của mình mà công ty có thể nay sống, mai chết. Nghĩa là sự tồn tại của công ty rất mong manh. Áp lực vì thế mà rất lớn.
Khi công ty lớn hơn một chút, có nhiều nhân viên, thì áp lực lại là làm thế nào để đem lại công việc tốt nhất cho nhân viên của mình. Họ đã bỏ bao công việc tốt khác để theo mình thì làm thế nào đáp ứng được kỳ vọng của họ.
Cuối cùng là áp lực không biết công ty mình ngày mai như thế nào. Làm công ty lớn thì đa phần công việc mai nó vẫn ở đó, cùng lắm thì sếp la thôi.
Như chị nói làm khởi nghiệp thì sẽ khó biết công ty mình ngày mai thế nào. Vậy, thường thì những kế hoạch vận hành, chiến lược được chị lên như thế nào?
Startup công nghệ thì thường sẽ không làm kế hoạch dài hạn kiểu 3 hay 5 năm đâu. Mọi người hay giỡn là 5 năm nữa ai biết công ty mình ở đâu. Một startup công nghệ có thể tăng trưởng rất nhanh đến độ founder cũng không hình dung ra được, nhưng có thể 3 tháng sau thì nó chết. Không biết được. Do vậy, kế hoạch sẽ được xây dựng rất ngắn hạn. Có thể tháng này khó khăn là vậy, tháng sau lại là một vấn đề rất mới.
Nhưng điều đó không có nghĩa là tụi mình không có một tầm nhìn dài hạn. Nếu không có một đích đến, sứ mệnh cụ thể thì trong điều kiện phải liên tục thay đổi như vậy sẽ dễ lạc đường. Nói chung kế hoạch thì ngắn hạn nhưng tầm nhìn phải dài hạn.
Cụ thể thì kế hoạch thường kéo dài trong bao lâu?
Thường thì kế hoạch hoạt động là cho 3 tháng.
Quan điểm của chị về công nghệ là gì? Với góc nhìn của chị, công nghệ sẽ tạo ra sự thay đổi như thế nào?
Ở góc của người làm công nghệ, mình không nghĩ là người sử dụng quan tâm đến công nghệ là cao, thấp, tiên tiến đến đâu. Thứ họ nhìn là tính năng giải quyết được vấn đề hàng ngày, ai giúp họ làm việc đó. Do vậy, công nghệ đôi khi không phải là câu trả lời.
Nhiều người cũng hỏi là công nghệ có khiến cho một số nhóm người bị tụt lại phía sau, trở thành nhóm loser – thất bại hay không. Thực sự thì con người tiến hoá rất nhanh. Ai muốn tồn tại thì phải thay đổi nhanh hơn những gì thế giới đang thay đổi. Nếu mình vận động như thế thì mình sẽ không dừng lại mà sẽ dựa vào công nghệ để đi xa hơn. Công nghệ cuối cùng là do mình tạo ra mà.
Nhưng nếu không đi trước, đón đầu thì nguy cơ bị lùi lại rất cao. Và khi bị lùi lại một bước, mình sẽ bị hẫng. Mình lùi một bước thế giới lại đi trước 2 – 3 bước. Đến khi thế giới đi được 5 bước thì mình đã lùi 50 bước rồi, có khả năng nản mà bỏ cuộc luôn. Cho nên phải làm thế nào để luôn nhanh nhạy, chịu thay đổi, thì mới không bị tụt lại phía sau.
Cảm ơn chị!
Trí Thức Trẻ