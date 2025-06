Trong cuộc đua công nghệ trí tuệ nhân tạo tạo sinh (Gen AI), Google vừa giới thiệu phiên bản mới nhất của công cụ tạo video bằng AI mang tên Veo 3.

Google ra mắt Veo 3 tại sự kiện Google I/O 2025 vào cuối tháng 5

Đây là mô hình AI có khả năng tạo video từ câu lệnh văn bản (prompt), đồng thời tích hợp âm thanh sống động như lời thoại giữa các nhân vật hoặc tiếng động vật - một bước tiến vượt bậc so với các mô hình đối thủ hiện nay, vốn thường chỉ tạo ra video "câm" hoặc có nhạc nền đơn giản.

Tạo video có âm thanh từ một câu lệnh duy nhất

Theo CNBC, điểm nổi bật nhất của Veo 3 là khả năng tạo ra video có âm thanh hoàn chỉnh, bao gồm lời thoại, nhạc nền và hiệu ứng âm thanh, chỉ với một đoạn prompt đầu vào. Đây là tính năng mà các mô hình đối thủ như OpenAI Sora hay Adobe Firefly chưa thể làm được một cách đồng bộ và mượt mà.

Veo 3 có thể được sử dụng độc lập hoặc tích hợp trong ứng dụng làm phim AI mang tên Flow - sản phẩm tổng hợp 3 mô hình AI mạnh mẽ nhất hiện nay của Google, nơi người dùng có thể nhập vào lời nhắc, hình ảnh hoặc video để tạo ra một clip dài 8 giây. Flow đi kèm bộ công cụ dựng cảnh, cho phép người dùng ghép các đoạn phim, tùy chỉnh cảnh quay và tạo nên câu chuyện hoàn chỉnh, liền mạch.

Veo 3 có thể tạo ra video có âm thanh hoàn chỉnh chỉ với một câu lệnh (Nguồn: Việt Phú)

Veo 3 không hoạt động đơn lẻ mà nằm trong hệ sinh thái AI đa tầng của Google. Sản phẩm được thiết kế để phối hợp với các công cụ AI khác như Gemini - mô hình ngôn ngữ tiên tiến giúp hiểu và chuyển đổi văn bản thành kịch bản hình ảnh; Imagen 4 - tạo ảnh trực quan dùng làm dữ liệu tham chiếu để xây dựng cảnh quay; Flow - nền tảng tạo dựng video, hỗ trợ người dùng xây dựng câu chuyện có cấu trúc rõ ràng, liền mạch. Việc tích hợp này giúp Veo 3 tạo ra video không chỉ đẹp về mặt hình ảnh mà còn có chiều sâu nội dung và khả năng tương tác cao.

Hiện tại, người dùng có thể trải nghiệm Veo 3 qua hai gói dịch vụ là Google AI Ultra và Google AI Pro. Cụ thể, Google AI Ultra có mức phí sử dụng là 249,99 USD/tháng (khoảng 6,5 triệu đồng/tháng), ưu đãi 50% trong 3 tháng đầu tiên còn 124,99 USD (khoảng 3,25 triệu đồng). Người dùng được cấp 12.500 token, mỗi video dài 8 giây tiêu tốn khoảng 100 token. Trong khi đó, Google AI Pro hiện đã cung cấp dịch vụ tại 73 quốc gia với giá 20 USD/tháng, được dùng thử miễn phí trong tháng đầu. Người dùng AI Pro có thể truy cập phiên bản giới hạn của Veo 3 trong Flow và tạo 10 video thử nghiệm trực tiếp trên nền tảng Gemini. Việc cung cấp bản dùng thử là cơ hội để người dùng cân nhắc xem có nên đầu tư hàng trăm USD mỗi tháng để sử dụng Veo 3 lâu dài hay không.

Phản hồi tích cực từ người dùng toàn cầu

Ngay sau khi ra mắt, Veo 3 nhanh chóng trở thành "hiện tượng" trên các nền tảng mạng xã hội như X (Twitter), YouTube, Instagram và Reddit. Hàng loạt video demo được chia sẻ với phản ứng phấn khích, ngạc nhiên từ cộng đồng sáng tạo. Nhiều video thu hút hàng trăm nghìn đến hàng triệu lượt xem, cho thấy sức hút và tiềm năng thương mại lớn của công cụ này.

Dù ý tưởng AI tạo video không mới, tuy nhiên, theo TechRound, Veo 3 vẫn tạo dấu ấn khác biệt nhờ khả năng tạo video và âm thanh đồng thời từ một câu lệnh. Bên cạnh đó, công cụ còn có thể điều chỉnh góc máy, xây dựng bối cảnh và giữ nhân vật nhất quán qua nhiều cảnh quay, duy trì chuyển động nhân vật tự nhiên, tạo video chất lượng cao, có thể dùng được trong môi trường chuyên nghiệp. Điều này giúp Veo 3 vượt mặt nhiều đối thủ hiện nay.

Trong khi đó, Mashable đánh giá Veo 3 có khả năng dựng phim nhanh chóng, đồng bộ hội thoại với hình ảnh và đảm bảo logic nhân vật trong các đoạn video nối tiếp - điều mà các mô hình trước đây thường gặp khó khăn.

Lo ngại về nguy cơ lan truyền nội dung sai lệch, lừa đảo

Tuy sở hữu tiềm năng lớn, Veo 3 cũng đặt ra một số câu hỏi đáng lo ngại. Nhiều chuyên gia cho rằng, các công cụ AI như Veo 3 có khả năng tạo nên một cơn biến động lớn về nhân lực sáng tạo trong thời gian tới. Việc AI có thể dựng phim chuyên nghiệp khiến nhiều người lo ngại công việc của họ - từ biên kịch, dựng phim đến thiết kế đồ họa - có thể bị thay thế hoặc thu hẹp.

Bên cạnh đó, nguy cơ về lan truyền nội dung sai lệch, nội dung giả mạo bằng công nghệ Deepfake cũng được nhiều người lo ngại. Với khả năng tạo video sát thực, các công cụ AI như Veo 3 có thể bị lợi dụng để sản xuất nội dung giả mạo, ảnh hưởng đến uy tín cá nhân, tổ chức hoặc gây rối loạn thông tin xã hội.

Trước những lo ngại này, Google khẳng định rằng, tất cả nội dung do Veo 3 tạo ra đều được gắn nhãn bằng watermark SynthID - công nghệ từ DeepMind giúp truy vết và xác định nội dung do AI sản xuất. Ngoài ra, hãng cũng cung cấp tài liệu hướng dẫn sử dụng an toàn, nhấn mạnh mục tiêu là giúp người dùng tạo và nhận diện nội dung AI một cách có trách nhiệm.

Có thể thấy, Veo 3 không chỉ là công cụ giải trí, mà còn là bước đột phá cho lĩnh vực truyền thông, giáo dục, marketing, thậm chí cả điện ảnh. Với khả năng tạo video có âm thanh chân thực từ prompt văn bản, Veo 3 mở ra hướng tiếp cận hoàn toàn mới cho việc sản xuất nội dung. Tuy nhiên, bên cạnh cơ hội là những thách thức không nhỏ, đó là nguy cơ lạm dụng công nghệ, thay thế con người trong các ngành nghề sáng tạo và vấn đề đạo đức đi kèm. Do đó, vai trò của chính sách, tiêu chuẩn đạo đức và giáo dục kỹ năng số cho cộng đồng là cực kỳ quan trọng để AI như Veo 3 được phát triển và sử dụng một cách có trách nhiệm.