Cách trí tuệ nhân tạo có thể 'tạo nên bạn từ hư không' chỉ với 7 bức hình
Có thể tìm thấy bao nhiêu bức hình của bạn ở trên mạng Internet: 10, 50, hay hàng trăm bức ảnh? Bạn đã bao giờ lo lắng về sự hiện diện công khai của chúng chưa?
- 24-12-2022Đã có tài khoản định danh điện tử nhưng chưa tích hợp giấy tờ cá nhân sẽ không nhận được những tiện ích này
- 22-12-2022Vì sao VinFuture trao giải 3 triệu USD cho phát minh từ thế kỷ trước?
- 22-12-2022Một trong những công ty khai thác Bitcoin lớn nhất nước Mỹ nộp đơn xin phá sản nhưng vẫn tiếp tục 'đào coin'
Dưới đây là hình ảnh về một giáo viên tiểu học, và anh ta đang để ngực trần khi chụp ảnh tự sướng trong lớp học. Nếu đây là ảnh thật thì thầy giáo tiểu học tên John này nhiều khả năng sẽ bị nhà trường đuổi học ngay lập tức.
Nhưng may mắn thay, John chỉ là một nhân vật hư cấu do nhóm công nghệ của trang web ArsTechnica tạo ra cho thí nghiệm về hình ảnh xã hội.
Nếu người trong hình là thật, một scandal giáo dục sẽ bùng lên ngay lập tức.
Họ đã sử dụng trí tuệ nhân tạo (AI) để tạo một bộ 7 bức ảnh mô phỏng trên mạng xã hội về một người hư cấu gọi là "John". Nhân vật được lấy bối cảnh là một giáo viên tiểu học bình thường, giống như hầu hết mọi người trong cuộc sống của chúng ta. Trong 12 năm qua, John thích đăng hồ sơ công việc, cuộc sống gia đình, hình ảnh kỳ nghỉ lên mạng xã hội.
Sau đó, sử dụng công cụ Stable Diffusion và Dream Booth do Google phát hành, nhóm thử nghiệm đã tạo ra các phiên bản khác nhau trên mạng xã hội, khiến việc xác định danh tính của John trở nên khó khăn.
Trong những bức ảnh này, John đã thay đổi từ một giáo viên tiếng Anh bình thường, thích chia sẻ cuộc sống hàng ngày của mình, thành một "phần tử nguy hiểm" thích cởi trần chụp ảnh tự sướng trong lớp và nơi công cộng, hay một người thích hóa trang thành chú hề khi lên bar, hoặc một thanh niên từng vào tù ra tội... Nhìn qua ảnh, chẳng có hình nào là John, nhưng hình nào cũng có khuôn mặt của John.
Trên thực tế, ngày nay, với sự trợ giúp của nhiều công cụ hỗ trợ xây dựng hình ảnh bằng AI hoàn toàn mở và miễn phí, trải nghiệm của John có thể dễ dàng xảy ra với mỗi người bình thường chúng ta.
Khi người ảo thành người thật
ArsTechnica cho biết khi lên kế hoạch thực hiện thí nghiệm này, họ đã tuyển dụng một số tình nguyện viên sẵn sàng chia sẻ ảnh trên mạng xã hội của họ để đào tạo AI. Nhưng vì những bức ảnh được tạo ra quá thật nên khả năng gây thiệt hại về danh tiếng cho ứng viên là quá lớn, vì vậy họ cuối cùng đã từ bỏ việc sử dụng ảnh của người thật mà chọn sử dụng AI để tạo nhân vật John trước.
Kết quả của thí nghiệm khiến họ cảm thấy rằng trong môi trường công nghệ hiện nay, mỗi con người bình thường trong chúng ta đều đứng trước một mối nguy cơ tiềm tàng.
7 bức hình ban đầu để tạo ra John giả mạo (tất nhiên chúng cũng không có thật)
Toàn bộ quá trình thử nghiệm thực sự rất đơn giản. Bạn lấy 7 bức ảnh có hình ảnh khuôn mặt cá nhân từ mạng xã hội, sau đó đưa vào công cụ mã nguồn mở Stable Diffusion và Dream Booth trên Internet. Tiếp đó, bạn có thể nhập một câu mô tả, từ đó tạo ra nhiều loại hình ảnh của người đó trong các phong cách khác nhau và trong các tình huống khác nhau.
Ví dụ, cư dân mạng từng sử dụng những bức ảnh công khai của tỷ phú Elon Musk trên Internet như một tập dữ liệu để đào tạo AI và sử dụng chúng để tạo ra những bức ảnh có nhiều phong cách hài hước khác nhau.
Một số người cũng đã thử với những bức ảnh công khai của Jimmy Wales, người đồng sáng lập Wikipedia, biến doanh nhân khéo léo này thành một vận động viên thể hình cường tráng.
Các Elon ảo được tạo ra từ một vài bức hình Elon Musk thật.
Để hiểu rõ hơn vấn đề, trước tiên hãy cùng đánh giá sơ qua về chức năng của Stable Diffusion và Dream Booth.
Stable Diffusion là một mạng lưới trí thông minh nhân tạo có thể tạo ra hình ảnh từ ngôn ngữ văn bản. Chỉ mất vài giây, nó sẽ cho ra kết quả hình ảnh có độ phân giải và độ nét cao hơn so với các công nghệ cùng loại, đồng thời hình ảnh cũng mang tính“chân thực” và “nghệ thuật” hơn.
Ngoài ra, một ưu điểm quan trọng khác của Stable Diffusion là nó hoàn toàn miễn phí và có mã nguồn mở, tức là tất cả các mã lập trình đều được công khai trên nền tảng GitHub và bất kỳ ai cũng có thể sao chép và sử dụng chúng. Chính hai đặc điểm “chân thực” và “mã nguồn mở” đã khiến nó trở nên vượt trội hơn so với các đối thủ như như DALL·E và Imagen.
Còn Dream Booth là mô hình khuếch tán hình ảnh từ văn bản được “cá nhân hóa", tức là nó có thể thích ứng với các nhu cầu tạo ra hình ảnh cụ thể của người dùng. Đây là sản phẩm của đội ngũ phát triển từ Google AI Labs. Tính năng của nó là chỉ cần một vài tấm hình (thường là 3~5) của đối tượng được chỉ định và tên lớp tương ứng (chẳng hạn như người, chó, mèo…) được sử dụng làm đầu vào, đối tượng được chỉ định có thể xuất hiện trong hình ảnh được tạo ra theo mong muốn của người dùng thông qua các mô tả văn bản.
Ví dụ, nếu bạn nhập hình ảnh ô tô, bạn có thể ra lệnh để thay đổi màu sắc của nó một cách dễ dàng. Bạn nhập ảnh của một chú chó và rồi bạn có thể biến nó thành gấu, gấu trúc, sư tử… mà vẫn giữ nguyên các đặc điểm trên khuôn mặt. Hoặc bạn cũng có thể mặc cho nó những bộ quần áo khác nhau và xuất hiện trong những cảnh khác nhau.
Ảnh giả mạo do AI tạo ra về người sáng lập Wikipedia.
Ban đầu, Stable Diffusion tập trung vào việc sử dụng văn bản để tạo ra hình ảnh sáng tạo, trong khi Dream Booth tập trung vào việc "cải tạo" các hình ảnh có điều kiện, và không có sự giao thoa trực tiếp giữa hai công cụ này. Tuy nhiên, trí tưởng tượng và hành động của đại bộ phận cư dân mạng quá mạnh mẽ. Một số người đã tìm tòi kết hợp hai sản phẩm mã nguồn mở này với nhau và nhanh chóng nghĩ ra một công cụ mới có thể tận dụng ưu điểm của cả hai.
Trong công cụ mới này, bạn có thể sử dụng chức năng của Dream Booth để sử dụng một vài hình ảnh bất kỳ làm hình ảnh huấn luyện. Sau khi tạo ra mục tiêu, kết hợp với chức năng chuyển đổi mạnh mẽ của Stable Diffusion, bạn có thể làm cho mục tiêu được chỉ định này được mô tả theo bất kỳ cách nào mà bạn muốn.
Chiếc hộp Pandora đã mở
Sau khi cách dùng mới này xuất hiện, cộng đồng người dùng như khám phá ra một thế giới mới, bắt đầu thử sửa chữa ảnh của chính họ.
Có người biến mình thành cao bồi miền Tây, có người bước vào tranh sơn dầu thời trung cổ, có người trở thành kẻ săn thú, người ngoài hành tinh… Đồng thời, cũng có nhiều video hướng dẫn tỉ mỉ để người bình thường không am hiểu công nghệ cũng có thể mày mò với công cụ mới này.
Tuy nhiên, trong khi mọi người đang vui vẻ đăng ảnh của mình, khoe rằng công nghệ này thú vị và hay ho, thì nhiều người bắt đầu chú ý đến những rủi ro tiềm ẩn rất lớn đằng sau nó.
Bạn có thể thay đổi mọi thứ chỉ với bài bước nhập dữ liệu đơn giản.
So với công nghệ "deepfake" đã được thảo luận rất nhiều trước đây, công cụ mới cho phép việc giả mạo ai đó phát triển trực tiếp từ "thay đổi khuôn mặt" sang "tạo ra thứ gì đó từ hư không". Ngoài ra, ngưỡng cửa của công nghệ làm giả giờ đây cũng trở nên thấp hơn, khi chỉ theo dõi một video Youtube trong 10 phút là một người mới không có kiến thức về kỹ thuật cũng có thể dễ dàng thành thạo.
Theo thống kê, hiện nay trên thế giới có hơn 4 tỷ người sử dụng mạng xã hội. Nếu bạn đã đăng tải công khai ảnh của mình lên các nền tảng này, một khi ai đó có động cơ xấu sẽ rất dễ lợi dụng những bức ảnh này để giả mạo và lạm dụng chúng. Kết quả cuối cùng có thể là một bức ảnh bạo lực, một bức ảnh khiếm nhã hoặc một bức ảnh xúc phạm. Chúng cũng có thể dễ dàng được sử dụng trong nhiều bối cảnh tệ hơn, khi việc tống tiền, bắt nạt, hay đưa ra tin đồn nói xấu nhau.
Hiện tại, một số người kỹ tính vẫn có thể đánh giá từ những hình ảnh hiện tại để nhận ra sản phẩm do Stable Diffusion tạo ra. Nhưng vấn đề là, với việc công nghệ này đang phát triển nhanh như vũ bão, chúng ta có thể sẽ sớm không thể phân biệt được sự khác biệt giữa ảnh được tạo ra và ảnh thật bằng mắt thường.
Cuộc sống của John "ảo" sẽ ra sao nếu mọi người biết nam giáo viên tiểu học này thích tham gia các hoạt động bán quân sự mỗi khi rảnh rỗi.
Và một bức ảnh giả mạo cũng có thể gây ra tác hại đáng ngạc nhiên. Ví dụ, nếu thực sự có một giáo viên tiểu học tên John như ở đầu bài viết, khi ai đó nhìn thấy hình anh ta cởi trần trong lớp học hoặc những bức ảnh khiếm nhã khác. Thì dù đúng hay sai, chúng cũng dễ dàng tạo nên sự nghi ngờ hoặc tin đồn, có thể hủy hoại danh tiếng, công danh và sự nghiệp của John.
Nếu từng xem bộ phim “The Hunt” (2012) của Đan Mạch, bạn sẽ hiểu điều này có thể tác hại đến mức nào. Cho dù lời tố cáo về hành vi khiếm nhã của cô bé học sinh dành cho nam giáo viên là bịa đặt, nhưng ác ý do tin đồn này mang lại vẫn đeo bám cả cuộc đời nhân vật chính.
Dùng ma thuật để đánh bại ma thuật
Trên thực tế, các nhà phát triển từ lâu đã nhận thức được tác hại có thể xảy ra của các công nghệ AI này. Khi Google công bố ra mắt Imagen và Dream Booth, họ đã tránh sử dụng ảnh người thật trong các tài liệu giải thích mà sử dụng ảnh đồ vật và động vật để làm ví dụ.
Tuy nhiên, dù không nhìn thấy hình ảnh nào chứa đựng sự căm ghét, định kiến, phân biệt chủng tộc, bạo lực hay phân biệt giới tính, tất cả chúng ta đều biết chúng sẽ ở ngay đó.
Bức ảnh do AI tạo ra về nhà triết học Hy Lạp cổ đại Heraclitus, lấy mẫu từ những gì mô hình AI biết về ảnh chụp những ông già và mô tả về văn hóa Hy Lạp cổ đại được tìm thấy trong tập dữ liệu đào tạo của nó.
Hiện tại, để giải quyết vấn đề này, nhiều nền tảng đang cố gắng sử dụng nhiều phương pháp khác nhau. Trong số đó, giải pháp của một số nền tảng như OpenAI và Google là khóa các công cụ trong giới hạn và chỉ mở chúng ra cho một số ít người dùng đáng tin cậy. Hoặc các dữ liệu cũ sẽ cần phải được xóa đi khi cập nhật lên phiên bản mới. Đồng thời, trong thỏa thuận cấp phép phần mềm cũng có các quy định rõ ràng rằng không được phép tạo ra hình ảnh của mọi người.
Tuy nhiên, các quy định về chính sách xét cho cùng cũng không trị được tận gốc rễ của vấn đề. Vì thế, gần đây một số nền tảng bao gồm cả Stable Diffusion cũng đang cố gắng sử dụng các biện pháp kỹ thuật để giải quyết mối lo này. Trong đó có công nghệ gọi là đóng dấu vô hình (invisible watermark). Thông qua các hình đóng dấu vô hình này, hệ thống sẽ có thể tự động xác định tính xác thực của bức ảnh, đồng thời bảo vệ việc chỉnh sửa và tái tạo ảnh.
Ngoài ra, đối với nguồn đào tạo, để bảo vệ các bức ảnh gốc, tháng trước, các nhà nghiên cứu tại MIT đã công bố phát triển công nghệ PhotoGuard dành riêng cho chỉnh sửa ảnh AI. Đó là một quy trình đối nghịch nhằm mục đích phá vỡ và ngăn chặn AI thao túng các hình ảnh hiện có bằng cách sửa đổi ảnh một cách tinh vi bằng phương pháp vô hình.
Hình minh họa quy trình PhotoGuard của MIT bảo vệ chống chỉnh sửa ảnh AI.
Trong một hoặc hai năm trở lại đây, công nghệ của các hệ thống AI chỉnh sửa ảnh đã có những bước phát triển nhảy vọt. Điều đó khiến nhiều người nhận ra rằng thời đại thống trị của trí tuệ nhân tạo thường được nhắc đến trong phim ảnh dường như đang ẩn hiện đâu đây trong cuộc sống của chúng ta.
Các nhà nghiên cứu của Stable Diffusion cách đây không lâu đã cho biết rằng Stable Diffusion có thể sẽ chạy trên điện thoại thông minh trong vòng một năm tới. Nhiều công cụ tương tự cũng đã bắt đầu đào tạo các mô hình này trên các thiết bị nhẹ hơn, chẳng hạn như các plug-in khác nhau của ChatGPT đã bắt đầu được người dùng sử dụng rộng rãi. Vì vậy, chúng ta có thể sớm chứng kiến sự bùng nổ về sản lượng hình ảnh sáng tạo do AI cung cấp trong những năm tới.
Tuy nhiên, khi chúng trở nên công khai và dân sự hơn, ngưỡng kỹ thuật để sản xuất nội dung tổng hợp cũng ngày càng thấp hơn, người bình thường chỉ cần một lượng nhỏ hình ảnh, âm thanh, video, văn bản và dữ liệu mẫu cũng đủ để làm mờ ranh giới giữa thông tin thật và giả. Nếu không có sự ra đời của các luật và quy định liên quan, một khi công nghệ bị lạm dụng sẽ gây ra rủi ro rất lớn và thiệt hại đáng kể cho các cá nhân và doanh nghiệp.
Kể từ khi bùng nổ các công cụ vẽ tranh AI vào đầu năm nay, nhiều người đã tập trung vào việc AI có thể lật đổ sự sáng tạo nghệ thuật hay không. Nhưng trên thực tế, chúng không chỉ thay đổi phương thức sáng tạo mà còn có thể thách thức cả trật tự xã hội. Việc hạn chế khả năng của AI một cách có điều kiện cũng có thể là vấn đề cần phải giải quyết trước khi những công cụ này có thể thay đổi cuộc sống của chúng ta.
Tham khảo ArsTechnica, iFeng
Thể thao & Văn hóa