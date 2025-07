Ngày 1/7/2025 – Cloudflare, công ty cung cấp dịch vụ connectivity cloud (đám mây kết nối) hàng đầu, đã công bố rằng hiện họ là nhà cung cấp cơ sở hạ tầng Internet đầu tiên chặn các trình thu thập dữ liệu AI truy cập mặc định nội dung khi chưa được phép hoặc chưa trả phí.

Từ nay, chủ sở hữu trang web có thể chọn cho phép trình thu thập dữ liệu AI truy cập nội dung của mình hay không và quyết định cách các công ty AI có thể sử dụng nội dung đó.

Các công ty AI hiện cũng có thể tuyên bố rõ mục đích của mình - là trình thu thập dữ liệu của họ được sử dụng để đào tạo, suy luận hay tìm kiếm - từ đó giúp chủ sở hữu trang web quyết định sẽ cho phép trình thu thập dữ liệu nào. Cài đặt mặc định mới của Cloudflare là bước đầu tiên hướng tới một tương lai bền vững hơn cho cả những nhà sáng tạo nội dung lẫn người đổi mới AI.

Trong nhiều thập kỷ, Internet đã hoạt động dựa trên một sự trao đổi đơn giản: các công cụ tìm kiếm lập chỉ mục nội dung và hướng người dùng trở lại các trang web gốc, tạo ra lưu lượng truy cập và doanh thu quảng cáo cho các trang web thuộc mọi quy mô. Chu trình này mang lại tiền và lượng người theo dõi cho những nhà sáng tạo nội dung chất lượng, đồng thời giúp người dùng khám phá các thông tin mới và phù hợp. Mô hình đó hiện đã sụp đổ. Trình thu thập dữ liệu AI thu thập nội dung như văn bản, bài viết và hình ảnh để tạo ra câu trả lời mà không đưa người truy cập đến nguồn dữ liệu gốc, khiến nhà sáng tạo nội dung mất đi doanh thu cùng sự thỏa mãn khi biết rằng có người đang xem nội dung của họ. Nếu động lực tạo ra nội dung gốc và chất lượng biến mất, xã hội sẽ thua thiệt và tương lai của Internet sẽ bị đe dọa.

Matthew Prince, đồng sáng lập kiêm Giám đốc điều hành của Cloudflare cho biết: "Nếu Internet muốn tồn tại qua thời đại AI, chúng ta cần trao cho các nhà xuất bản quyền kiểm soát mà họ xứng đáng có được và xây dựng một mô hình kinh tế mới phù hợp cho tất cả mọi người - nhà sáng tạo, người tiêu dùng, những nhà sáng lập AI trong tương lai và chính tương lai của web". “Nội dung gốc là thứ khiến Internet trở thành một trong những phát minh vĩ đại nhất của thế kỷ trước và điều cực kỳ quan trọng là những nhà sáng tạo tiếp tục làm điều đó. Các trình thu thập dữ liệu AI đã thu thập nội dung không giới hạn. Mục tiêu của chúng tôi là trao trở lại quyền lực cho những nhà sáng tạo, đồng thời vẫn giúp các công ty AI đổi mới. Đây là vấn đề bảo vệ tương lai của một mạng Internet tự do và sôi động, với mô hình mới phù hợp cho tất cả mọi người.”

“Cách tiếp cận sáng tạo của Cloudflare trong việc chặn trình thu thập dữ liệu AI đang thay đổi cuộc chơi cho các nhà xuất bản và đặt ra một tiêu chuẩn mới về cách thức bảo vệ nội dung trực tuyến. Khi các công ty AI không còn có thể lấy bất cứ thứ gì họ muốn một cách miễn phí, thì điều đó sẽ mở ra cánh cửa cho sự đổi mới bền vững được xây dựng dựa trên sự cho phép và hợp tác", Roger Lynch, CEO của Condé Nast, cho biết. “Đây là bước cực kỳ quan trọng hướng tới việc tạo ra một sự trao đổi giá trị công bằng trên Internet nhằm bảo vệ nhà sáng tạo, hỗ trợ báo chí chất lượng và buộc các công ty AI phải chịu trách nhiệm.”

“Chúng tôi lâu nay đã luôn nói rằng các nền tảng AI phải bồi trả phí công bằng cho các nhà xuất bản và nhà sáng tạo khi sử dụng nội dung của chúng tôi. Giờ đây, chúng tôi có thể hạn chế quyền truy cập và chỉ cấp quyền truy cập vào nội dung của mình cho các đối tác AI sẵn sàng ký kết các thỏa thuận công bằng", Neil Vogel, CEO của Dotdash Meredith cho biết. “Chúng tôi tự hào ủng hộ Cloudflare và mong muốn sử dụng các công cụ của họ để bảo vệ nội dung của chúng tôi và web mở.”

Renn Turiano, Giám đốc Sản phẩm và Người tiêu dùng của Gannett Media cho biết: "Là nhà xuất bản lớn nhất đất nước, bao gồm USA TODAY và hơn 200 ấn phẩm địa phương trên toàn Mạng lưới USA TODAY, việc ngăn chặn hành vi thu thập dữ liệu và sử dụng nội dung gốc của chúng tôi mà không trả phí thỏa đáng có ý nghĩa vô cùng quan trọng". “Trong bối cảnh ngành của chúng tôi phải đối mặt với những thách thức này, chúng tôi lạc quan rằng công nghệ Cloudflare sẽ giúp chống lại tình trạng đánh cắp IP có giá trị.”

“Những nhà sáng tạo và nhà xuất bản trên toàn thế giới tận dụng Pinterest để mở rộng doanh nghiệp, tiếp cận đối tượng mới và đo lường trực tiếp thành công của họ. Khi AI tiếp tục định hình lại bối cảnh kỹ thuật số, chúng tôi cam kết xây dựng một cơ sở hạ tầng Internet lành mạnh, nơi nội dung được sử dụng đúng mục đích, để những nhà sáng tạo và nhà xuất bản có thể phát triển mạnh mẽ", Bill Ready, CEO của Pinterest cho biết.

“Các công ty AI, công cụ tìm kiếm, các nhà nghiên cứu và bất kỳ ai thu thập dữ liệu trên các trang web đều phải đúng như những gì họ tuyên bố. Và các nền tảng trên web cũng phải cho biết ai đang lấy nội dung của họ và lấy để làm gì", Steve Huffman, đồng sáng lập và giám đốc điều hành của Reddit, cho biết. “Toàn bộ hệ sinh thái gồm các nhà sáng tạo, nền tảng, người dùng web và trình thu thập dữ liệu sẽ trở nên tốt hơn khi việc thu thập dữ liệu trở nên minh bạch và được kiểm soát tốt hơn, và những nỗ lực của Cloudflare là một bước đi đúng hướng cho tất cả mọi người.”

Vivek Shah, CEO của Ziff Davis cho biết: "Chúng tôi hoan nghênh Cloudflare vì đã ủng hộ một hệ sinh thái số bền vững mang lại lợi ích cho tất cả các bên liên quan gồm những người tiêu dùng tin tưởng vào thông tin đáng tin cậy, các nhà xuất bản đầu tư vào việc tạo ra thông tin và các nhà quảng cáo hỗ trợ việc phổ biến thông tin".

Thực thi mô hình dựa trên sự cho phép đối với Internet

Cloudflare sở hữu một trong những mạng lưới lớn nhất thế giới, giúp quản lý và bảo vệ lưu lượng truy cập cho 20% web. Công ty xử lý hàng nghìn tỷ yêu cầu mỗi ngày và do đó sở hữu các giải pháp quản lý bot tiên tiến nhất thế giới, phân biệt chính xác người dùng thực và các trình thu thập dữ liệu AI. Vào tháng 9 năm 2024, Cloudflare đã giới thiệu tùy chọn chặn trình thu thập dữ liệu AI chỉ với một cú nhấp chuột. Hơn một triệu khách hàng đã chọn tùy chọn này, được coi là giải pháp mạnh mẽ nhưng dễ dàng, giúp dừng việc thu thập dữ liệu trong thời gian tìm ra chiến lược AI cho mình.

Hiện tại, Cloudflare đang thực hiện bước tiếp theo để thực thi mô hình dựa trên sự cho phép đối với các trình thu thập dữ liệu AI. Các công ty AI hiện sẽ phải có được sự cho phép rõ ràng từ một trang web trước khi tiến hành thu thập dữ liệu. Khi đăng ký với Cloudflare, mọi tên miền mới giờ đây sẽ được hỏi xem họ có muốn cho phép trình thu thập dữ liệu AI hay không, giúp khách hàng có quyền lựa chọn ngay từ đầu là cho phép hay không cho phép trình thu thập dữ liệu AI truy cập. Sự thay đổi lớn này có nghĩa là mọi tên miền mới sẽ mặc định được kiểm soát và chủ trang web không còn cần phải tự mình cấu hình từ chối nữa. Khách hàng có thể dễ dàng kiểm tra cài đặt của mình và cho phép thu thập dữ liệu bất kỳ lúc nào nếu họ muốn nội dung của mình được truy cập tự do.

Các Nhà xuất bản, Công ty Truyền thông và Công nghệ Hàng đầu Thế giới Chấp nhận Mô hình Dựa trên Sự cho phép đối với việc Thu thập Dữ liệu AI

Các công ty hàng đầu trong lĩnh vực nội dung, truyền thông và công nghệ đang ủng hộ việc tạo ra một tương lai bền vững hơn, coi trọng nội dung gốc, bao gồm: ADWEEK, The Arena Group, The Associated Press, The Atlantic, Atlas Obscura, BuzzFeed, Inc., Condé Nast, Digital Content Next, DOC, Dotdash Meredith, Drupal & Acquia, EngineEars, Evolve Media, Fortune, Gannett Media, Groundviews.org, Half Baked Newsletter, Hyperscience, IAB Tech Lab, Independent Media, Trung tâm Nhà báo Quốc tế, Internet Brands, Linkup, Liên minh Tin tức/Truyền thông, O'Reilly Media, PMC, Pinterest, ProRata AI, Quora, Raptive, Reddit, SimpleFeed, Sky News Group, Snopes.com, SourceForge, Sovrn, Inc., Stack Overflow, StockTwits, SustainableMedia.Center, Third Door Media, TIME, Universal Music Group, Webflow và Ziff Davis.

Giờ đây, Cloudflare đang làm cho hệ sinh thái nội dung trở nên minh bạch hơn cho các công ty và nhà sáng tạo AI. Gần đây, công ty đã đề xuất những cách thức mới để các bot AI tự xác thực cũng như để các trang web nhận dạng các bot này – mang lại cho nhà sáng tạo và chủ sở hữu trang web các cơ chế nhận dạng mới và quyền kiểm soát đối với các trình thu thập dữ liệu mà họ muốn cho phép. Cloudflare đang tham gia phát triển một giao thức mới để cung cấp cho chủ sở hữu bot và các nhà phát triển tác nhân AI một cách tự nhận diện công khai, tiêu chuẩn.