Các sự cố gián đoạn wed quy mô lớn gia tăng toàn cầu

Nhiều người dùng Internet tại Mỹ và nhiều nước đã trải qua sự cố khi truy cập vào nhiều trang web và ứng dụng quen thuộc như ngân hàng, tin nhắn hay trò chơi trực tuyến, người dùng lại nhận được những thông báo: "Hệ thống đang tạm dừng hoạt động để bảo trì", hay là "Chúng tôi không thể xử lý yêu cầu của bạn lúc này".

Trong số đó có cả những dịch vụ có hàng triệu người dùng như trang thương mại điện tử của Amazon, các trò chơi Roblox và Fortnite, hay mạng xã hội Snapchat… Tất cả đều đồng loạt gặp sự cố không thể truy cập được trên phạm vi toàn cầu trong khoảng 6 giờ đồng hồ.

Điểm chung của các dịch vụ này đó là chúng đều hoạt động trên cơ sở hệ thống của Amazon Web Services hay AWS - nền tảng điện toán đám mây phổ biến hàng đầu thế giới hiện nay. Và như người ta thường so sánh, chỉ một "cái hắt hơi" từ nền tảng khổng lồ này, đã khiến không ít dịch vụ Internet đình đám đã "nhức đầu sổ mũi".

Sự cố AWS và rủi ro với các dịch vụ Internet toàn cầu

Trái với một số lo ngại, sự cố của dịch vụ Amazon Web Services không đến từ một vụ tấn công mạng nào, mà được cho là vấn đề kỹ thuật. Tuy nhiên, với một mạng lưới đám mây lớn, được nhiều dịch vụ web và Internet sử dụng như AWS, chỉ một vài lỗi kỹ thuật cũng có thể dẫn đến ảnh hưởng quy mô lớn.

Ông Chris Stokel-Walker - Phóng viên chuyên trách công nghệ và kỹ thuật số cho biết: "Sự cố AWS nằm trong tính năng tên miền DNS, nghĩa là hệ thống không thể chuyển đổi được tên trang web thành địa chỉ IP để kết nối. Nghe có vẻ là một lỗi nhỏ, nhưng thực tế lại là vấn đề lớn vì nó làm người dùng mất khả năng truy cập trên diện rộng. Không có dấu hiệu nào cho thấy đây là một vụ tấn công có chủ đích".

Một yếu tố nữa khiến cho ảnh hưởng của sự cố hệ thống đám mây lan rộng đó là các mạng đám mây này thường phân tán dữ liệu và tính năng, do đó sự cố dù chỉ ở một cụm máy chủ cũng sẽ tác động đến những trang web hay dịch vụ ở những điểm khác.

"Nhiều ứng dụng và dịch vụ mạng có tính toàn cầu, dù bạn truy cập vào một trang web từ Vương quốc Anh, nhưng có thể có một số thành phần lại được đặt trên cụm máy chủ AWS ở Mỹ và cũng sẽ chịu ảnh hưởng từ sự cố tại đây", ông Chris Stokel-Walker - Phóng viên chuyên trách công nghệ và kỹ thuật số nói.

Một sự cố trên nền tảng đám mây có thể dẫn đến gián đoạn hàng loạt dịch vụ trong đời thực.

Một rủi ro lớn hơn được nhìn nhận đó là các doanh nghiệp và người tiêu dùng phụ thuộc nhiều vào những ứng dụng vận hành trên nền dịch vụ đám mây lớn như AWS hay Google Cloud. Một sự cố trên nền tảng đám mây có thể dẫn đến gián đoạn hàng loạt dịch vụ trong đời thực, như chuyển tiền qua ngân hàng hay làm thủ tục ở sân bay.

Ông Patrick Burgess - Chuyên gia An ninh mạng, Viện Công nghệ thông tin BCS nhận định: "Thế giới gần như đang vận hành trên nền tảng đám mây, nhiều tiện ích được cung cấp chỉ qua chiếc điện thoại, dựa vào một số ít các nền tảng lớn… Các doanh nghiệp cũng thúc đẩy giao dịch trực tuyến và loại bỏ dần các hình thức khác như chi nhánh ngân hàng vật lý. Do đó, người dùng sẽ gặp vô số rắc rối nếu các dịch vụ này không thể vận hành bình thường".

Lĩnh vực điện toán đám mây hiện cũng bị chi phối bởi một số ít nền tảng thống trị, với 3 tên tuổi dẫn đầu là AWS, Microsoft Azure và Google Cloud chiếm khoảng gần 2/3 thị phần toàn cầu. Và những sự cố như của AWS nhắc nhở rằng, ngay cả những mạng lưới lớn và tiên tiến nhất cũng không tránh khỏi lỗi kỹ thuật, khiến cho cả nền kinh tế số trở nên mong manh hơn bao giờ hết.

Không chỉ sự cố vừa rồi của AWS, trong vài năm qua, thế giới cũng đã chứng kiến không ít vụ "sập" các dịch vụ trực tuyến có quy mô lớn toàn cầu. Một trong những vụ việc đình đám nhất vào năm 2021, khi tất cả các ứng dụng của ông lớn Meta, như Facebook, Messenger, Instagram… đồng loạt mất kết nối trong suốt nhiều giờ đồng hồ. Hơn 3,5 tỷ người dùng các ứng dụng của tập đoàn này đã bị ảnh hưởng.

Một sự cố nghiêm trọng khác xảy ra vào năm ngoái là vụ việc liên quan đến lỗi bản cập nhật bảo mật của công ty an ninh mạng Crowdstrike, đã khiến hàng triệu máy tính chạy hệ điều hành Windows của Microsoft bất ngờ hiện ra lỗi "màn hình xanh" trong nhiều giờ.

Kéo theo đó là hàng loạt đơn vị như bệnh viện, hãng hàng không, công ty tài chính, cả dịch vụ khẩn cấp như chữa cháy, cứu hộ không thể sử dụng hệ thống máy tính và buộc phải chuyển sang vận hành thủ công, gây ra nhiều gián đoạn và trì hoãn.

Các hãng hàng không chịu hiệt hại từ các sự cố gián đoạn quy mô lớn

Thiệt hại từ các sự cố gián đoạn quy mô lớn

Chỉ một lỗi vô tình nào đó nhưng hàng loạt dịch vụ trực tuyến thiết yếu cũng có thể rơi vào tình trạng gián đoạn - chắc chắn những thiệt hại là không hề nhỏ. Một sự cố gián đoạn mạng có thể ảnh hưởng tới hàng triệu người và tiêu tốn hàng triệu, thậm chí hàng tỷ USD để xử lý thiệt hại cũng như khắc phục.

Như trong vụ việc Crowdstrike, hãng hãng không Delta của Mỹ cho biết họ đã phải hoãn, hủy khoảng 7.000 chuyến bay, ảnh hưởng đến 1,3 triệu hành khách. Ước tính tổng thiệt hại của sự cố này trên toàn cầu là hơn 1 tỷ USD - biến đây trở thành một trong những sự cố về công nghệ thông tin nghiêm trọng nhất lịch sử.

Sự cố năm 2021 tạo ra tổn thất doanh thu quảng cáo khoảng 60 - 100 triệu USD với Meta, tuy nhiên thiệt hại lớn hơn nằm ở các đơn vị kinh doanh dựa vào nền tảng của hãng này, có những doanh nghiệp tổn thất từ 30-70% doanh thu so với tuần trước đó, do bị gián đoạn các kênh liên lạc, chốt đơn và chăm sóc khách hàng, đặc biệt với doanh nghiệp nhỏ tại các thị trường mới nổi như Ấn Độ.

Các doanh nghiệp nỗ lực giảm thiểu rủi ro gián đoạn nền tảng số

Với thiệt hại kinh tế đáng kể như vậy, các chuyên gia về an ninh mạng đều khuyến cáo các doanh nghiệp có những bước đi để nâng cao khả năng chống chịu và giảm thiểu tác động tiêu cực từ các sự cố gián đoạn với nền tảng trực tuyến của mình.

Theo công ty tư vấn công nghệ Forrester, việc phòng ngừa rủi ro đòi hỏi các doanh nghiệp phải áp dụng công nghệ tự động giám sát hệ thống, tự động hóa quy trình xử lý sự cố, xây dựng các kế hoạch dự phòng và thường xuyên kiểm tra khả năng chịu đựng của hệ thống trong các tình huống bất ổn.

Các tổ chức tài chính cũng đang thúc đẩy sử dụng chiến lược đa đám mây, sử dụng dịch vụ của nhiều nhà cung cấp lớn thay vì chỉ một nền tảng duy nhất. Ngân hàng Trung ương Anh (BOE) và Liên minh châu Âu (EU) đã đưa ra những quy định pháp lý, yêu cầu các ngân hàng, tổ chức phải có kế hoạch duy trì hoạt động liên tục, sẵn sàng chuyển sang nhà cung cấp khác nếu nhà cung cấp chính gặp sự cố.

Ông Ed Amoroso - Giám đốc điều hành, Công ty an ninh mạng TAG Infosphere cho hay: "Tất cả chúng ta đều phụ thuộc rất nhiều vào các nhà cung cấp dịch vụ đám mây hàng đầu. Ưu điểm của họ là cung cấp dịch vụ chất lượng cao và ổn định, với chi phí thấp nhờ quy mô lớn. Nhưng mặt trái là bạn đang đặt tất cả trứng vào một giỏ và điều này có nhiều rủi ro. Thậm chí, ngay cả khi chọn chiến lược đa đám mây, tức là sử dụng dịch vụ của nhiều nhà cung cấp, bạn cũng chưa chắc chắn đã an toàn tuyệt đối, bởi có thể nguy cơ gián đoạn sẽ đến từ điểm giao giữa các nhà cung cấp đó".

Bên cạnh đó, các chuyên gia cũng nhấn mạnh vai trò quan trọng của việc kiểm soát phần kiến trúc ứng dụng để giảm thiểu rủi ro.

Ông Ed Amoroso - Giám đốc điều hành, Công ty an ninh mạng TAG Infosphere nói: "Trong khi cơ sở hạ tầng phụ thuộc vào các nhà cung cấp dịch vụ như AWS, doanh nghiệp vẫn có thể làm nhiều việc để cải thiện phần trên của hệ thống, tức là những thứ được xây dựng trên nền tảng đó. Những thứ này bao gồm ứng dụng, hệ thống, tương tác, website, ứng dụng web… Đây là điều hoàn toàn nằm trong tầm kiểm soát của doanh nghiệp. Việc giảm bớt sự phức tạp, giữ cho ứng dụng vận hành trơn tru, là một nửa chặng đường dẫn đến thành công".

Ngoài ra, khi thương thảo hợp đồng, các doanh nghiệp cũng cần thảo luận kỹ lưỡng hơn với nhà cung cấp dịch vụ để xác định rõ vấn đề trách nhiệm cũng như bồi thường khi có sự cố xảy ra. Cách làm này giúp nâng cao tính minh bạch, hạn chế những thiệt hại lâu dài cho khách hàng và bản thân doanh nghiệp khi nền tảng số bị gián đoạn.