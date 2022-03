Kafka là một hệ thống phân phối dữ liệu thời gian thực với khả năng truyền số lượng vô cùng lớn các message, và lưu trữ sao lưu trên queue hoặc ổ đĩa an toàn nếu message chưa được nhận. Với Apache Kafka là công cụ nguồn mở phổ biến được sử dụng để triển khai các data pipeline hiệu suất cao, phân tích, tích hợp dữ liệu và các ứng dụng chức năng quan trọng. Ứng dụng phổ biến trong đo lường, theo dõi website để tối ưu hoạt động cho trang, xử lý dữ liệu thời gian thực như phát noti realtime và hàng triệu hình thức phân tích tùy chỉnh khác cho các team và doanh nghiệp, Kafka mở ra những tiềm năng phát triển vô cùng mạnh mẽ.



Khi triển khai kiến trúc truyền dữ liệu theo thời gian thực, các team IT phải đối mặt với hai thách thức lớn: một là xây dựng và duy trì cơ sở hạ tầng Apache Kafka; và hai là thêm code tùy biến để triển khai dữ liệu sự kiện trên các sản phẩm, dịch vụ và hoạt động hiện có. Quy mô của hệ thống phụ thuộc vào lưu lượng truy cập web/ứng dụng di động hoặc theo yêu cầu của thiết bị. Có hai cách phổ biến để giải quyết thách thức này - bao gồm: tự triển khai, mở rộng quy mô, giám sát và duy trì hệ thống hoặc sử dụng giải pháp Managed Kafka (dịch vụ Kafka trên đám mây) xử lý vấn đề này cho bạn.

Khi nói đến tự triển khai, mở rộng quy mô, giám sát và duy trì hệ thống truyền dữ liệu thời gian thực, có nghĩa là team dev, doanh nghiệp sẽ phải sử dụng toàn bộ nguồn lực nội tại bao gồm con người, thời gian, thiết bị… cho các công việc trên. Do đó, những thách thức mà các team và doanh nghiệp gặp phải có thể đến từ nguy cơ tăng chi phí và chậm tiến độ hoàn thành dự án (ra mắt website, ứng dụng mới) do sự phức tạp của việc triển khai và phạm vi triển khai một giải pháp dữ liệu thời gian thực như Kafka.

Ngoài ra, việc tự triển khai cũng đòi hỏi các nguồn lực dành riêng như ghi nhật ký và giám sát, phân tích và tối ưu…, và điều này là không khả thi đối với các team IT quy mô nhỏ.

Dù vậy, việc tự triển khai cũng có 1 số lợi ích nhất định tùy thuộc vào nhu cầu của doanh nghiệp hoặc yêu cầu của dự án như áp dụng đa dạng các nền tảng public, private, hybrid hoặc multi-cloud thông qua các nền tảng VMware, OpenStack và Kubernetes; áp dụng các công cụ như Apache Storm, Spark, Flink và Beam để xây dựng quy trình xử lý AI/ML tùy biến cho các yêu cầu tích hợp web/mobile app hoặc IoT.

Giải pháp không tốn công sức, thời gian xây dựng, duy trì, mở rộng và giám sát các Apache Kafka với chi phí nhỏ gọn

Đối với các dịch vụ đám mây, hiện nay nhiều nhà cung cấp tiêu chuẩn sở hữu các data center phân tán, hệ thống máy ảo lớn và mạnh mẽ, hệ thống container, các công cụ điều phối như K8S và hệ thống API để kết nối hàng trăm đến hàng nghìn microservices. Dựa trên những lợi thế sẵn có này, các giải pháp cung cấp Apache Kafka sẽ được nhiều tính năng và chức năng tiện ích được cập nhật thường xuyên để đáp ứng yêu cầu của các DevOps team.

Lợi thế lớn của 1 nền tảng Apache Kafka dưới dạng dịch vụ là nhà cung cấp sở hữu đội ngũ chuyên gia hàng đầu với nhiều năm kinh nghiệm trong việc tìm ra những cách tối ưu nhất khi triển khai thực tế cho doanh nghiệp. Nhưng đối với các SMB, sẽ đặc biệt tốn kém khi nói đến các chi phí dành cho đội ngũ nhân viên và nguồn lực hạ tầng nội bộ để quản lý 24/7/365 các tài nguyên khi xử lý truyền phát dữ liệu thời gian thực. Giải pháp giúp các doanh nghiệp, các team DevOps có thể ngay lập tức sử dụng Apache Kafka chỉ sau vài cài đặt ban đầu, với chi phí rất phải chăng, trong khi đó không phải chịu bất cứ rủi ro nào cho việc tự xây dựng và quản lý.

Thanh toán có thể lựa chọn phương án hàng tháng/hàng năm và nhà cung cấp cũng cung cấp phương thức tính "pay as you go" - dùng tới đâu thanh toán tới đó. Chi phí sẽ được tính dựa trên số lượng máy tính, băng thông và bộ nhớ được sử dụng cho các yêu cầu về tài nguyên xử lý dữ liệu trực tuyến.

Giới thiệu diễn giả:

Anh Lương Trung Kiên - System Admin

Anh đã có nhiều kinh nghiệm trong xây dựng, triển khai và phát triển hệ thống Kafka cho nhiều dự án nội bộ của VCCorp như các app đọc báo Kênh 14, CafeF, hệ thống quảng cáo Admicro… giúp giải quyết các bài toán về tính sẵn sàng, ổn định cao, phân tích để tối ưu khi truyền phát dữ liệu thời gian thực với số lượng vô cùng lớn. Bizfly Cloud là nhà cung cấp đám mây sở hữu mô hình multi-datacenter với hệ thống máy chủ ảo lớn và mạnh mẽ, cùng hệ giải pháp vệ tinh Container Registry, Kubernetes Engine, API Gateway… đáp ứng đa dạng nhu cầu phát triển cho doanh nghiệp, Dev team. Các đối tác, khách hàng lớn có thể kể đến: Vingroup, Đất Xanh Miền Bắc, SSI, VNDirect, Vntrip, Ahamove, Sapo…

