Bài học rút ra từ sự cố ngừng website. Cách kiểm tra website?

1365
31-05-2019
Bài học rút ra từ sự cố ngừng website. Cách kiểm tra website?

Chúng ta ngày càng nghe nhiều hơn về những sự kiện ngừng hoạt động của các trang web cao cấp và thiệt hại của chúng đối với kinh doanh. Một trong những sự cố ngừng hoạt động lớn phải kể tới AWS của Amazon đã làm mất một phần lớn lưu lượng truy cập internet khi một bản cập nhật bị lỗi. Sự cố ngừng hoạt động còn có thể dẫn tới thất bại của một doanh nghiệp nếu doanh nghiệp không giám sát và kiểm tra đúng cách các trang web, gây ra downtime không có kế hoạch và không thể chấp nhận được. Các lần ngừng hoạt động lớn khác mà chúng ta đã được chứng kiến bao gồm các nền tảng truyền thông xã hội: WhatsApp, Facebook, Twitter và Reddit; các trang web du lịch lớn Ryanair và British Airways; và các trang web bán lẻ như Nordstrom. Hãy cùng Bizfly Cloud  tìm hiểu thêm thông tin qua bài viết dưới đây nhé!

Nhiều công ty không nhận thức được việc website có thể xử lý lượng traffic là bao nhiêu để vẫn có thể duy trì trải nghiệm người dùng tích cực, và đâu là các cách để chuẩn bị cho giai đoạn cao điểm hoặc cách đối phó với sự gia tăng bất ngờ của người dùng. Bởi vì việc website ngừng hoạt động luôn dẫn đến sự không hài lòng phía khác hàng, gây tổn hại danh tiếng cho doanh nghiệp và doanh thu bị tụt giảm.

Những cân nhắc quan trọng

Bất kỳ doanh nghiệp nào đã từng bị ngừng hoạt động sẽ biết rất rõ, downtime sẽ dẫn đến những hậu quả nghiêm trọng. Để duy trì lợi thế cạnh tranh và giữ cho khách hàng hài lòng, các doanh nghiệp cần rút ra 3 bài học từ những lần ngừng hoạt động website của các doanh nghiệp lớn: nhận ra giới hạn của doanh nghiệp, giám sát hệ thống thường xuyên liên tục, và chủ động liên hệ nếu gặp sự cố.

Nhận ra giới hạn của doanh nghiệp

Điều quan trọng là xác định điều gì sẽ khiến trang web hoặc ứng dụng của doanh nghiệp bị sập. Có bao nhiêu người dùng đồng thời có thể được xử lý và đâu là điểm bị phá vỡ? Lưu lượng truy cập trang web sẽ không giống ngày này qua ngày khác khi hành vi của người dùng thay đổi và cao điểm có thể xuất hiện bất kỳ lúc nào. Trong đa số các trường hợp, trang web sập vì sự quá tải truy cập vào khoảng thời gian cao điểm mà doanh nghiệp đã không có sự chuẩn bị vì không lường trước. Kiểm soát, theo dõi và hiểu xu hướng traffic của doanh nghiệp và chuẩn bị cho phù hợp sẽ giúp hạn chế tối đa các sự cố downtime.

Giám sát hệ thống thường xuyên liên tục

Việc tích hợp kiểm thử hiệu năng vào vòng đời phát triển phần mềm có thể giúp các tổ chức phát triển phần mềm chất lượng cao hơn trong thời gian ngắn hơn, đồng thời giảm chi phí phát triển. Bạn càng trì hoãn việc tiến hành các bài kiểm tra hiệu suất, sẽ càng tốn kém để kết hợp các thay đổi. Doanh nghiệp cần dự đoán tải chính xác, phân phối và mở rộng quy mô để tối ưu hóa cơ sở hạ tầng và trải nghiệm người dùng.

Chủ động giao tiếp nếu bạn bị ngừng hoạt động

Trong trường hợp ngừng hoạt động, các doanh nghiệp phải minh bạch với khách hàng và cho họ biết những gì đang xảy ra. Thừa nhận việc ngừng hoạt động, giải thích lý do xảy ra, xin lỗi vì sự bất tiện này và cung cấp thời gian thực tế mà doanh nghiệp dự kiến trở lại hoạt động kinh doanh như bình thường nếu có thể. Chìa khóa thành công ở đây là có một sự cố hoặc trang trạng thái được lưu trữ bởi bên thứ ba chứ không phải tổ chức của riêng bạn. Điều này đảm bảo khả năng giao tiếp qua giao diện của bên thứ ba sẽ duy trì trong suốt thời gian ngừng hoạt động của doanh nghiệp. Nhiều nhà cung cấp cung cấp các trang trạng thái sự cố như một dịch vụ.

Học hỏi từ sai lầm

Nếu gặp sự cố ngừng hoạt động, hãy chắc chắn rằng doanh nghiệp đã học được từ đó và áp dụng các biện pháp để đảm bảo điều đó không xảy ra lần thứ hai. Doanh nghiệp nên đầu tư vào các dịch vụ giám sát và thử nghiệm chủ động. Nhưng một dịch vụ không phù hợp với tất cả. Giám sát và kiểm tra nên được tùy chỉnh tùy thuộc vào nhu cầu của doanh nghiệp.

Ba điểm cần lưu ý để kiểm tra và giám sát trang web bao gồm đối tượng và mục đích, giai đoạn cao điểm và những sự kiện bất ngờ.

Đối tượng và mục đích

Mỗi trang web có một đối tượng và mục đích cụ thể. Ví dụ: một trang web bán vé hòa nhạc và một trang blog sẽ thu hút các quy mô người dùng khác nhau. Trang web bán vé sẽ cần phải có khả năng đối phó với lưu lượng truy cập lớn, trong khi blog cá nhân sẽ có các đỉnh nhỏ hơn nhiều. Stress testing cho phép bạn xem chính xác trang web hoặc ứng dụng có thể xử lý được bao nhiêu lưu lượng truy cập và liệu bạn có cần tăng công suất hay không. Bằng cách so sánh các nút thắt tuyệt đối với lưu lượng truy cập thông thường, bạn có thể kiểm soát và chuẩn bị được cho các sự cố trong tương lai.

Giai đoạn cao điểm

Một số trang web có thể dự đoán được giai đoạn nào là cao điểm với chính mình. Amazon và các nhà bán lẻ internet khác biết rằng họ sẽ bị quá tải trong Black Friday và Cyber Monday. Các nhà cung cấp mạng và nội dung mong đợi lưu lượng truy cập cao nhất khi tập mới của chương trình ăn khách mới nhất hoặc sự kiện ra mắt được phát sóng. Do đó, các website này có một lịch trình cụ thể cho việc tăng giảm traffic của chính mình. Concurrency testing cho phép doanh nghiệp kiểm tra xem website có thể xử lý bao nhiêu người dùng cùng một lúc.

Sự kiện bất ngờ

Thời điểm lưu lượng truy cập tăng đột xuất rất khó dự đoán. Người ảnh hưởng và tài liệu quảng cáo có ảnh hưởng trực tiếp đến nhu cầu trang web và ứng dụng. Gần đây, trang FFC đã ngừng hoạt động khi John Oliver yêu cầu người xem truy cập trang web để ủng hộ "net neutrality". Một ví dụ khác, Instagram đã sập khi tổng thống Trump hướng mọi người đến nguồn cấp dữ liệu Instagram của mình. Nếu doanh nghiệp cảm thấy trang web của mình có thể đặc biệt dễ bị tổn thương bởi loại "flash traffic này, thì doanh nghiệp nên thực hiện và chuẩn bị kịch bản cho những trường hợp xấu nhất, thử nghiệm hiệu năng cho các đỉnh điểm traffic này.

Kiểm tra và giám sát có hiệu quả nhất khi chúng được điều chỉnh theo nhu cầu cụ thể của trang web hoặc ứng dụng. Điều quan trọng là phải có các công cụ phù hợp để giám sát lưu lượng truy cập trang web và kiểm tra các ứng dụng để mọi vấn đề phát sinh có thể được giải quyết chủ động trong giai đoạn phát triển, và được khắc phục nhanh chóng và hiệu quả trong các sản phẩm chính thức.

Theo Bizfly Cloud chia sẻ

>> Có thể bạn quan tâm: Xu hướng đám mây 2019: Bảo mật thông minh hơn, Sao lưu hợp lý hơn và máy tính có tính khoa học hơn

SHARE