So sánh giải pháp Site Recovery Manager và Disaster Recovery (DRaaS) tại Đại Hữu

So sánh giải pháp Site Recovery Manager và Disaster Recovery (DRaaS) tại Đại Hữu

Trong bối cảnh của môi trường kinh doanh hiện nay, việc đảm bảo sự liên tục hoạt động và khả năng khôi phục sau thảm họa là một phần quan trọng trong chiến lược quản lý rủi ro của các doanh nghiệp. Trước những thách thức từ các yếu tố như thiên tai, sự cố kỹ thuật hay tấn công mạng, các phương pháp quản lý và khôi phục hệ thống ngày càng trở nên quan trọng hơn bao giờ hết. Song, để đáp ứng nhu cầu hoạt động kinh doanh liên tục, không bị gián đoạn thì hạ tầng CNTT của mỗi doanh nghiệp cần phải được trang bị tại ít nhất 2 site, có thể gọi là DC site và DR site và triển khai cài đặt các giải pháp dự phòng thảm họa.

Với hạ tầng ảo hóa Vmware, Site Recovery Manager (SRM) là phần mở rộng của Vmware Vcenter, cung cấp khả năng khôi phục sau thảm họa (Disaster Recovery) và nhiều tính năng khác, được thiết kế để giảm thiểu thời gian ngừng hoạt động trong trường hợp xảy ra thảm họa hoặc sự cố. Nó cung cấp quản lý dựa trên chính sách, điều phối tự động và kiểm thử không gián đoạn các kế hoạch khôi phục tập trung và được thiết kế cho các máy ảo và có thể mở rộng để quản lý tất cả các ứng dụng trong môi trường vSphere.

Kiến trúc tổng quan về SRM

Site Recovery Manager được triển khai cấu hình theo từng cặp, thông thường sẽ có 2 site như sau:

Kiến trúc tổng quan SRM

Kiến trúc tổng quan SRM

Các thành phần của Site Recovery Manager

- Site Recovery Manager: Triển khai trên hệ điều hành Windows hoặc dưới dạng Virtual Appliance và cần phải được trang bị ở cả 2 site DC và DR, cung cấp các thành phần:

  • Giao diện người dùng Site Recovery Manager cung cấp đầy đủ chức năng để làm việc với Site Recovery Manager
  • Một plug-in được thêm vào vSphere Web Client và vSphere Client
  • Một cơ sở ữ liệu lưu trữ thông tin quản lý sao chép và thông tin cấu hình sao chép
  • Site Recovery Manager: Site Recovery Manager cũng cung cấp giao diện quản lý thiết bị ảo (virtual appliance management interface - VAMI)

- Protected Site: Là site chính triển khai DC, toàn bộ các dịch vụ sẽ chạy trên hạ tầng máy chủ tại site này (active)

- Recovery Site: Là site dự phòng (standby), là một cơ sở hạ tầng thay thế mà SRM có thể di chuyển các dịch vụ từ Protected Site đến. Recovery Site có thể ở một địa điểm khác, hoặc trong cùng một cơ sở để thiết lập dự phòng. Thành phần máy chủ Site Recovery Manager điều phối các hoạt động của VMware vCenter Server tại hai site. Khi các máy ảo tại protected site bị tắt hay mất kết nối, các bản sao của các máy ảo ở recovery site sẽ được turn-on. Bằng cách sử dụng dữ liệu được replicate từ protected site, các máy ảo này đảm nhận trách nhiệm cung cấp các dịch vụ giống hệt để thay thế cho site chính bị lỗi.

Tính năng, lợi ích của SRM

  • Khả năng khôi phục thảm họa, failover với thời gian rất ngắn, trong vòng vài phút vì các máy chủ ảo và thành phần lưu trữ được đồng bộ thời gian thực, chỉ mất thời gian khởi động máy chủ.
  • Tự động điều phối chuyển đổi dự phòng và khôi phục chỉ với click chuột, giảm thời gian phục hồi.
  • Kiểm tra thường xuyên, không gây gián đoạn các kế hoạch khôi phục; đảm bảo các đối tượng khôi phục có khả năng dự đoán cao.
  • Quản lý tập trung các kế hoạch khôi phục thay thế cho các thao tác thủ công.
  • Quy trình di chuyển có kế hoạch cho phép phòng tránh thảm họa và tính di động của TTDL.
  • Tích hợp Vmware vSAN giảm dấu vết DR thông qua nền tảng siêu hội tụ, lưu trữ định nghĩa phần mềm.
  • Hỗ trợ nhiều phiên bản vCenter cho phép ghép nối và nâng cấp linh hoạt.
  • Tích hợp vSphere Replication mang đến tính năng sao chép tập trung vào VM, giúp loại bỏ sự phụ thuộc vào các thiết bị lưu trữ.
  • Ngoài khả năng dự phòng thảm họa, giải pháp này có thể hỗ trợ các tính năng sau:

+ Migration: khi có nhu cầu chuyển đổi DC sang một vị trí mới mà gây ít thời gian downtime nhất có thể.

+ Maintenance: hỗ trợ bảo trì, bảo dưỡng và nâng cấp hệ thống chính bằng cách chuyển đổi chế độ hoạt động sang recovery site.

Các mô hình triển khai

Active – Passive: Với mô hình truyền thống này sẽ có một site chính chạy (protected site) các ứng dụng và dịch vụ và một site còn lại (recovery site) không hoạt động cho đến khi sự cố xảy ra và cần phục hồi.


Active – Active: Với mô hình này, SRM có thể được cấu hình để những workloads có độ ưu tiên thấp như môi trường test, dev có thể chạy trên recovery site và có thể được tắt như một phần của kế hoạch phục hồi. Điều này cho phép tài nguyên trên recovery site sẽ không bị lãng phí mà vẫn có thể đáp ứng được tải cho các hệ thống quan trọng trong trường hợp thảm họa.


Bi – Directional: Áp dụng với những trường hợp môi trường production được hoạt động ở cả 2 site, SRM hỗ trợ bảo vệ máy chủ ảo ở cả 2 hướng. Ví dụ máy chủ ở site này sẽ được bảo vệ ở site kia và ngược lại.


Multi-site:
Shared recovery: nhiều site remote được bảo vệ bởi một site chính. Ví dụ trong trường hợp công ty có nhiều chi nhánh, khi đó mỗi chi nhánh sẽ được xem như protected site và trụ sở chính sẽ có đảm nhiệm site dự phòng (recovery site).

Shared Protection: ngược lại với shared recovery, nhiều site remote sẽ dự phòng cho một site chính. Lúc này, một vài ứng dụng/VM ở site chính sẽ failover sang site remote thứ nhất, một số ứng dụng/VM khác sẽ failover sang site remote thứ 2,3,…n.


Three-site: là dạng mở rộng trong mô hình 2 site, VM ở site A sẽ được bảo vệ ở site B, VM ở site B sẽ được bảo vệ ở site C, VM ở site C sẽ được bảo vệ ở site A.


Lưu ý trong mô hình Multi-site:

  • Mỗi VM chỉ được bảo vệ bởi một cặp SRM ( recovery site và protected site)
  • SRM hiện tại không hỗ trợ failover cùng một VM đến recovery site thứ 2 hay nhiều recovery site.

Use case

- Disaster Recovery: SRM được thiết kế để giải quyết bài toán về khôi phục thảm họa hoặc chuyển đổi dự phòng không có kế hoạch từ trước. Đây là use case quan trọng nhất nhưng cũng ít được sử dụng nhất đối với SRM. Những lỗi không mong đợi đối với hệ thống thì không thường xuyên xảy ra nhưng khi chúng được phục hồi nhanh chóng là điều rất quan trọng với hoạt động kinh doanh của bất kỳ doanh nghiệp nào. SRM tự động hóa và điều phối việc khôi phục một phần hoặc toàn bộ hệ thống, đảm bảo thời gian khôi phục(RTO) là nhanh nhất.


- Disaster Avoidance: Đây là một use case phổ biến sử dụng trong trường hợp ngăn ngừa thảm họa. Nếu ta có thể dự tính trước thiên tai thảm họa như bão lũ có thể xảy đến với site chính. Kết hợp với Vmotion, ta có thể tắt các máy ảo và move sang site dự phòng, sao chép toàn bộ dữ liệu và khởi động theo lệnh các máy ảo/ ứng dụng tại site dự phòng để đảm bảo tính nhất quán và không mất dữ liệu.


- Planned Migration: Đây là use case phổ biến nhất – di chuyển máy ảo và ứng dụng giữa các site. Có thể áp dụng cho việc di dời trung tâm dữ liệu, cân bằng tải toàn cầu hoặc bảo trì site theo kế hoạch. SRM có khả năng di chuyển site một cách suôn sẻ, hỗ trợ kiểm tra toàn bộ quá trình di chuyển theo cách hoàn toàn không gây gián đoạn cho môi trường production. Ngoài ra cũng hỗ trợ stretched storage cho việc di chuyển không gây downtime.
- Upgrade & Patch Testing: Cung cấp site thử nghiệm để tiến hành kiểm tra bản vá và nâng cấp hệ điều hành. Site thử nghiệm là bản sao hoàn chỉnh của site chính được cấu hình với mạng cô lập để đảm bảo rằng việc thử nghiệm càng thực tế càng tốt, đồng thời không ảnh hưởng đến site chạy chính.

Kết luận:

Site Recovery Manager: thích hợp với các doanh nghiệp quy mô lớn, có nguồn ngân sách dồi dào, yêu cầu việc kinh doanh diễn ra liên tục, không gián đoạn, thời gian downtime hệ thống nhỏ nhất có thể (vài phút). Ngoài ra SRM cung cấp bộ giải pháp rất đa dạng không gây gián đoạn hệ thống trong các trường hợp phòng ngừa thảm họa chủ động, di dời DC, chạy thử nghiệm hệ thống. Tuy nhiên việc triển khai khá phức tạp và tốn kém, đòi hỏi doanh nghiệp có đội ngũ nhân lực trình độ cao để vận hành hệ thống.


Cloud DR tại Đại Hữu: phù hợp với toàn bộ khách hàng, doanh nghiệp cần một giải pháp phòng ngừa thảm họa, để khi hệ thống chính xảy ra sự cố thì hệ thống phụ sẽ turn-on thay thế, với thời gian khá ngắn( từ vài phút đến vài chục phút tùy vào mức độ thảm họa một phần hay thảm họa toàn phần). Đặc biệt, ưu điểm nổi trội của Đại Hữu Cloud DR là thời gian triển khai nhanh chóng với hạ tầng sẵn có và chi phí phù hợp, việc vận hành hệ thống khá đơn giản giúp doanh nghiệp dễ dàng tiếp cận hơn so với SRM.

Nếu còn điều gì thắc mắc hoặc quan tâm đến giải pháp Cloud DR tại Đại Hữu, vui lòng liên hệ hotline: 0888.7777.36 để nhận tư vấn chi tiết nhé.


Bài viết xem thêm

Đăng ký nhận bản tin