Tổng quan dịch vụ sao lưu dữ liệu và phục hồi thảm họa

1. Mở đầu

Hiện nay hoạt động của hầu hết các doanh nghiệp đều được đặt nền móng trên hạ tầng CNTT. Thành công của doanh nghiệp do đó phụ thuộc rất nhiều vào khả năng hoạt động, cung cấp ứng dụng một cách liên tục của nền tảng IT. Vấn đề càng trở nên quan trọng hơn, khi khả năng xảy ra những biến cố, thậm chí thảm họa ngoài ý muốn luôn luôn tiềm ẩn, có thể làm gián đoạn hoạt động, gây ra nhiều thiệt hại và rủi ro cho doanh nghiệp.

Khái niệm Sao lưu dữ liệu và phục hồi thảm họa (DR - Disaster Recovery) bao gồm các giải pháp và phương thức đảm bảo cho các ứng dụng IT hoạt động bình thường trong trường hợp có sự cố xảy ra. Để xây dựng dịch vụ phục hồi thảm họa một cách hoàn thiện, cần tích hợp nhiều giải pháp công nghệ khác nhau. Trong đó tạo bản sao dữ liệu là một mắt xích rất quan trọng, vì nó đảm bảo tính sẵn sàng, mức độ cập nhật và toàn vẹn cho dữ liệu.

2. Tầm quan trọng của dịch vụ phục hồi sau thảm họa

Trong thực tế, rất nhiều sự cố ngoài dự kiến có thể xảy ra với hệ thống IT trong quá trình hoạt động của doanh nghiệp, từ những sự cố nhỏ về phần cứng, phần mềm, lỗi con người, phá hoại cố ý, tác động của môi trường…đến những thảm họa đặc biệt lớn (điển hình như sự kiện khủng bố ngày 11 tháng 9 năm 2001 tại Mỹ hay thảm họa sóng thần Tsunami tại Đông Nam Á đầu năm 2005, xem Hình 1). Điều này cũng được phản ánh rất rõ ràng qua các thống kê về những nguyên nhân gây ra sự cố ngoài dự kiến, cũng như về mật độ xảy ra sự cố, thảm họa (ví dụ về số liệu cụ thể tại Mỹ được trình bày trong Hình 2 và Bảng 1).

 

Hình 1: Một số hình ảnh về thảm họa

Hình 2: Thống kê các nguyên nhân gây ra sự cố ngoài dự kiến, làm gián đoạn hoạt động IT của doanh nghiệp

Loại sự cố, thảm họa gây ảnh hưởng, mất mát dữ liệu

Mật độ xảy ra tính theo năm

Hỏa hoạn nhỏ

0.1-0.9

Hỏa hoạn lớn

0.01-0.09

Hỏa hoạn trầm trọng

0.001-0.009

Lũ lụt

0.01-0.09

Bão

0.05-0.5

Động đất

0.005-0.02

Mất nguồn điện

2-30

Lỗi phần cứng

0.2-1

Lỗi phần mềm

0.2-1

Lỗi nhân viên

0.1-5

Phá hoại từ bên ngoài

0.09-0.1

Đình công

0.009-0.1

Bảng 1: Mật độ xảy ra tính theo năm của một số loại sự cố

Nếu hoạt động liên tục của doanh nghiệp không được đảm bảo trước bằng dịch vụ phục hồi thảm họa, sẽ có rất nhiều chi phí lớn phát sinh khi có sự cố hoặc thảm họa thật sự xảy ra. Hoạt động của doanh nghiệp sẽ bị ngưng trệ, thậm chí tê liệt, gây tổn thất lớn về hoạt động tài chính, kinh doanh và thậm chí cả yếu tố con người.

Vì thế, doanh nghiệp cần đầu tư xây dựng kế hoạch và biện pháp dự phòng phục hồi thảm họa - DR hợp lý, tạo sự chuẩn bị chu đáo trước khi bất cứ sự cố, thảm họa nào có thể xảy ra. Về lâu dài, đi theo lộ trình như vậy sẽ ít chi phí về mặt kinh tế hơn so với phương thức xử lý mang tính chất “chữa cháy”, xảy ra sự cố, thảm họa rồi mới lo khắc phục hậu quả. Nói cách khác, để giảm thiểu ảnh hưởng hay gián đoạn hoạt động gây ra bởi bất cứ hoàn cảnh khách quan nào, doanh nghiệp phải đầu tư cho dịch vụ phục hồi thảm họa. Doanh nghiệp có thể tự xây dựng DR cho mình, hoặc doanh nghiệp có thể sử dụng dịch vụ DR của một nhà cung cấp dịch vụ chuyên nghiệp.

3. Trung tâm dữ liệu dự phòng - DR

Mô hình dịch vụ Trung tâm dữ liệu dự phòng - DR, dù của riêng doanh nghiệp hay của một nhà cung cấp dịch vụ chuyên nghiệp, đều được bắt đầu bằng việc xây dựng một trung tâm IT dành riêng cho mục đích phục hồi thảm họa (gọi là trung tâm dữ liệu dự phòng – DR site, hoặc Recovery site). Xét trên phương diện tổng quan, các đầu việc hạ tầng cần thực hiện để xây dựng một trung tâm dữ liệu dự phòng – DR site cũng tương tự như xây dựng một trung tâm dữ liệu (Datacenter) thông thường. Tuy nhiên, sẽ có thêm những giải pháp kỹ thuật chuyên dụng cần phải được tích hợp để phục vụ cho mục đích phục hồi hoạt động từ trung tâm dữ liệu chính sang trung tâm dữ liệu DR, điển hình như tạo bản sao dữ liệu, cơ chế tự động hóa phục hồi dữ liệu (xem Hình 3).

DRS là nhà cung cấp dịch vụ phục hồi thảm họa chuyên nghiệp có khả năng cung cấp những gói dịch vụ đảm bảo hoạt động liên tục cho doanh nghiệp với các mức độ cam kết dịch vụ và giá thành tối ưu nhất. Tùy theo nhu cầu cụ thể, từng doanh nghiệp sẽ lựa chọn gói dịch vụ thích hợp nhất cho mình. Chỉ với một trung tâm dữ liệu dự phòng – DR site backup được thiết kế và xây dựng hợp lý, DRS có khả năng cung cấp dịch vụ DR cho đồng thời nhiều doanh nghiệp có nhu cầu đảm bảo hoạt động liên tục.

Hình 3: Một mô hình hoạt động điển hình của dịch vụ phục hồi thảm họa với trung tâm chính (Primary Site) và trung tâm DR (Recovery Site)

Xây dựng trung tâm dữ liệu dự phòng sau thảm họa (DR) là một quá trình gồm nhiều giai đoạn và đầu việc cần triển khai, bao gồm:

- Khảo sát, lựa chọn địa điểm đặt trung tâm dữ liệu dự phòng DR

- Xây dựng cơ sở hạ tầng nói chung và hạ tầng IT cho trung tâm dữ liệu dự phòng DR, tạo kết nối giữa trung tâm dữ liệu dự phòng DR và các trung tâm dữ liệu chính của doanh nghiệp có nhu cầu được cung cấp dịch vụ phục hồi thảm họa

- Tích hợp các thiết bị phần cứng và phần mềm cần thiết tại trung tâm dữ liệu dự phòng DR, lựa chọn và triển khai các biện pháp kỹ thuật cần thiết cho chu trình phục hồi thảm họa

- Vận hành thử nghiệm và điều chỉnh hoạt động của trung tâm dữ liệu phục hồi sau thảm họa DR, trước khi đưa vào sử dụng.

4. Các phương pháp có thể áp dụng để tạo bản sao dữ liệu

4.1. Tính thiết yếu của tạo bản sao dữ liệu

Một trong những vấn đề kỹ thuật chính cần được giải quyết khi xây dựng trung tâm dữ liệu dự phòng - DR nói riêng và cung cấp dịch vụ DR nói chung là sử dụng phương pháp nào để có thể tạo bản sao dữ liệu của doanh nghiệp từ môi trường hoạt động chính của họ về trung tâm DR một cách toàn vẹn. Đây là một trong những vấn đề mấu chốt quyết định sự thành công của dịch vụ DR, vì bất kỳ khi nào tại môi trường hoạt động chính xảy ra sự cố hoặc thảm hoạ, dữ liệu cần phải được cung cấp từ trung tâm DR để đảm bảo hoạt động liên tục cho doanh nghiệp. Dữ liệu tại trung tâm DR do đó phải đảm bảo được tính toàn vẹn và cập nhật, có nghĩa là đó phải là bản sao chính xác nhất và mới nhất của dữ liệu tại môi trường hoạt động chính, tính đến thời điểm xảy ra thảm họa.

4.2. Tạo bản sao dữ liệu bằng băng từ

Một trong những phương pháp đơn giản và có giá thành thấp nhất để tạo bản sao dữ liệu về trung tâm dữ liệu dự phòng DR là thực hiện sao lưu dữ liệu tại môi trường hoạt động chính ra băng từ. Sau đó vận chuyển các băng từ về trung tâm dữ liệu dự phòng DR để lưu trữ bảo quản. Nhược điểm của cách làm này là tuy có dữ liệu dự phòng tại trung tâm dữ liệu dự phòng DR (chứa trong các băng từ), nhưng đó không phải là dữ liệu cập nhật mới nhất. Trung tâm dữ liệu dự phòng DR thường được đặt ở xa môi trường hoạt động chính, dẫn đến việc chuyên chở băng từ đến trung tâm dữ liệu dự phòng DR sẽ tốn nhiều thời gian (tính bằng giờ hoặc thậm chí bằng ngày). Như vậy, tại một thời điểm bất kỳ, bản dữ liệu trong băng từ có ở trung tâm dữ liệu dự phòng DR sẽ không phải là bản sao mới nhất của dữ liệu tại môi trường hoạt động chính.

Trên thực tế, phương pháp lưu bản sao dữ liệu dùng băng từ như trên là phương pháp phục hồi thảm họa có mức đánh giá thấp nhất về mặt chất lượng (xem Hình 4), xét trên tiêu chí về thời gian phục hồi (Recovery Time Objective) và tiêu điểm phục hồi (Recovery Point Objective). Tiêu chí thứ nhất xác định khoảng thời gian ngừng hoạt động lớn nhất có thể chấp nhận được đối với doanh nghiệp là bao nhiêu. Hay nói cách khác đó là yêu cầu về thời gian cần thiết để phục hồi hoạt động sau khi xảy ra sự cố hoặc thảm họa. Tiêu chí thứ hai liên quan đến sự đánh giá mức độ thiệt hại và ảnh hưởng đến hoạt động kinh doanh khi bị mất dữ liệu, tức là mức độ mất dữ liệu như thế nào được coi là vẫn chấp nhận được trong trường hợp xảy ra sự cố, thảm họa. Các đại lượng liên quan trong cả hai tiêu chí (thời gian phục hồi và lượng dữ liệu bị mất) càng nhỏ thì chất lượng của dịch vụ dữ liệu dự phòng DR càng cao.

 

Hình 4: Phương pháp tạo bản sao dữ liệu sẽ ảnh hưởng tới chất lượng dịch vụ dữ liệu dự phòng DR

Theo dõi chiều mũi tên sang trái trong Hình 4, có thể thấy lượng dữ liệu bị mất khi xảy ra sự cố thảm họa sẽ tăng dần (cũng có nghĩa là chất lượng dịch vụ DR giảm dần) theo thứ tự các phương thức tạo bản sao dữ liệu như sau: phương thức đồng bộ, phương thức không đồng bộ, tạo bản sao theo định kỳ, và cuối cùng là tạo bản sao bằng băng từ.

4.3. Tạo bản sao dữ liệu bằng phần mềm chuyên dụng

Hiện nay, lưu trữ tập trung và sự thiết lập mạng lưu trữ riêng biệt SAN (Storage Area Networks) sử dụng giao thức truyền tải quang (FC: Fibre Channel), cùng các giải pháp hợp nhất các thiết bị lưu trữ (nhiều khi được nhắc đến dưới khái niệm ảo hoá lưu trữ) đang là xu hướng chính cho công nghệ lưu trữ. Ngoài ra, về kết nối mạng thì nền hạ tầng mạng IP đã rất phổ biến. Trên nền tảng công nghệ như vậy, biện pháp tạo bản sao dữ liệu hữu hiệu đang dần chiếm ưu thế là dùng các phần mềm chuyên dụng, sử dụng các kết nối FC hoặc tận dụng mạng IP sẵn có. Trên thực tế, sử dụng các công cụ phần mềm chuyên dụng để tạo bản sao dữ liệu đang là chiều hướng được áp dụng ngày càng rộng rãi.

5. Tạo bản sao dữ liệu bằng phần mềm chuyên dụng: mô hình hoạt động và một số sản phẩm

5.1. Mô hình hoạt động chung

Tính năng tạo bản sao dữ liệu có thể được triển khai theo nhiều cách khác nhau.Trong cách thứ nhất, phần mềm chuyên dụng được cài đặt lên máy chủ và thực hiện tạo bản sao cho dữ liệu được chứa trong hệ thống lưu trữ dưới quyền quản lý của máy chủ đó. Cách thứ hai là khi phần mềm tạo bản sao là tính năng có sẵn của hệ thống lưu trữ và có thể được kích hoạt bởi công cụ phần mềm quản lý trực tiếp hệ thống lưu trữ. Một khi tính năng này đã được kích hoạt, dữ liệu của nhiều ứng dụng khác nhau (chạy trên nhiều máy chủ khác nhau) đang được lưu trữ tập trung trên hệ thống lưu trữ sẽ đều được tạo bản sao.

Trong cách thứ ba, phần mềm tạo bản sao dữ liệu là tính năng được tích hợp vào thiết bị chuyển mạch/ thiết bị chuyên dụng trong mạng lưu trữ SAN.

Có hai phương thức chính để thực hiện chu trình tạo bản sao cho dữ liệu: phương thức tạo bản sao đồng bộ (gọi tắt là phương thức đồng bộ, synchronous data replication) và phương thức tạo bản sao không đồng bộ (gọi tắt là phương thức không đồng bộ, asynchronous data replication).

Hình 6: Nguyên lý tạo bản sao không đồng bộ

Trong phương thức đồng bộ (xem Hình 5), khi một ứng dụng kích hoạt phép ghi dữ liệu vào thiết bị lưu trữ tại môi trường hoạt động chính, dữ liệu đó sẽ được gửi sang trung tâm dữ liệu dự phòng DR và phép ghi vào thiết bị lưu trữ tại trung tâm dữ liệu dự phòng DR cũng được bắt đầu. Khi phép ghi ở trung tâm dữ liệu dự phòng DR kết thúc thành công, sẽ có xác nhận được gửi về trung tâm dữ liệu chính. Chỉ khi nào ứng dụng nhận được xác nhận này thì phép ghi dữ liệu của ứng dụng mới được coi là kết thúc và các phép ghi tiếp theo mới có thể được thực hiện. Với phương thức tạo bản sao đồng bộ, dữ liệu tại trung tâm dữ liệu chính và tại trung tâm dữ liệu dự phòng DR sẽ luôn được giữ hoàn toàn giống nhau. Vì thế nếu có sự cố hay thảm họa xảy ra với hệ thống IT tại trung tâm dữ liệu xử lý chính, dữ liệu tại trung tâm dữ liệu dự phòng DR đảm bảo sự toàn vẹn và cập nhật hoàn hảo. Tuy vậy, nhược điểm cơ bản của phương thức đồng bộ cũng xuất phát từ chính nguyên lý hoạt động của nó. Ứng dụng sẽ phải ngừng hoạt động và “chờ” đến khi phép ghi được thực hiện xong ở trung tâm dữ liệu dự phòng DR mới có thể tiếp tục. Khoảng thời gian “chờ” này có thể trở nên đáng kể khi khoảng cách giữa trung tâm dữ liệu xử lý chính (DC) và trung tâm dữ liệu dự phòng (DR)các  xa hàng chục km và/hoặc công nghệ và dung lượng đường truyền không cao.

Trong phương thức tạo bản sao không đồng bộ (xem Hình 6), sau khi thực hiện phép ghi tại trung tâm dữ liệu chính, ứng dụng tiếp tục hoạt động ngay mà không cần chờ kết quả xác nhận thành công về phép ghi thực hiện tại trung tâm dữ liệu dự phòng DR. Mặc dù có ưu điểm là không làm gián đoạn hoạt động của ứng dụng, nhưng phương thức không đồng bộ gây ra sự chậm trễ nhất định giữa dữ liệu lưu trữ tại trung tâm dữ liệu dự phòng DR và dữ liệu tại trung tâm dữ liệu chính. Điều này dẫn đến tình trạng khi xảy ra sự cố, thảm họa ở trung tâm dữ liệu chính thì một số dữ liệu vẫn chưa được sao chép sang trung tâm dữ liệu dự phòng DR. Và như vậy, cho dù chu trình phục hồi thảm họa từ trung tâm dữ liệu dự phòng DR hoạt động tốt, chất lượng của dịch vụ phục hồi thảm hoạ vẫn không tốt vì có một số dữ liệu đã bị mất mà không có bản sao.

Ngoài ra, còn tồn tại phương thức tạo bản sao định kỳ (periodic data replication), tức là việc sao chép dữ liệu từ trung tâm dữ liệu chính sang trung tâm dữ liệu dự phòng DR chỉ được kích hoạt tại những thời điểm đã được xác định trước.

Có thể tham chiếu trên Hình 4 (chiều mũi tên sang trái) sự đánh giá về mặt hiệu năng các phương thức tạo bản sao dữ liệu nhắc đến ở trên. Phương thức đồng bộ cho phép thời gian phục hồi ngắn nhất, nhưng như đã phân tích, chỉ khả thi khi tốc độ đường truyền cao, thường là khi có đường cáp quang kết nối trực tiếp giữa hai trung tâm dữ liệu chính và trung tâm dữ liệu dự phòng DR. Chi phí đầu tư ban đầu do đó đòi hỏi lớn hơn nhiều so với phương thức không đồng bộ, khi mà hạ tầng mạng IP sẵn có có thể được tận dụng để tiết kiệm chi phí.

5.2. Một số sản phẩm phần mềm tạo bản sao dữ liệu trên thị trường

Chúng ta có thể chia các sản phẩm phần mềm tạo bản sao dữ liệu chuyên dụng làm hai nhóm chính. Nhóm thứ nhất gồm các phần mềm là tính năng được tích hợp trong các thiết bị/công nghệ lưu trữ. Mỗi sản phẩm phần mềm trong nhóm này chỉ hoạt động với những thiết bị/công nghệ lưu trữ nhất định mà nó được thiết kế kèm theo. Đại diện của nhóm sản phẩm phần mềm này bao gồm các phần mềm chuyên dụng của các hãng sản xuất thiết bị lưu trữ lớn như IBM, HP, SUN, EMC vv…Đây là nhóm các phần mềm chuyên dụng gắn liền với thiết bị/công nghệ lưu trữ. Nhóm thứ hai bao gồm những sản phẩm phần mềm của các nhà cung cấp độc lập, có thể hoạt động trong các môi trường hỗn hợp với nhiều chủng loại thiết bị lưu trữ có xuất xứ từ nhiều nhà sản xuất khác nhau. Bảng 2 liệt kê một số phần mềm thông dụng đang có mặt trên thị trường theo cách phân loại trên.

Phần mềm gắn liền với thiết bị/công nghệ lưu trữ

Phần mềm của các nhà cung cấp độc lập

 

Tên phần mềm

Dùng cho thiết bị/công nghệ lưu trữ

Tên phần mềm

Tên nhà cung cấp

SnapMirror

Dòng thiết bị lưu trữ NAS của IBM & NetApp

Veritas Volume Manager (VVM)

Symantec

Enhanced Remote Mirroring

Dòng thiết bị lưu trữ DS4000 của IBM

Veritas Volume Replicator (VVR)

Symantec

Metro Mirroring

Dùng trong công nghệ ảo hóa lưu trữ IBM SAN Volume Controller

QiNetix Continuous Data Replicator (CDR)

CommVault

HP OpenView Storage Mirroring

Lưu trữ của các máy chủ Windows, các thiết bị NAS của HP

NetVault Replicator

 

Bakbone Software

 

HP StorageWorks

Continuous Access EVA

Dòng sản phẩm tủ đĩa HP

EVA (Enterprise Virtual Array)

 

 

Sun StorageTek Availability Suite 4.0 Remote Mirror

Lưu trữ của các máy chủ chạy hệ điều hành Solaris

 

 

Sun StorEdge Availability Suite 3.2 Remote Mirror

Lưu trữ của các máy chủ chạy hệ điều hành Solaris

 

 

EMC RepliStor

Lưu trữ của các máy chủ chạy hệ điều hành Windows

 

 

EMC MirrorView

 

Dòng thiết bị lưu trữ EMC CLARiiON

 

 

EMC SRDF (Symmetrix Remote Data Facility)

Dòng thiết bị lưu trữ EMC Symmetrix

 

 

EMC Open Replicator for Symmetrix

Dòng thiết bị lưu trữ EMC Symmetrix, EMC CLARiiON và các thiết bị của các hãng IBM, HP, Hitachi Data Systems

 

 

 

Bảng 2: Một số phần mềm chuyên dụng cho mục đích tạo bản sao dữ liệu

Mặc dù có khá nhiều phần mềm tạo bản sao dữ liệu chuyên dụng trên thị trường, nhưng sự lựa chọn phù hợp cho từng trường hợp cụ thể phải dựa trên xem xét và phân tích nhiều yếu tố liên quan. Trong đó một số yếu tố chính bao gồm:

- Khả năng chịu mất dữ liệu, yêu cầu về thời gian phục hồi hoạt động, và khả năng đầu tư tài chính cho dịch vụ phục hồi thảm họa của doanh nghiệp

- Tính năng hệ thống lưu trữ cụ thể đang hoạt động tại trung tâm dữ liệu chính của doanh nghiệp và hệ thống lưu trữ (sẽ) hoạt động tại trung tâm dữ liệu dự phòng DR

- Lượng dữ liệu sẽ cần được tạo bản sao

- Loại hình kết nối giữa môi trường hoạt động chính và trung tâm dữ liệu dự phòng DR: đường kết nối IP thông thường hay đường truyền cáp quang? Băng thông của đường truyền?

- Độ tương thích của phần mềm với hệ thống lưu trữ đang hoạt động

- Giá thành bản quyền của sản phẩm phần mềm chuyên dụng

6. Kết luận

Tầm quan trọng của dịch vụ phục hồi thảm họa cũng như của mắt xích tạo bản sao dữ liệu trong khuôn khổ dịch vụ này. Tạo bản sao dữ liệu nhằm đảm bảo nếu có sự cố, thảm họa xảy ra với môi trường hoạt động chính, doanh nghiệp sẽ có nguyên vẹn những dữ liệu cần thiết từ trung tâm DR để tiếp tục hoạt động của mình.

DRS là nhà cung cấp dịch vụ cho thuê trung tâm dữ liệu dự phòng sau thảm họa với hệ thống Trung tâm Dữ liệu tiêu chuẩn Tier 3, đội ngũ chuyên gia chuyên nghiệp và giàu kinh nghiệm. DRS sẽ đem lại cho khách hàng một phải pháp phù hợp nhất, tận dụng được tối đa các thiết bị hiện có của doanh nghiệp, tiết kiệm tối đa chi phí đầu tư...

 

 

Bài viết liên quan

Hotline tư vấn miễn phí
Sale & Support 24/7

HÀ NỘI

TP HCM