ここでは、レプリケーション、バックアップ、アーカイブがどのように違うのか、解説します。
アーカイブとは?
まずはアーカイブについて説明します。
アーカイブは簡単に言うと、後の参照用に作成する特定のデータの集まりです。
アーカイブは一般的に、変更できないようになっており、通常のデータと同様に活用する事もまたできません。
長期保管のためにデータをコピーしておくのがアーカイブ、と考えると分かりやすいですよね?
アーカイブが必要な理由
特に最近「メールアーカイブ」というキーワードを耳にしますが、アーカイブの目的の1つが、法令準拠というものです。
最近では、2012年に関税法が改定され、これまで全て紙で用意しておく必要のあった輸出入取引に関わるやり取りが、電子メールでも保管できるようになりました。
保管する期間は最長7年で、改ざんされていない事や必要に応じて閲覧できる状態である事が必要です。
他にも、情報漏えいなどに備えた証拠保全といった、調査目的や、アーカイブを行う事による抑止効果なども期待されています。
バックアップとは?
バックアップは、現在の状態のデータのコピーです。
バックアップの目的は主に、システム障害時などに直前の状態に戻すといった可用性です。
バックアップ製品の多くは、フルバックアップと差分バックアップの2つの機能をもっています。
バックアップを行う際には、月に数回や週末などに、定期的なフルバックアップを取り、平日などには追加データ分のみを差分バックアップするという、スケジュールバックアップが一般的です。
サーバーの障害発生時などには、1日前のデータであれば復旧が可能になります。
スケジュールバックアップは、データの完全性という意味では最も確実な方法と言われており、ClusteringReplicaにも、スケジュールバックアップ機能が搭載されています。ただし、スケジュールバックアップの場合、次のような問題点も挙げられます。
- 一日前まで遡ったデータしか戻せない
- データ量が多いため、スケジュールバックアップが数時間にも及ぶ。次のバックアップまで、意図的に間隔を空けなくてはならない
- バックアップと同じ時間がリストアにも必要になるため、リストアしている間業務継続ができない
レプリケーションとは?
ここで登場するのがレプリケーションですが、レプリケーションとは、サーバーを、同じネットワーク内、もしくは別の(例えば日本と中国などの)遠隔地に設置して、データをリアルタイムにコピーする技術です。
リアルタイムでデータをコピーするので、直近のデータを、短時間にリストアできるのです。
また、遠隔地にデータコピーが行えるので、レプリケーション製品をディザスタ・リカバリとして検討されるケースも多くあります。
更に、業務の継続を実現するHAクラスタリング/フェイルオーバーにおいても、サーバーが切り替わった際、新サーバーは元のサーバーと同じデータを持ち、継続してサービス提供する必要が生じるので、レプリケーション技術が併せて必要になります。
もちろん、ClusteringReplicaには、HAクラスタリングとレプリケーション機能の両方が搭載されているため、お客様の運用に合わせて柔軟にお使い頂けます。
レプリケーションの説明を聞くと、バックアップは必要?と思うかも知れませんが、必要です。レプリケーションの問題は次のような点です。
- バックアップと違って数世代のバックアップデータを持つ事ができない
- 差分データを常に同期し合うため、ネットワークやシステムに常時負荷がかかる
- 設定ミスやウィルス感染などの状態もリアルタイムに複製されてしまう
アーカイブ/バックアップ/レプリケーション比較表
アーカイブ | バックアップ | レプリケーション | |
---|---|---|---|
目的 | メールなど、特定の種類のデータの長期保存を目的としており、数年間単位で別のシステムにデータをコピーしておきます。 | 複製データの完全性を目的としており、一日前のメールデータなど、一定時間を経たデータ復旧が行えます。 | 障害発生時にもダウンタイムなく復旧する、継続性が目的で、データが更新される度に、リアルタイムで別サーバーへ更新データを複製します。 |
必要なもの | アーカイブ用のサーバーと、アーカイブデータを保持するのに十分なディスク容量又は外部デバイスが必要です。 | テープドライブなどの外付けデバイスやディスクなど、複製を保存する場所が必要になります。 | メインで稼働しているサーバーと同等のサーバーが必要で、一般的には導入コストが1台で稼働している場合の2倍必要になります。 |
主な用途 | アーカイブは、証拠保全や法令準拠の目的での利用が多く、他にもクライアントのメールバックアップで使用される場合などもあります。 | バックアップは、クライアント端末から影響度の高いサーバーまで、組織内の全ての機器で使われます。 | レプリケーションは、停止してしまった場合に影響度の高いサーバーで使われます。 |