バックアップとストレージ冗長化 - JUSTPLAYERインターネットサービス

Top / サポート情報 / 技術資料 / バックアップとストレージ冗長化

本システムにおける、ストレージのインシデント(事故)想定

本システムは、下記のようなインシデント(事故)が発生してもデータが守られるように設計されています。

  • 仮想サーバ内で論理的な破損(ファイル削除、間違ったデータ書き換え)が起きた場合
    • 仮想サーバ内のスナップショットからのファイル単位の復元が可能。
  • 仮想サーバ内でOSのブートが不可能なほどの破損が発生した場合
    • 収容サーバ(物理サーバ)レベルでのスナップショットにより、復元が可能。(※弊社オペレータによる対応となります)
  • 収容サーバ(物理サーバ)に致命的な破損(CPU、メモリ、マザーボード、ネットワークアダプタ等)が発生した場合
    • 弊社オペレータが別の収容サーバへのマイグレーションを行います。
  • 収容サーバにて、メンテナンス作業中のオペレーションミスや管理プログラムの不具合等によって重要なデータ破壊が発生した場合
    • ストレージサーバのスナップショットからデータの復元が可能。
  • ストレージサーバにて、メンテナンス作業中のオペレーションミスや管理プログラムの不具合等によって、重要なデータ破壊が発生した場合
    • 冗長化された別ストレージサーバが継続してサービスを提供します。サービスの瞬間停止(通常5分以内)は発生しますが、長時間にわたるサービスダウンは発生しません。また、この障害は別拠点バックアップサーバのデータには影響しません。
  • プライマリDCを破壊する災害レベルの拠点破壊がおきた時には、バックアップデータセンターに保全されているデータから復元を行います。復元は災害状況によってことなります。

お客様によるデータのバックアップの勧め

本システムは上記のように、多重のデータ冗長化構造によってデータが保護されております。

しかしながら100%のデータ保証はできません。システムには常に未知の障害がありえます。

お客様ご自身の手でもバックアップをすることを強くお勧めします。

  • root権のあるIaaSならば、rsyncやzfs sendによるデータバックアップ
  • プレミアムWEBサービスのようなPaaSなら、ftpやsftp等によるデータバックアップ。
  • WIKIPLUSのようなSaaSならば、ソフトウェアで用意されているデータのコピーや、コンテンツのコピーなど。

マルチレイヤーでのスナップショット

本システムを実現するために、下記のようなサーバ構築を行っています。

仮想サーバ内のスナップショット

ジャストプレイヤー・クラウドの仮想サーバは、仮想サーバレイヤーでストレージのスナップショットが作成されています。

ストレージはZFSのCopy On Write(書き換えの時は別の場所に作る方式)機能で、増分・差分が保存されていきます。スナップショットが取られるとその瞬間のディスクイメージが保存されます。このスナップショットの瞬間をいつでも参照することができ、かつ、いつでもロールバックすることができます。

スナップショット.png 

このスナップショットが、出荷時では日単位、週単位、月単位で取られていき、ストレージのご利用容量の70%を越えると古い物から順に削除されていきますので、ユーザは安心してストレージを利用することができます。

スナップショットに保全されたデータは、ファイルの削除コマンド(rm等)やftpなどのファイル削除で消すことはできません。したがってスクリプトのバグなどによって一括でディスクを丸ごと消してしまうような障害にも耐えることができます。

このほか、これに連動してブート環境(beadm)という機能があり、仮想サーバの現在の状態を保全する機能があります。この機能を利用することで、いつでも今の瞬間のブート環境を保全できます。お客様の仮想サーバのメンテナンスの時には、ブート環境を必ず作成しておくようにすれば、万一メンテナンスが失敗した際にも、安心して元の環境に戻ることができます。

zfsの削除はzfs destroyで行います。細心の注意を払って行ってください。

※ 弊社メンテナンス時も自動的にその時点のスナップショットを作成いたします。

ストレージレイヤーのスナップショット

SANの層でも日単位、週単位、月単位でスナップショットを保全しています。

したがって、万が一、弊社オペレータのミスや管理システムにミスにより仮想化システム上でzfsのファイルシステムを破壊してしまったとしても、ストレージの層にあるスナップショットからデータの復元が可能になります。またお客様都合により仮想サーバ内からファイルシステムを破壊してしまったとしても、SAN層のスナップショットからロールバックが可能です(お客様都合のデータ復元の場合は、別途、弊社所定の作業費を頂きます)。

ジャストプレイヤークラウドでは、マルチレイヤーのスナップショットによる防御により、論理的な障害からデータ破壊の防御が行われています。

冗長化されたストレージサーバと、別拠点ストレージ・サーバ

ストレージミラー.png 

万が一、何らかのプログラムのバグやオペレーションミス、その他の未知の障害によって、SAN層でファイルシステムを破壊してしまったらどうなるか?

SAN層のスナップショットは、冗長化したストレージサーバ単位で行っていますので、万が一、何らかの問題で1つのストレージサーバを破損してしまったとしても、もう1台のストレージサーバからデータ復元が可能になっています。

加えてストレージイメージは物理的に離れた別拠点データセンター(京都)のストレージサーバにも保存されています。自然災害などにより、プライマリデータセンターが物理的に大きなダメージを負ってしまった場合でも、データの保全が行われることになります。