バックアップが失敗した際の原因と対処法 - JUSTPLAYER インターネットサービス

Top / サポート情報 / マニュアル / ハイレスポンスプライベートクラウド / 仮想マシンのバックアップと復元 / バックアップが失敗した際の原因と対処法

バックアップが失敗した際の原因と対処法

このページでは、バックアップ(レプリケーション)が失敗した際の原因と対処法をご案内しています。

仮想マシンのバックアップが失敗またはスキップされた際に、Xen Orchestraのサーバーから「Backup report」メールが届きます。この状態が起きた場合でも仮想マシンのサービスは継続されますが、万一、Xenのホストに障害が発生し、ストレージの救出ができなくなった場合、復元ポイントがなくなる恐れがあります。

バックアップの失敗は、主に、3つの原因により発生します。

  1. ローカルストレージの残り容量が足りないとき
  2. 仮想マシンのスナップショットが多いとき
  3. 仮想マシンのディスクサイズが大きくなりすぎたため、RPO=1時間(1時間に2度)のバックアップでは間に合わなくなったとき

下記に、エラー文ごとの原因と対処法を記載していますので、お客様で対処が可能なものはご対応をお願いいたします。下記に記載している以外のエラーについては当社にて対応いたします。

一時的なエラー以外に何度もエラーメールが届いたり、お客様にて問題が解決しない場合は、お手数ですが当社サポートまたは担当営業へご連絡ください。

Backup reportについて

送信元メールアドレスは「sysadmin@justplayer.com」、件名は「[Xen Orchestra] failure(or skipped) − Backup report for バックアップジョブ名」です。メール本文に、該当のバックアップジョブの情報と、エラー文が記載されていますのでご確認ください。

必要とされるディスク容量について

Xenで必要とするディスク容量は、現時点で利用しているディスク容量だけでなく、仮想マシン内部のデータ更新差分にも影響します。そのため、一概に「何ギガバイトあれば良い」と判断する事はできません。

これはXenのスナップショットが、バッキングストアを要求するタイプのスナップショットシステムのためです。スナップショットをとってから次のスナップショットまでの間の更新差分が大きくなると、消去する時に結合処理が行われますが、このとき大きなディスク容量が必要になります。

下記の問題は概ね、システムが要求するディスク容量対して、必要なディスク容量が足りていないことが問題の素因となっています。

SR_BACKEND_FAILURE_44は純粋にディスク容量が足りない時のエラーですが、SR_BACKEND_FAILURE_109はマージ処理後の削除作業がディスクがたりない為に失敗するなど、全てが概ねディスクの残り容量と関連していることに注意が必要です。また、ディスクI/Oが飽和している場合にも起きる可能性があります。

ディスクの節約は、不要な仮想マシンを消す、不要なバックアップを辞める、またはホストの全体的な負荷を平滑化するなどがありますが、本システムによるインシデント時の復旧作業や時間(RTO)が迅速であるメリットも捨てきれないと思います。ご利用の契約によって、ディスク容量の増設可否も異なります。ディスク(SSD)の増設が必要な場合は、お手数ですが当社サポート、または担当営業までご相談ください。

エラーの原因と対処

エラー文
Failure Error: SR_BACKEND_FAILURE_44(, There is insufficient space, )
 原因
ストレージ容量がいっぱいになっている。
一次対応者
お客様
 対処法
  • 不要なスナップショットを消して空き容量を確保します。
    • 不要なスナップショットの削除については、こちらをご参照ください。
  • ストレージ容量の空きを十分に確保するか、不要な仮想マシンのバックアップをしないようにします。
    • バックアップ対象から除外する場合はこちらをご確認ください。
エラー文  
Failure Error: SR_BACKEND_FAILURE_109(, The snapshot chain is too long, )
 原因
対象の仮想マシンのスナップショット数が多い。
スナップショットは、不可視の物も含め、1つの仮想マシンで30個までしか作成ができません。
 一次対応者
お客様
 対処法
ストレージの一覧から該当のストレージを開き、「Disks」タブから不要なスナップショットを削除します。
不要なスナップショットの削除については、こちらをご参照ください。
エラー文
Error: the job (XXXXXXXX-XXXX-XXXX-XXXX-XXXXXXXXXXXX ) is already running
※()内には、お客さまごとに異なる文字列が入ります。
 原因
ジョブがすでに実行されている。
ジョブがすでに実行されている際に新しいジョブが実行されるとスキップされます。
一次対応者
お客様
 対処法
当該エラーが発生する時間帯はバックアップ設定を避けるなど、バックアップスケジュールの調整をします。
エラー文  
Skipped Reason: (unhealthy VDI chain) Job canceled to protect the VDI chain
 原因
対象の仮想マシンのスナップショット数が多い。もしくは内部的に不可視のスナップショットが存在する。
スナップショットは、不可視の物も含め、1つの仮想マシンで30個までしか作成ができません。
 一次対応者
お客様
 対処法

ストレージの一覧から該当のストレージを開き、「Disks」タブから不要なスナップショットを削除します。
不要なスナップショットの削除については、こちらをご参照ください。

  • スナップショットが存在しないにもかかわらず、エラーが発生する場合
    希に発生する理由は、見えないスナップショットが存在している可能性があり、Xenのhostの再起動がたまたまバックアップ中に重なり、正常に復帰できなかったなどが考えられます。

    この場合は、以下の方法でディスクの統合をする必要があります。クローンのコピー時間=サービスの停止時間となりますので、実行する際はご注意ください。
  1. 仮想マシンを停止します。
  2. 「停止した仮想マシン」から、クローンを作成します。
    手順は、「バックアップデータから復元する」のと同様のイメージです。
  3. クローンを起動します。
  4. 問題が無ければ「停止した仮想マシン」を削除します。

ディスクの残り容量が少ない場合に発生するため、このエラーを防ぐにはストレージ容量の空きを十分に確保してください。

クラウド型リモートVPNサービス xen-orchestra.html 採用情報 TeraCLOUD 清水エスパルス
Oracle GOLD Partner

ジャストプレイヤーはオラクル認定ゴールドパートナーです。
SPARCをはじめ、オラクル社の製品を用いたクラウド環境の構築、運用をサポートします。