Solaris SPARC Private Cloud(SSPC)のストレージベストプラクティス

Top / デザインパターン / Solaris SPARC Private Cloud(SSPC)のストレージベストプラクティス

Solaris SPARC Private Cloud(SSPC)は、Enterprise Storage、Backup Storage、Inter Connected Storageに対応し、オンプレミスと変わらない可用性や、速度の追求が可能です。

2系統のEnterprise Storage(ES)で冗長する方法

2系統のESを組み合わせることにより、冗長構成が可能です。これにより片方のESに障害が起きた場合でも、動作を続ける事が可能となります。

Active-ActiveのHA構成

ESのActive-Activeの最大のメリットは、データの一貫性(Consistency)です。

たとえば、どちらか一つのESがハードウェア障害を起こした場合でも、もう一系統のESが存在することで、動作しつづけることができます。障害復旧後は、ZFSのResilver機能により、片側ダウンからの差分のみを同期させて、元の状態にもどすことができます。

 正常時、データは2台のストレージに同時に書き込みます。 
正常時、データは2台のストレージに同時に書き込みます。

 片方のストレージにアクセスできない場合でも、もう一方のストレージでシステムを稼働します。 
片方のストレージにアクセスできない場合でも、
もう一方のストレージでシステムを稼働します。

 

マルチレイヤでの冗長化

ESB自体の冗長利用は、マルチレイヤで組み合わされた「データ冗長化」を意味します。

  • ESBを2系統束ねることによる、ES自体の冗長化
  • ES内のNVMe SSDを用いたRAID-Z2(Double Parity)による冗長化
  • NVMe SSD内部のNANDシリコンレベルの冗長化(RAIN)

この手法はデータの冗長度が極めて高いながらも、可用性の担保がされていることが特徴です。

LDOMインスタンス内のデザインパターン

ESはブロックストレージ切り出すことができ(これをESBという)、SSPCではLDOMインスタンスをESBからブートさせることが可能です。

LDOMインスタンス内のOS(Solaris11.4、あるいはSolaris10)内では、ZFSで束ねられたiSCSIの2つのストレージからブートされているように見えており、これらが2つがミラーリングされています。

1系統のEnterprise Storage(ES)と、
1系統のBackup Storage(BS)でレプリケーションする方法

Active - Stand-byの冗長構成

1系統のESと、1系統のBSを組み合わせることによる冗長方式は、Fail Overすることができないため、ESの障害には弱い問題がありますが、データはRPOの範囲で保持することが可能です。

 

A-S.png通常、ESに読み書きを行い、
定期的にBSへRPOでレプリケーションする

ダウンタイムとリカバリ

ESにハード障害が起きると、ESに収容するLDOMインスタンスは全停止します。ただし、ESは内部で、

  • ES内のNVMe SSDを用いたRAID-Z2(Double Parity)による冗長化
  • NVMe SSD内部のNANDシリコンレベルの冗長化(RAIN)

が行われているため、ESが復旧されると、サービスの再開が可能になります。

BSへは、RPOの頻度でバックアップが行われ、ESのデータ復旧が不可能な事象が発生する場合には、BSからデータをRTOの時間で復元ができるように設計されます。

またBSは、異なる拠点に設置することも可能です。

そのため、RTOは同一拠点では短く、異拠点では長くなる特徴があります。

 

LDOMインスタンス内のデザインパターン

ESはブロックストレージ切り出すことができ(これをESBという)、SSPCではLDOMインスタンスをESBからブートさせることが可能です。

LDOMインスタンス内のOS(Solaris11.4、あるいはSolaris10)内では、ZFSで束ねられたiSCSIのストレージからブートされているように見えています。

2系統のEnterprise Storage(ES)で冗長、
1系統のBackup Storage(BS)でレプリケーションする方法

2系統のESを組み合わせることにより、冗長構成が可能です。これにより片方のESに障害が起きた場合でも、動作を続ける事が可能となります。

また、大震災などでリージョン障害が起きた場合でも、別拠点のBSでデータを保持することが可能です。

Active-ActiveのHA構成に、Stand-byを追加する

基本的にはActive-ActiveのHA構成の特徴をそのまま持ち、可用性が極めて高い設計思想となっています。

これに加えて、異なるリージョンをInter Regional Fabricで接続し、レプリケーションを組み合わせていることが特徴です。

A-A-S.png

この設計では、Active - Activeの設計思想をそのまま流用しつつ、異なるリージョンにもデータを残したい時に行われます。

クラウドが設置されているデータセンターが、壊滅するクラスの障害が起きた場合でも、データだけは異なるリージョンに残すことができるできるメリットがあります。

通常、クラウドが設置されているデータセンターは、地震にも強い、免震、ないしは耐震の構造を持ちますが、想定外の大規模災害に加え、ミサイル攻撃や、テロなどによる占拠があった場合、データの救出が不可能になる可能性もあります。このデザインパターンはこうした事象にも耐えられるように設計されます。

参考≫ テクニカルノート/InfiniCloudのデータセンターはどこにありますか?

Interconnected Storage(ICS)を使ったストレージ

ICSは、高反応速度と高可用性を兼ね備えたブロックストレージです。

エフェメラルディスクのような高反応速度を持ちながら、下記の冗長度を持った永続ストレージであり、高い性能を誇ります。

  • NVMe SSD内部のNANDシリコンレベルの冗長化(RAIN)- NVMe SSD内部のNANDシリコンレベルの冗長化(RAIN)

ICSは、次の2つの方法で、サービスが可能です

  • ダイレクトモード
    • LDOMインスタンス内にPCI Expressとして直接接続
    • 1つのICSにつき、1つのLDOMにマッピングされます。
  • 仮想ディスクモード
    • LDOMインスタンス内からは物理ディスクのように見える
    • クラウド基盤にPCI Express接続し、仮想ディスク単位で切り出し。
    • 1つのICSを複数のLDOMにマッピングすることができるが、仮想化コスト分の速度低下が発生します。

 

ダイレクトモード

仮想ディスクモード

 

ICSの内容を確実にバックアップアするためには、LDOMインスタンス内で取得する必要があります。

関連ページ

Private CloudPrivate Cloud
StorageStorage
NetworkNetwork