検索
ホーム ストレージ(7)

ストレージ(7)

ハイパーバイザーベースSDSのデータストレージコスト課題とHCIの登場

VMware vSANのデータストレージTCOにおける課題
VMware vSANのデータストレージ総所有コスト(TCO)には、いくつかの課題がありました。vSANにはバージョン6.2まで、データ削減機能(重複排除や圧縮)が搭載されていませんでした。これにより、同じ量の論理データを保存するために、データ削減機能を備えた他のSDS製品に比べてより多くの物理ストレージ容量が必要となり、利用可能なTBあたりのデータ保管コストが大幅に高くなる要因となっていました。

また、特定のクラスタ化されたvSphereホストで障害が発生した場合でも、そのホスト上に配置されていたデータとVMDK(仮想マシンディスクファイル、すなわち仮想マシンのデータそのもの)をクラスタの残りのノードから確実にアクセスできるようにするには、データの複数のコピーによるミラーリング構成が必要になります。データ可用性とデータレジリエンスのベストプラクティスに従うと、元のデータのコピーが少なくとも2つ必要ですが、多くの管理者はより高いデータ保護レベルを確保するために3つのコピーを用意しています。このような設定は、データの冗長性を高める一方で、必要な物理データストレージ容量を2倍または3倍に増加させ、サーバー用ドライブの価格面の利点を相殺してしまうことになります。さらに、vSANはvSphere環境専用のストレージ機能であるため、その利用にはvSphereのライセンス費用が別途発生し、このコストは組織のデータストレージ投資において相当な額になる可能性があります。

ハイパーコンバージドインフラストラクチャ(HCI)のSDS
ハイパーコンバージドインフラストラクチャ(HCI)は、サーバー(コンピュート)、ストレージ、ネットワーク、ハイパーバイザーといったインフラストラクチャコンポーネントを、ソフトウェアによって統合し、単一のクラスタ化されたノードとして提供するアーキテクチャです。HCIは、従来の個別最適化されたインフラストラクチャにおける統合の複雑さ、高価なサーバー、過剰なデータストレージのプロビジョニング、データ可用性の問題、複雑なデータストレージ管理、ハードウェアの互換性といった課題を解決するために設計されました。HCIにおけるSDS機能は、様々なメーカーから多くの選択肢が提供されており、組織はデータワークロードの要件に合わせて幅広い製品の中から選択できます。

ハイパーコンバージドインフラストラクチャ(HCI)のSDSのデータ管理における長所
HCIのSDSは、データ管理の観点からいくつかの長所を提供します。VMware vSANと同様に、仮想マシンの管理者が仮想化環境に関連付けられたデータストレージを管理できることが多く、管理の一元化に貢献します。実際、HCIのSDS製品の中には、VMwareのvSphere vSAN技術をベースにしたものも存在します。

HCIの重要な利点の一つは、データプラットフォームのデプロイメントにおける柔軟性です。VMware vSphereだけでなく、Microsoft Hyper-V、Red Hat KVM、Citrix XenServerなど、複数のHCIベンダーが様々なハイパーバイザーの選択肢を提供しています。これにより、組織がすでに利用している、あるいは今後利用したい特定の仮想化プラットフォーム上でHCIを展開し、データワークロードを配置することが可能です。さらに、ハイパーバイザーを介さずに直接アプリケーションを稼働させるベアメタル環境(例:Dockerコンテナを使用したLinux環境)をサポートするベンダーもあり、これによりHCIを様々なタイプのデータ処理環境の基盤として利用できます。

多くのHCIのSDSでは、異なる容量のノードをクラスタ内で混在させて使用することができます。これにより、データボリュームやデータ処理能力の増加に応じて、より細かく、効率的にストレージリソースやコンピュートリソースを拡張することが可能となり、初期投資や拡張コストを最適化できます。Atlantis Computing、Maxta、StarWind、StorMagicといった一部のベンダーは、ハードウェアに依存しないソフトウェアのみのSDS実装を提供しており、これは少数派ではありますが、データストレージの物理ハードウェア選択において最大の柔軟性を提供し、既存のサーバーハードウェアをデータストレージノードとして活用できる可能性を広げます。Maxtaのように、主要なサーバーメーカーとパートナー関係を結んでいるベンダーは、ソフトウェアとハードウェアの組み合わせでソリューションを提供することで、導入の容易さを実現しています。

HCIによるデータインフラストラクチャのスケーリングとオブジェクト/ファイルSDSのデータ特性

HCIによるデータ容量とパフォーマンスのスケーリング
ハイパーコンバージドインフラストラクチャ(HCI)は、クラスタにノードを追加するのと同程度の簡便さでデータ容量とデータ処理・アクセス性能をスケーリングできます。データストレージ容量を拡張するには、既存ノードの最大容量までドライブ(HDDやSSD)を追加するか、コンピュートリソースとストレージリソースの両方を含むノードを新しく追加するだけで済みます。

HCI製品のデータスケーラビリティとデータアクセス性能の上限は製品によって異なりますが、ほとんどの製品はペタバイト(PB)規模のデータボリュームまでスケーリング可能です。データアクセス性能は、クラスタに追加したサーバーノードの数にほぼ比例して向上するため、データワークロードの増加に合わせてリソースをリニアに拡張できるモデルと言えます。

HCIの導入は、配線と電源投入、そして基本的な構成のみでデータストレージおよびコンピュートリソースをオンラインにすることが可能であり、従来のインフラストラクチャ構築に比べて非常にシンプルです。自己による複雑なシステム統合の必要性は少なく、問題発生時にはHCIのメーカーに問い合わせることで統合的なサポートを受けられるため、データインフラストラクチャの運用負荷を軽減できます。

スケールアウトオブジェクト/ファイルSDSのデータ特性とHDFS利用
多くのスケールアウトオブジェクト/ファイルSDS製品は、ビッグデータ分析基盤で広く利用されるHadoop Distributed File System (HDFS) のデータストレージ層として機能させることができます。これにより、HDFSのデフォルトのデータレプリケーション(通常3コピー)で必要となるデータコピー数を削減し、データ冗長性の効率を高めることで、HDFSのデータストレージコストを大幅に引き下げることが可能になります。また、既存のNFSやSMBプロトコルでアクセスされるファイルデータをHDFSのデータソースとして再利用できるため、データのサイロ化を解消し、データの活用範囲を広げることができます。

これらのスケールアウトSDSは、データ容量の柔軟なスケーリングが可能です。各ノードを個別に拡張できるほか、クラスタ自体にノードを追加することでデータ容量やデータ処理性能を高めることが一般的です。ただし、これらのタイプのSDSのデータアクセス性能(IOPS、レイテンシー)は、ブロックストレージのパフォーマンスには及ばない傾向があります。これは、オブジェクトまたはファイル単位でのデータ管理オーバーヘッドや、主に大容量かつ低頻度アクセスのデータ向けに最適化されているアーキテクチャに起因します。したがって、低遅延でのランダムデータアクセスが求められるワークロードには不向きな場合があります。

ハードウェアとバンドルされたスケールアウトオブジェクト/ファイルSDS製品は、比較的容易に設定、構築、およびデータ管理を開始できます。一方で、ソフトウェアとして実装する場合は、自身でシステム統合を行う必要があり、相応の技術的な専門知識が必要となります。どちらの実装形態でも、コモディティハードウェアを利用することが多く、ペタバイト、エクサバイト規模のデータボリュームを格納可能な非常に高いデータスケーラビリティを備えています。特にスケールアウトオブジェクトSDSは、イレージャーコーディングという高度なデータ冗長性技術を利用することで、従来のRAIDやレプリケーションと比較してストレージ容量のオーバーヘッドを抑えつつ、他に類を見ないデータ回復性やデータ持続性を提供します。

これらのスケールアウトSDSは、低コストでのデータ運用を目的として設計されていることが多く、提供されるデータサービス(スナップショット、レプリケーションなど)は限定的な場合があります。ライセンスは年間契約の形で提供されることが一般的です。イレージャーコーディングを使用するスケールアウトオブジェクトSDSは、データ保護に必要な容量オーバーヘッドが少ないため、GBあたりの全体的なデータ保管コストを抑える上で特に有利です。これは、大量のアーカイブデータやバックアップデータをコスト効率良く長期保存したいというニーズに適しています。