Post on 03-Jan-2021
最先端ストレージの アーキテクチャガイド
w w w . c l i m b . c o . j p / s o f t / i n f i n i o / | s o f t @ c l i m b . c o . j p | 0 3 - 3 6 6 0 - 9 3 3 6
従来のアーキテクチャ 2
現在の複雑な構成: 3仮想化、スケールアウト、クラウド
ハイブリッドアレイ 9
オールフラッシュアレイ 10
ハイパーコンバージドインフラストラクチャ 13
ストレージアクセラレーション 14
INFINIOストレージアクセラレーションプラットフォーム 15
最先端ストレージのアーキテクチャガイド
2
年前、データセンタ―は現在とは大きく異なっていました。従来のストレージ アレイがSANまたはNASとして構成され、多くの物理サーバからのアクセスを担っていました。スピニング
メディアの回転速度は制限を作り出し、どの程度高速にデータの読み書きが可能かはディスクに依存していたため、より良いパフォーマンスを求める場合には、新たに追加のディスクトレイを購入する必要がありました。
アーキテクチャの観点から考えると、当時の主な技術革新は、上位の階層でファイルをサポートしているネイティブなブロックデバイス、もしくはファイルサーバによるブロックストレージの階層化です。
このため、ストレージ業界はスピニングディスクの高速化を行ってきました。さらに統合されたブロックとファイルはユーザに効率化と管理の一般化、複数ホストの処理を提供しました。このような階層化による革新は、現在の抽象化基準からすると、古典的で粗いものですが、速度とパフォーマンスの改善に寄与してきました。
十
従来アーキテクチャの限界 データセンターに対する要求は増加し続けています。そしてメモリは安価になりましたが、スピニングディスクのトレイは追加され続け、データセンター内で場所をとり、エネルギー消費量を増加させていきました。10GbEのアクセスは、パイプラインを拡張し、プライマリとバックアップによる洪水のようなデータを発生させます。これを管理するため、システムはより多くの処理能力を必要としました。また、アプリケーションが許容できないレベルまで、データアクセスの速度が低下するリスクも発生していました。
ストレージはこの変化に大きく影響を受けました。パフォーマンスと容量は別々のストレージリソースとして扱うことができませんが、それぞれに対する要求が大きく異なってきたためです。
さらに、データセンターに対する以下の3つのトレンドが従来のストレージアーキテクチャにプレッシャーをかけてきました:
仮想化同一ストレージ リソース
に対する、複数のI/O統合
スケールアウトなアプリケーションアーキテクチャ
CPUとメモリをスケールアウトし利用可能になることで、 より多くの負荷が発生
フラッシュ特別な処理が必要となるが、
サイズに対してより大きな パフォーマンスを提供
最先端ストレージのアーキテクチャガイド
3
最先端ストレージのアーキテクチャガイド
4
仮想化従来のSAN、NASアレイは仮想化の存在しない世界で設計されたものです。仮想化は既に新しくはありませんが、数年にわたりこのストレージ アーキテクチャのワークロードに大きな影響を与えています。
簡単にまとめるとサーバの仮想化は一つの物理サーバを複数の独立した仮想マシンで共有することを意味します。そのため、各アプリケーションのために専用のLUNは用意されず、アプリケーションのアーキテクチャ用に最適化した構築には意味がなくなってしまいました。これにより、特定の場所からのデータアクセスに合わせてドライブヘッドの能力を向上させるという単純な方法は効果的でなくなりました。
ほとんどの企業がサーバ仮想化プロジェクトにかかるコストの、65%から75%をストレージに費やしています。
“”
William Blair & Co.
最先端ストレージのアーキテクチャガイド
5
サーバ仮想化による、従来のアプローチへの影響範囲
• 一般的に、サーバとドライブ数が同数の場合、サーバのワークロードが多くなり、ストレージのパフォーマンスにマイナスの影響を与えます。単一システム上のVM数が多い場合にはストレージの容量が十分であっても、パフォーマンスが不足し、ストレージリソースは競合するかもしれません。
• しかし、リソースが共有されているため、VMごとに個別のアクセスパターンで最適化するといったことが行えません。(全てのI/OがマージされるI/Oブレンダ―効果)
• 多数のVMによるワークロードが動的に変化する場合、データセンターではより複雑な操作が必要になります。
• 特に仮想デスクトップ環境では、同時にピークとなる時間帯が存在し、それを発生させるイベント
(ウィルススキャンや、出社時のログイン)により、大量の参照で過負荷となりシステムの応答性が低下します。
最先端ストレージのアーキテクチャガイド
6
スケールアウトアプリケーション アーキテクチャクラウドストレージやビッグデータの出現により、スケーラビリティとワークロードの最新のトレンドを実装したアプリケ―ションが出てきました。これらのアプリケーションがアクセスするストレージにも変化が求められています。
この変化はアーキテクチャの観点からすると、データを上書くという考えから追加するという考えへの根本的な変化です。なぜならこのようなアーキテクチャは分散され、データ保護は従来のRAIDではなくコピーに依存しています。結果として、マシンにより生成されるデータと、データ保護のためにコピーを使用する新しいマルチプライヤの双方からユーザはストレージの急激な増強を迫られます。
また、Amazonなどのクラウドサービスはデータセンターの外側にあるストレージを経済的かつ魅力的にする方法を見つけました。このようなWebスケールのアーキテクチャは世界中のFaceBookのようなサービスに適しており、小規模なデータセンターを構築する方法を提供しています。また、スケールアウトなデザインとして、伝統的でよく知られているものには、例えばVMwareとOracleがあります。
スケールアウトなアーキテクチャにより計算量が増加すると、ストレージは大きなプレッシャーにさらされた状態になります。個々をスケールアップするアプリケーションに比べ、同一のスピンドルが処理するワークロードが増加するためです。これらのシステムの目的は、自動的かつ均等に複数のシステム間でデータを分散することですが、この効率化にはその分のコストがかかります。クラスタ全体としては、遥かに多くのデータを処理し、ストレージ上のパフォーマンスにプレッシャーをかけるためです。データセンター内でRAIDではなく、データの複製をデータ保護のために使用しているスケールアウトなアプリケーションも同様です。膨大なデータ容量に合わせたストレージが必要になります。
マシンにより生成 されるデータと、 データ保護のためにコピーを使用する 新しいマルチ プライヤ双方から ユーザはストレージの急激な増強を 迫られます
“
”
最先端ストレージのアーキテクチャガイド
7
FLASHフラッシュベースのSSDデバイスは、ホストにSSDを追加、PCI-Eカードを追加、アレイにSSDを追加するなど複数の方法でデプロイ可能です。NVベースのDIMMのような新しいアーキテクチャも出てきています。このストレージは桁違いに高速であり(同様のサイズのより高価なものに比べ)、フラッシュはストレージ業界を一変させました。
しかし、フラッシュは既存ストレージシステムに対して複数のプレッシャーを与えます。まず、フラッシュを追加することによるパフォーマンスの向上は既存のレガシーシステムの設計が想定しているよりも多くのIOPSを発生させます。同様にフラッシュのアーキテクチャは、多くの場合、特有の問題に対して特別な処理を必要とし、既存のプラットフォームに影響を与えます。
データセンターで使用されている各メディアの相対速度を表しています。
1分 2週間 1-2ヶ月 10年
考慮すべき複雑さ 他の技術と同様に、各フラッシュデバイスはストレージコントローラやソフトウェアで対処する必要のある、いくつかのアーキテクチャ上の問題を持っています。 例えば:
劣化の調整 時間経過で、フラッシュのセルは劣化していきます。この劣化は、ほぼ同時に進行していくことが望ましく、いくつかのストレージコントローラは全てのセルを均一に劣化させるための特別なアルゴリズムを実装しています。
書き込み処理の増大 フラッシュは空のセルに対してのみ書き込みが行えます。コンテンツが存在する場合には、上書きするのではなく、それを先に消去する必要があります。さらに消去はページレベルで行われるため、たとえブロックレベルの書き込みを行っている場合でも、その分のオーバーヘッドが発生します。
ガーベージコレクション セルは書き込まれる際に空である必要があるため、「クリーンアップ」を定期的に行い、不要なデータを消去する必要があります。このバックグラウンドのプロセスにより、読み取り、書き込み双方の性能が低下します。
プロセッサ DRAM ネットワーク フラッシュ ハードドライブ
最先端ストレージのアーキテクチャガイド
8
技術革新は多くの場合、ユーザの課題解決の鍵となってきました。
業界のリーダーは課題に合わせて、仮想化、フラッシュ、クラウドといった
技術を活用した、コストパフォーマンスの高い、革新的なアプローチをとっ
ています。このセクションではこれらのアプローチを紹介していきます。
まずは、高速化のためにフラッシュを統合するアプローチを紹介します。
専用のハイブリッド アレイが出てくる前の、初期の段階では、ユーザは自身が必要とする速度とパフォーマンスのためにSSDを既存のアレイに追加していました。そして構築時の優先順位に基づいて混在した環境でのベストなレベル/速度でのデータアクセスを提供していました(最終的にこれは自
動化されました)。
同様に一部のユーザは従来のアーキテクチャのアレイ、すべてをSSDドライブで満たし、オールフラッシュを作成していました。しかしながら、これらのアプローチは成功しませんでした。効果的にフラッシュを活用できず、このようなユーザはフラッシュの複雑さにより、問題を抱えました。これらのアプローチは両方とも、従来のデータセンターとストレージアレイのアーキテクチャをベースとし、その範囲からは出ていませんでした。
従来のデータセンターのアーキテクチャ
最先端ストレージのアーキテクチャガイド
9
ハイブリッド アレイは、次世代のディスク アレイの主流であり、フラッシュリソースを活用可能なコントローラを備えています。最新のハイブリッド アレイでは固有のタスクに合わせてフラッシュを使用します。例えば、読み取りのキャッシュと書き込みのログ バッファです。
これらのハイブリッド アレイはフラッシュまたはディスクプールからデータにアクセスしますが、アプリケーション自体は直接フラッシュにアクセスを行いません。このストレージアーキテクチャの目標は増加したIOPSの処理能力の最適化とスピニングドライブの容量最適化のために、フラッシュを組み合わせて利用することにあります。
混在したエンタープライズなワークロードのある環境で、一般的に使用され、時折発生する待ち時間よりもコストを重要視するユーザの主流なオプションとなっています。
ハイブリッド アレイは急速に拡大し、開発され続けています。しかし、このSSDとスピニングドライブを組み合わせたアレイのアプローチは、あくまで新規にアレイを購入しようとしている企業の、新しいが「現状維持」な試みであるように思われます。
ハイブリッド アレイ
なぜハイブリッド アレイが選ばれるのか?
ハイブリッド アレイは、高価すぎない適度な価格帯で一般的なワークロードの混在した環境で最も効果的であり、全てのアプリケーションのある程度のパフォーマンスを保証できます。
多くのお客様がデータセンターへの大きな変化を避けるためにハイブリッド アレイを選択しています。
最先端ストレージのアーキテクチャガイド
10
オールフラッシュ アレイオールフラッシュの初期のトレンドでは既存のアレイをSSDに置き換えていました。しかし、フラッシュの複雑さに伴い、新しい世代のストレージが出はじめました。先に述べたように不均一なフラッシュセルの劣化を避けるため、その調整機能を持つコントローラがアレイ上でフラッシュを活用するためには不可欠です。またフラッシュでは空のセルのみに書き込みが行えるため、領域の管理も必要です。ストレージのクリーンアップのためにブロックを消去中、複数の読み取り、書き込みのサイクルが低速になる可能性があります。最新のオールフラッシュ アレイでは、これらの技術的な課題を扱うことのできるコントローラ ロジックが実装されています。
オールフラッシュ アレイは、既存のデータセンターに高パフォーマンス/高コストな階層を作るための手法です。さらに、オールフラッシュ アレイは、高速なだけではなく、それに接続されている全ての速度を保証します。他のアーキテクチャではこのようなSLAを、まだ実現できていません。そのため、ミッションクリティカルなアプリケーションを高レベルに扱うための理想的なアプローチですが、多くの企業にとって、それはとても高価なものです。またオールフラッシュ アレイのストレージベンダーはスピニングドライブ同様のコストを提供するものとして重複排除を宣伝していますが、これは誤りです。同様の重複排除はスピニングドライブにも適用することができ、フラッシュとスピニングドライブのコスト比は変わりません。
また、経済性を別にしても、多くの企業はすべてのアプリケーションで、このような高速さを必要としていません。
なぜオールフラッシュ アレイが選ばれるのか? オールフラッシュ アレイは、アプリケーションがクリティカルな部分でパフォーマンスレベルの保証を必要としており、このための予算が十分に確保可能な企業に最も適しています。
ハイブリッド アレイはワークロードの95%に対して低レイテンシなアクセスを提供可能ですが、オールフラッシュ アレイであれば全てのワークロードに対してパフォーマンスのレベルを保証できます。
最先端ストレージのアーキテクチャガイド
11
データセンターのアーキテクチャを変えることに成功している技術革新の一つが、サー
バ側のストレージリソースを使用して処理を行うモデルです。サーバサイド ストレージは
ハイパーコンバージド、ソフトウェア定義、ソフトウェアサービスといった複数の方法で実
装できますが、現在、ハイパーコンバージド インフラストラクチャが市場で主流として受
け入れられつつあります。
このアーキテクチャのキーポイントは処理がサーバ上で行われる点です。これにより、サ
ーバ上のメモリ、プロセッサコアといった既存の使用率の低いリソースを活用できます。
今までの専用ストレージアレイとは対象的に、このサーバサイドのストレージはサービス
を提供するアプリケーションと同じ場所で、複数のサーバ全体が処理を行います。
サーバーサイドのストレージの形態は、表現の仕方で複数ありますが、その技術自体は
ほぼ同一です。ハイパーコンバージド インフラストラクチャの場合には、顧客はハードウ
ェアとソフトウェアが統合された構成済みのブロックを購入します。ブロックはCPU、メモ
リ、ストレージ、ネットワークが統合された単位であり、ワークロードに合わせて、複数ブ
ロックを使用します。ソフトウェア定義のソリューションではソフトウェアがハイパーコンバ
ージドの場合と同様の機能を提供し、顧客が選択したハードウェアプラットフォーム上で
実行されます。
新しいデータセンターのアーキテクチャ
最先端ストレージのアーキテクチャガイド
12
アーキテクチャとして、ハイパーコンバージドなシステムはハードウェア(ストレージとフラッシュカードが直接接続された一般的なサーバ)と仮想ワークロードの実行に必要なソフトウェア(ハイパーバイザ、システム管理、構成、仮想ネットワークツールなど)を結びつけたものです。これらの技術は従来のストレージスタックに接続せず、代わりにスケールアウトなパフォーマンスやキャッシュ、暗号化、重複排除といった次世代のストレージサービスを提供します。
しかし、ハイパーコンバージド インフラストラクチャを実装するためには、データセンター全体を変更する必要があり、現実的ではないといった制限があります。オールフラッシュ アレイやハイブリッド アレイは独自の特徴を持っていますが、データセンターのアーキテクチャに与える影響は少なく、既存のネットワークやサーバと同様に購入し管理できます。対照的にハイパーコンバージド インフラストラクチャは、新たに構築済みブロックを購入し、それに合わせて管理ツールやプロセスまで変更する必要があります。そのため、一般的には中小規模の企業やリモートのオフィス環境で使用されています。
その他の考慮点:
• ストレージの効率: ハイパーコンバージド インフラストラクチャのスケールアウトなアーキテクチャでは、従来のRAIDではなく、複製をベースにしたスキーマでのデータ保護を行います。RAIDの場合、データ保護のために10-20%の容量のオーバーヘッドが発生しますが、ハイパーコンバージド インフラストラクチャを保護するために、複製を使用すると、300-400%程度の容量のオーバーヘッドが発生することもあります。
• スケーリングの事前定義: 従来のストレージに比べ、インフラストラクチャを必要に応じて増減させるための、幅の柔軟性が低下します。拡張は新たに全てのリソースを含む定義済みのブロックを購入する必要があります。
• 監視ツールのエクスペリエンス: ハイパーコンバージド環境で、IT担当部門は管理を合理化するためには再編成を行う必要があるかもしれません。既存の慣れ親しんだサーバとストレージの監視ツールは、多くの場合、異なるインターフェイスに変更されます。
ハイパーコンバージド インフラストラクチャ
なぜハイパーコンバージドが選ばれるのか?
シンプルさ、設計の統一、管理のデプロイメントを可能にし、ITインフラストラクチャ上のコンポーネントの統合を実現します。
集約が可能な事前定義された構成済みのブロックを提供し成長のニーズを満たすことが可能です。
コントローラーVM/ソフトウェア
サーバ
最先端ストレージのアーキテクチャガイド
13
ストレージのパフォーマンスを向上させるためにサーバーサイドのリソースを活用する利点を、理解する多くの企業は、データセンターのアーキテクチャに大幅な変更しなくとも、これを可能にするソリューションを求めています。
このような場合、ストレージ アクセラレーションを導入しましょう。
ストレージ アクセラレーションはサーバサイドのリソースを集約し、IT管理者にストレージのパフォーマンス改善を提供します。このアプローチでは低レイテンシなパフォーマンス層を作成し、企業が低コストで大容量のストレージを使用することを可能にします。既存ストレージの改善を行う場合や新しいデータセンターを設計する際に、ストレージアクセラレーションはアーキテクチャやストレージ側のオペレーションを変更せずに、容量とは別にパフォーマンスリソースの管理を提供します。
このアーキテクチャは、安価なサーバ側の汎用リソースを使用することで、IOPSあたりのコストをもっとも低くでき、GBあたりのコストが低い共有アレイを想定し、容量を決定できます。
技術的な観点からは、このアプローチを用いることで企業は容量のリソースとパフォーマンスのリソースを分けて考えることができます。
ビジネスの観点からは、ハードウェア、ソフトウェアの変更(リプレイスやそれに伴うコスト)や時間の投資、ダウンタイムなく、既存インフラストラクチャへパフォーマンスを追加する方法を提供します。
ストレージ アクセラレーション
なぜストレージ アクセラレーションが選ばれるのか?
IOPSあたりのコストを下げて、低遅延なサーバサイドでの高速なストレージリソースに対するアクセスを提供します。
企業の既存インフラストラクチャへの投資を維持し、共有ストレージのプラットフォームを活用できます。
キャッシュソフトウェア
サーバ
コントローラソフトウェア
ストレージ
最先端ストレージのアーキテクチャガイド
14
ストレージの高速化は、まだ新しい分野ですが、Infinioは2013年からこの分
野でソリューションを提供しています。Infinioのソリューションは高効率にリソー
スを利用し、既存ストレージのオペレーションに変更なく、ダウンタイムやI/O
停止もなく利用できます。以下のように、ストレージリソースを分離(容量とパフ
ォーマンス)する利点を強化しています。
• レイテンシを10分の1に改善
• 追加のハードウェアなしでSSDクラスのパフォーマンス
• パフォーマンスにかかるコストの削減(コスト/IOPS)
• アプリケーションの成長に合わせたスケールアウトなI/O
• ストレージアレイのために必要な容量コストの削減(コスト/GB)
InFInIOのストレージアクセラレーション プラットフォーム
最先端ストレージのアーキテクチャガイド
15
InfInIo 仮想化されたデータセンターのための ストレージ アクセラレーション
Infinioのソリューションは、ストレージのパフォーマンスをストレージの容量から分離します。この核となるアーキテクチャは、ほとんどのデータセンターがVMwareクラスタ全体で考えると、大量の重複するデータを含んでいることを意識して設計されています。Infinioのコンテンツベースのアーキテクチャは、この事実を活用し、コンテンツ(アドレスではなく)を追跡し、パフォーマンス層においてインラインな重複排除を行います。この重複排除によりInfinioは少量のRAM(最小:ホストあたり8GB)を用いて高パフォーマンス(レイテンシを10分の1)を提供します。この重複排除とInfinioのスケールアウトなグローバルアーキテクチャを組み合わせることで、わずか5ノードで数百GB分の実効キャッシュにアクセス可能です。
Infinioの特徴は高効率な点だけではありません。常に既存の環境にシームレスに統合できるように設計されています。例えば、Infinioは30分以内にインストール可能であり、既存環境にダウンタイムなく、一時的なI/O停止やゲストOS上へのエージェント導入、ストレージ構成の変更といったものもありません。高速化の有効化、無効化はワンクリックで可能であり、評価終了時にはInfinioは完全に削除されます。
Infinioを実装後にも、慣れ親しんだストレージツールやご自身が環境に対して構成したバックアップシステムの統合やレポート、スナップショット、レプリケーション、シンプロビジョニングといった様々なカスタマイズ、設定を、そのまま引き続き使用できます。
カーネルモジュール
カーネルモジュール
カーネルモジュール
ホストあたり一つのアクセラレータVM
通信にVMotion ネットワークを使用
VCenterあたり一つ のコンソールVM
ストレージ高速化のためのinFinioキャッシュ層
最先端ストレージのアーキテクチャガイド
16
InFInIOはボトルネックを解消し、既存のインフラストラクチャにスケールアウトなパフォーマンスを提供します。
InFInIOの特徴
メリット • 応答時間を10分の1に
• ストレージからの読み取りを65-85%削減
• ストレージシステムの寿命を延長
• 新規ストレージ購入のための維持費低減
“
• 重複排除により高効率にリソースを使用できます。
• インストールが簡単なことはもちろん、ダウンタイムやI/O停止、環境への変更なく評価可能です。
• 既存のストレージシステムのツールやレポートと共存し、投資を保護できます。
VDIデスクトップのストレージ待ち時間が目に見えて減少し、ファイル操作の作業負荷が削減されました。
Nathan Manzi, システムエンジニア 企業名:Minara Resources
”
最先端ストレージのアーキテクチャガイド
17
AttivioはInfinioの古くからの顧客です。ストレージのパフォーマンスを重要視し、長期的に以下の改善を実現しています。
• ハードウェアの追加なしに、ストレージのパフォーマンスを改善
• 安定して読み取りの88%をオフロード、帯域幅の93%をオフロード
• 16週間にわたり安定してパフォーマンスを5倍に
• ダウンタイム、サービスの中断なしに導入
なぜ隔離されたSSDの棚にお金を費やすのですか?Infinioを使用すれば、より安くその恩恵を環境全体で得ることができます。Sean Lutner, Attivio IT部門 副部長
導入事例
“”
最先端ストレージのアーキテクチャガイド
18
導入事例
モバイルワーカーは、応答が遅く、貧弱なアプリケーションのパフォーマンスに不満を抱えていました。Budd Van LinesはInfinioを導入することで、テレワークを成功させました。
• VDIパフォーマンスの改善(読み取りの応答時間を2.5分の1に、リクエストの75%をオフロード)
• ストレージのリクエストが削減されたことで、ネットワークの帯域幅が緩和
• 運用、ユーザに影響なく、すばやく導入
“もう少し早くInfinioを導入していれば、企業成長と繁忙期の準備に10Gbスイッチを購入しなくともすみました。Infinioの読み取りのオフロードは十分に帯域のトラフィックを削減し、高価なスイッチを購入せずに、費用を大幅に節約できます。Doug Soltez, Budd Van Lines 副社長兼CIO”
最先端ストレージのアーキテクチャガイド
19
ストレージアーキテクチャとそのユーザは過去10年間にわたり、構成変更を伴うよう
なイノベーションに、応える必要がありました。クラウド、仮想化、アプリケーションのス
ケールアウトなどです。ハードディスクからSSD、複数のメディアを組み合わせた様々
ばハイブリッドアプローチ(サーバリソースも含む)などの目標は常にシンプルであり、
スピードと安定したパフォーマンスです。流動的な目標としては、正しいサイズに見合
った適切なコスト、そして無駄な出費を抑えることです。
ストレージの高速化は最新のアプローチかもしれませんが、我々は一過性の流行で終
わるものではないと信じています。Infinioのシステムは、少量のRAMでI/Oを高速化し
(平均的にレイテンシを10分の1に)、現在のアーキテクチャやオペレーションに対し
てパフォーマンスを提供できます。既存環境のパフォーマンス改善や新たな環境を構
築する際には、Infinioを是非ご検討ください。
INfINIoに関するお問合せ
https://www.climb.co.jp E-mail: soft@climb.co.jp
【東京本社】 TEL: 03-3660-9336 〒103-0014 東京都中央区日本橋蛎殻町1-36-7 蛎殻町千葉ビル4F
【大阪営業所】 TEL: 06-6147-8201 〒530-0002 大阪市北区曽根崎新地2丁目2-16西梅田MIDビル4F
© 2015 Infinio Systems, Inc. All rights reserved. © 2015 Climb, Inc.