Microsoft Azure SQLデータウェアハウスとは?

Azure SQLデータウェアハウス(SQL DW)は、SQL Serverを基盤に構築されたペタバイト規模のMPP分析データウェアハウスで、Azureクラウドコンピューティングプラットフォームの一部として稼働します。他のクラウドMPPソリューションと同様に、SQL DWでは、ストレージ機能とコンピューティング機能が分かれており、料金が別々に請求されます。SQL DWがよくある分析データウェアハウスソリューションと異なるのは、物理マシンが抽象化されていて処理能力がデータウェアハウスユニット(DWU)形式で表される点です。そのため、ユーザーがコンピューティングリソースを自由に、シームレスかつ簡単に拡張できます。

Azure SQLデータウェアハウスはMicrosoft Azureクラウドコンピューティングプラットフォームの一部であることから、Microsoftのテクノロジースタックにすでに投資している企業にとって、このデータベースを導入するのは実に簡単です。

Azure SQLデータウェアハウスを選ぶにあたって

MicrosoftのAzureクラウドコンピューティングプラットフォーム

MicrosoftのAzureエコシステムは巨大で、スタックをフルに活用するうえで役立つ多数のツールを備えた各種ソリューションが手に入り、各ツールはいつでも簡単に追加可能です。いくつものサードパーティのサービスがセットになったひとつのデータベースを使用するのとは対照的に、SQL DWではMicrosoftのプラットフォーム内に投資を集中させることができます。​​​​​​​

使いやすさ

Azure SQL DWでは、ユーザーのコンピューティングリソースが抽象化されてDWU形式で表されるため、スケールアップやスケールダウンが非常に簡単で、データウェアハウスに供給するリソースを容易に増減することができます。

柔軟性

Azure SQLデータウェアハウスのパフォーマンスを拡張するためのエンドユーザー向けオプションは、さまざまです。ユーザーは、個々の仮想マシンをアップグレードするか、新たにマシンを追加する形で(自動的に拡張するよう設定可能)コンピューティングリソースを追加することができます。

Azure SQLデータウェアハウスが実際に役立つ事例とは

SQL Server/SQLデータベースを使用している組織

Azure SQLデータウェアハウスは、SQL ServerやSQLデータベースと同じテクノロジーで構築されているため、SQL ServerからSQLデータウェアハウスにデータを読み込むのも非常に簡単です。

AzureのPolyBaseサービスでは、Azure内に保存されたリレーショナルデータとHadoop内の非リレーショナルデータの混合が可能です。このため、Azure Blob StorageとHadoop組織の両方にデータを格納する組織にとって、Azureなら優れたツールが見つかります。

料金に関する考慮事項​​​​​​​

Azure SQL DWでは、コンピューティングとストレージの料金は別々に請求されます。AWSとは異なり、Azure DWのバックエンドにあるハードウェアは顧客には知らされません。コンピューティングでは、処理能力の尺度にデータウェアハウスユニット(DWU)が採用されています。ストレージについては、Azure Premium Storageと同じ料金体系となっています。

Microsoftのウェブサイトにある料金計算ツールを使うと、コンピューティングの料金(SQLデータウェアハウス)とストレージの料金(Azureクラウドストレージ)の見当をつけることができます。

Azure SQLデータウェアハウスのアーキテクチャ

Azure SQLデータウェアハウスは、ストレージをコンピューティングから切り離しているという点で、他のマネージドMPPデータベースのアーキテクチャと類似しています。Azure SQLデータウェアハウスはAzure Blob Storage上に構築されており、コンピューティングリソースを動的に取得して、そのデータにクエリを実行します。

基本的にAzure SQLデータウェアハウスのノードには、1つの制御ノードと複数のコンピューティングノードの2種類があります。

制御ノードの役割は、クエリの実行プランを作成し、そのクエリをそれぞれのコンピューティングノードで実行できるよう並列フェーズに分割することです。クエリの最適化と分散のほか、クエリのメタデータも保存します。

複数のコンピューティングノードには、それぞれSQLデータベースのインスタンスが含まれており、個々のディスクにローカルで保存されたデータを処理する役割を果たしています。各コンピューティングノードの中間結果が処理されると、集計のためその結果を制御ノードに返します。

Azure SQLデータウェアハウスでは、Microsoftの膨大な非構造化ストレージリポジトリAzure Blob Storageに保存されたデータに対してクエリを実行します。基本的にAzure Storageに保存されたデータへのクエリには、次の2つの方法があります:

データの種類

Azure SQLデータウェアハウスでは、リレーショナルデータとHDFSデータ両方に対応したストレージレイヤー、PolyBaseを介してリレーショナルデータと非リレーショナルデータを処理することができます。

行の範囲(量)

Azure Blob Storageを備えたAzure SQLデータウェアハウスでは、ペタバイト規模のデータを処理できます。また、Azure Data Lakeと互換性のあるAzure SQLデータウェアハウスでは、エクサバイト規模のデータにクエリを実行できます。

Azure SQLデータウェアハウスの管理および導入

Azure SQLデータウェアハウスの導入

単純なベンチマークテストにAzure SQLデータウェアハウスを試してみるのは、とても簡単です。ただし、その前にAzureのアカウントAzure SQL Serverが必要です。

Microsoftのドキュメンテーションに、Azure SQLデータウェアハウスの基本情報​​​​​​​をステップバイステップで説明した便利なガイドがありますのでぜひご活用ください。

新規データの処理

Microsoftは、Azure DWにデータを取り込むためのオプションをいくつか提供しており、そのひとつが、AzureのPolyBaseによる高速でコンピューティングに合わせて拡張可能なデータの読み込みです。 また、Microsoftのバルクコピープロセス(BCP)、SQLバルクロードといった従来の方法もあり、これらはDWU(Azureのコンピューティングユニット)ではなく、スレッドでのみ拡張することができます。そのほか、ユーザーがより充実したMicrosoftスタックにすでに投資している場合は、SSISをAzure DWのETLパイプラインの一部として使用することも可能です。

メンテナンス

Azure SQL DWはクラウドベースのソリューションであるため、メンテナンスに手間がかかりません。同様のマネージドサービスソリューションでもそれは同じですが、ユーザーが必要なだけカスタマイズできるようになっている点でAzureは特にユニークと言えます。

データウェアハウスユニット(DWU)

Azure SQLデータウェアハウスの処理能力は抽象化され、データウェアハウスユニット(DWU)という単位で表されます。ユーザーはDWUの数を増やすことで、インスタンスに動的に処理能力を追加することができます。DWUを追加するにはいくつか方法があります。

DWUを使用すると、データウェアハウス内でリソースを非常にスピーディかつ簡単にスケールアップやスケールダウンすることが可能になります。

SQLデータウェアハウスを柔軟に拡張

SQL Azureの強みのひとつは、データベースを柔軟に拡張できる点です。Microsoftでは、データウェアハウスの垂直方向と水平方向両方の拡張が可能です。

Azure SQLデータウェアハウスの垂直方向の拡張は、サービスティアを変更するか、データベースをエラスティックプールに配置して行います。

Azure SQLデータウェアハウスを水平方向に拡張する際は、データウェアハウスユニットを追加します。Azureプラットフォームには、データウェアハウスの自動拡張をカスタマイズするための膨大なリソースが揃っています。​​​​​​​

アナリティクスを快適に

ビジネスインテリジェンス、ビッグデータ分析、顧客の360°ビュー。
Lookerはお客様のどんなニーズにもお応えします。当社のデータエキスパートにご相談ください。

デモをリクエスト