db tech showcase

dbtsブログ

このエントリーをはてなブックマークに追加

【dbts2021 レポート】Cloud Datawarehouse比較

クラウド
【dbts2021 レポート】Cloud Datawarehouse比較

こんにちは、コンサルティング本部 村澤です。 db tech showcase 2021 2日目のD11のセッションである「Cloud Datawarehouse比較」のレポートをお届けします。

セッション概要

データ分析基盤で使用するDWHは昨今、クラウドで構築・運用されるケースが増えてきています。 『クラウドDWHと言えば』、で選択肢として挙がる、Amazon Redshift、Azure Synapse Analytics、Snowflakeについて、機能、性能、価格等、色々な観点で比較してみました。 DWHの選定にかかわっているエンジニアの方向けに、どれを使えばよいか迷っている方はもちろん、他のDWHを検討されている方にも、参考になる情報を提供します。

スピーカー名:株式会社インサイトテクノロジー 中川 裕貴

db tech showcase 2日目に弊社中川が、DWH環境をクラウド上で構築する際の検討ポイントをAmazon Redshift、Azure Synapse Analytics、Snowflakeを実例に比較しました。

なぜクラウドを比較対象としたのか

近年、DX推進によるデータ活用の需要が高まっていることにより、DWH環境構築の需要も高まっていますが、オンプレでDWH環境を構築する場合、ハードの準備やDB構築等で実際に利用開始するまで数日~数か月かかることもあります。クラウドの場合、ハードを準備する必要がなく、WEB画面よりすぐにDWH環境を構築することができるため、DWH環境利用までの初期コストを低く抑えることができます。

今後、DWH環境の構築を考えられている方にとって、クラウド上で構築することも検討対象となるはずなので、今回は、クラウドで人気の3DBについて比較したとのことです。

6つの観点でCloud Datawarehouseを比較

中川の今までの業務を通して得た経験から、以下の6つ観点でCloud Datawarehouseを比較しました。

1.地理的制約

各DBで対応のリージョン

  • 東日本:全DBで対応
  • 西日本:Azure Synapse Analyticsのみ対応

2.セキュリティ

データの流出を防ぐため以下の項目の実装可否を確認しました。

  • データ暗号化:可能 ※例)データセンターのSDDを盗まれた時の対応
  • 通信暗号化 :可能 ※例)ネットワーク上から盗み見されないための対応
  • 通信経路制限:可能 ※例)DWHにアクセス可能な機器を制限するための対応
  • 監査ログ取得:可能 ※例)内部犯への対応

3.開発

  • クエリはSQLで実行可能
  • ストアドプロシージャ/UDTFも作成可能
  • 接続はODBC/JDBCで可能
    ※各DBで開発を実施する際に特有のスキルは必要なし

4.可用性

起動にかかる時間:

  • Amazon Redshift:数分
  • Azure Synapse Analytics:数分
  • Snowflake:すぐ

メンテナンスによるダウンタイム:

  • Amazon Redshift:毎週
  • Azure Synapse Analytics:メンテナンスウィンドウをユーザが設定可能
  • Snowflake:ダウンタイムなし

5.その他機能

  • 機械学習:Amazon Redshift、Azure Synapse Analyticsで利用可能
  • Time Travel:Snowflakeで利用可能
    ※過去の任意の時点のデータを参照可能(基本1日、最大90日まで戻ることが可能)なため、バックアップとして利用可能
  • データ共有:Amazon Redshift、Snowflakeで利用可能
    ※同じ種類のデータウェアハウスを使っている場合、許可したデータを相手のDWHで参照させることが可能

6.性能とコスト

各DBで料金体系も異なることから、以下の観点でテストを実施

  • TPC-Hをベンチマークとして実行
  • DBサーバのスペックを倍々にしていき、ベンチマークを実行
    →倍々にスペックを上げることで、各スペック時の処理時間およびコストを比較
  • ベンチマーク実施時のみDBサーバを起動
    →DB起動からベンチマーク終了までの時間を計測し、性能およびコストを比較
    ※テスト結果は動画で確認可能

まとめ

1.各DBとも機能面で大きな差異はない
2.使用頻度(※)でコスパのよいDWHは変わる
※常時DBを起動して使用するまたは必要な時のみDBを起動

聴講した感想

よく話題にあがる3DBについて、興味はありましたが比較する機会がなかったので 今回のセッションにて、比較結果を聞けて勉強になりました。

各DBで、大きく機能面での差はありませんが、利用方法によって性能やコスト面が 異なってくるので、ユーザの利用方法によって選択するDBが変わってくると思いました。 今回の検証観点や結果を参考に検討項目や提案に活かすこともできそうなので クラウドでDWH環境構築または提案を検討されている方にお勧めです。

db tech showcase2021のアーカイブ動画・資料を12月末まで公開しております! 閲覧はこちらからご覧ください。https://eventregist.com/e/TvkwJoawl5Dy

一覧に戻る