SnowflakeユーザーがETLを利用する5つのシナリオ
Snowflakeは、その優れたパフォーマンスから、データウェアハウス業界の勢力図を一気に塗り替え、導入企業が急拡大しています。今回は、Snowflake上のデータを少ない工数で整備するヒントとして、Snowflake利用企業がETLを利用する5つのシナリオについてご紹介します。
目次
- (1)シナリオ1: Snowflake → ETL → Excel, CSV
- (2)シナリオ2: Snowflake → ETL → RDB
- (3)シナリオ3: Excel, CSV → ETL → Snowflake
- (4)シナリオ4: Salesforce → ETL → Snowflake
- (5)シナリオ5: Kintone → ETL → Snowflake
- 「Reckoner」でさらなるSnowflake活用を
(1)シナリオ1: Snowflake → ETL → Excel, CSV
Snowflakeに格納されたデータを、ETLで抽出・変換した後に、ExcelやCSVなどで出力するシナリオです。
分析が完了したデータのサマリを、ExcelやGoogleスプレッドシートで見やすい形で広く共有し、最新のデータの確認や傾向の確認を行う場合に最適です。ETL上でデータを変換することで、「Snowflakeに格納されている表示形式そのまま」ではなく、「データを確認する人や部門にとって最も分かりやすい表示形式」に変換してから共有できるため、効率的です。
(2)シナリオ2: Snowflake → ETL → RDB
Snowflake上にあるデータを、ETLで抽出・変換した後に、MySQLやPostgreSQLなどのRDBにロードするという方法です。
Snowflake上のデータを、RDBにロードして別システムで利用したい、特定の用途のためにデータをDWHから抽出したい、といった場合などに最適です。Snowflake上のデータを、ETL上で「移管先システムで最適なデータ形式」となるように変換した後に、RDBに格納します。これにより、手動のデータ処理が一切不要となります。
(3)シナリオ3: Excel, CSV → ETL → Snowflake
ExcelやCSVで保持しているデータを、ETLを介してSnowflakeに格納する方法です。
例えば、ExcelやCSVの形で保持している顧客情報や売上情報を、Snowflake上のデータに追加する場合です。Snowflakeについて知識のない人が、ExcelやCSVファイル上のデータを適切な形で、Snowflake上の既存のデータセットに追加するのは、容易ではありません。また、こうした作業を行うために都度情報システム部門に依頼するのも「気が引ける」と思う担当者も多いでしょう。
ETLを利用することで、Snowflakeのダッシュボードにログインすることなく、ExcelやCSVデータを抽出・変換したのちに、Snowflakeに正しくデータを追加できます。
(4)シナリオ4: Salesforce → ETL → Snowflake
Salesforce上のデータを、Snowflakeに格納して分析可能とする際に、ETLを活用できます。SalesforceとSnowflake間にはコネクターが提供されていますが、分析を容易に行うために、SalesforceのデータをそのままSnowflakeにロードするのでなく、変換が必要となる場合があります。
こうした場合は、ETLを介してデータの変換ロジックを設定し、そのロジックに従って処理させることで、Salesforce側もSnowflake側も追加のデータ処理が不要となります。
(5)シナリオ5: Kintone → ETL → Snowflake
Kintoneで稼働するアプリケーションやワークフローのデータを、ETLで変換した後に、Snowflakeに格納するシナリオです。
Kintoneのデータベースは、一般的なRDBと異なる仕様となっていますが、ETLを用いることでデータベースの内部的な違いを意識することなく、必要な形に加工した後にSnowflakeにロードできます。
「Reckoner」でさらなるSnowflake活用を
今回は、Snowflakeを導入している組織がETLを利用するシナリオとして、多く利用されている5つのシナリオについてお届けしました。
ETLを利用すると、Snowflakeへのデータロード(ならびロード時の変換)、そしてSnowflakeからのデータ抽出(ならび抽出時のデータ変換)がより容易かつ効率的に行えるようになります。結果、「データを分析する」「抽出したデータをもとに議論する」といった、本当に重要な業務により多くの時間を割く事が可能となります。
当社が開発する「Reckoner」は、非エンジニアであってもブラウザ上でデータ処理が行えるETLです。プログラミング不要のため、情報システム部門に都度処理を依頼することなく、データを必要な部門の担当者が「必要なそのタイミング」でデータ処理が可能となります。Snowflake以外のDWH製品(Amazon Redshift, Google BigQueryなど)にも対応するため、複数のDWH製品を稼働させている企業での利用も効果的です。
ぜひ、Reckonerの資料をダウンロードいただき、ご検討ください。
ETLツールについて詳しく知りたい、ETLツールの選び方を知りたいという方はこちらの「ETLツールとは?選び方やメリットを解説」をぜひご覧ください。