SnowflakeユーザーがETLを利用する5つのシナリオ
![](https://reckoner.io/wp-content/uploads/2022/06/5-scenarios-to-use-etl-eyecatch.webp)
Snowflakeは、その優れたパフォーマンスから、データウェアハウス業界の勢力図を一気に塗り替え、導入企業が急拡大しています。今回は、Snowflake上のデータを少ない工数で整備するヒントとして、Snowflake利用企業がETLを利用する5つのシナリオについてご紹介します。
目次
- (1)シナリオ1: Snowflake → ETL → Excel, CSV
- (2)シナリオ2: Snowflake → ETL → RDB
- (3)シナリオ3: Excel, CSV → ETL → Snowflake
- (4)シナリオ4: Salesforce → ETL → Snowflake
- (5)シナリオ5: Kintone → ETL → Snowflake
- 「Reckoner」でさらなるSnowflake活用を
(1)シナリオ1: Snowflake → ETL → Excel, CSV
![s-820x538_v-fs_webp_f74da5b5-2b7c-4d13-8f03-0b883e4a5afa | Reckoner](https://dj8g918l0q6mc.cloudfront.net/wp-content/uploads/2022/08/s-820x538_v-fs_webp_f74da5b5-2b7c-4d13-8f03-0b883e4a5afa.webp)
Snowflakeに格納されたデータを、ETLで抽出・変換した後に、ExcelやCSVなどで出力するシナリオです。
分析が完了したデータのサマリを、ExcelやGoogleスプレッドシートで見やすい形で広く共有し、最新のデータの確認や傾向の確認を行う場合に最適です。ETL上でデータを変換することで、「Snowflakeに格納されている表示形式そのまま」ではなく、「データを確認する人や部門にとって最も分かりやすい表示形式」に変換してから共有できるため、効率的です。
(2)シナリオ2: Snowflake → ETL → RDB
![s-833x540_v-fs_webp_a071357d-69dd-45a1-9617-1d5270d265ce | Reckoner](https://dj8g918l0q6mc.cloudfront.net/wp-content/uploads/2022/08/s-833x540_v-fs_webp_a071357d-69dd-45a1-9617-1d5270d265ce.webp)
Snowflake上にあるデータを、ETLで抽出・変換した後に、MySQLやPostgreSQLなどのRDBにロードするという方法です。
Snowflake上のデータを、RDBにロードして別システムで利用したい、特定の用途のためにデータをDWHから抽出したい、といった場合などに最適です。Snowflake上のデータを、ETL上で「移管先システムで最適なデータ形式」となるように変換した後に、RDBに格納します。これにより、手動のデータ処理が一切不要となります。
(3)シナリオ3: Excel, CSV → ETL → Snowflake
![s-827x546_v-fs_webp_2634edb9-e790-403b-9856-b0e9f20aeb50 | Reckoner](https://dj8g918l0q6mc.cloudfront.net/wp-content/uploads/2022/08/s-827x546_v-fs_webp_2634edb9-e790-403b-9856-b0e9f20aeb50.webp)
ExcelやCSVで保持しているデータを、ETLを介してSnowflakeに格納する方法です。
例えば、ExcelやCSVの形で保持している顧客情報や売上情報を、Snowflake上のデータに追加する場合です。Snowflakeについて知識のない人が、ExcelやCSVファイル上のデータを適切な形で、Snowflake上の既存のデータセットに追加するのは、容易ではありません。また、こうした作業を行うために都度情報システム部門に依頼するのも「気が引ける」と思う担当者も多いでしょう。
ETLを利用することで、Snowflakeのダッシュボードにログインすることなく、ExcelやCSVデータを抽出・変換したのちに、Snowflakeに正しくデータを追加できます。
(4)シナリオ4: Salesforce → ETL → Snowflake
![s-821x545_v-fs_webp_0ded25a5-8aab-448b-8476-261d60b9bb4b | Reckoner](https://dj8g918l0q6mc.cloudfront.net/wp-content/uploads/2022/08/s-821x545_v-fs_webp_0ded25a5-8aab-448b-8476-261d60b9bb4b.webp)
Salesforce上のデータを、Snowflakeに格納して分析可能とする際に、ETLを活用できます。SalesforceとSnowflake間にはコネクターが提供されていますが、分析を容易に行うために、SalesforceのデータをそのままSnowflakeにロードするのでなく、変換が必要となる場合があります。
こうした場合は、ETLを介してデータの変換ロジックを設定し、そのロジックに従って処理させることで、Salesforce側もSnowflake側も追加のデータ処理が不要となります。
(5)シナリオ5: Kintone → ETL → Snowflake
![s-812x543_v-fs_webp_cc081696-d048-44df-99f1-77108cd40819 | Reckoner](https://dj8g918l0q6mc.cloudfront.net/wp-content/uploads/2022/08/s-812x543_v-fs_webp_cc081696-d048-44df-99f1-77108cd40819.webp)
Kintoneで稼働するアプリケーションやワークフローのデータを、ETLで変換した後に、Snowflakeに格納するシナリオです。
Kintoneのデータベースは、一般的なRDBと異なる仕様となっていますが、ETLを用いることでデータベースの内部的な違いを意識することなく、必要な形に加工した後にSnowflakeにロードできます。
「Reckoner」でさらなるSnowflake活用を
今回は、Snowflakeを導入している組織がETLを利用するシナリオとして、多く利用されている5つのシナリオについてお届けしました。
ETLを利用すると、Snowflakeへのデータロード(ならびロード時の変換)、そしてSnowflakeからのデータ抽出(ならび抽出時のデータ変換)がより容易かつ効率的に行えるようになります。結果、「データを分析する」「抽出したデータをもとに議論する」といった、本当に重要な業務により多くの時間を割く事が可能となります。
当社が開発する「Reckoner」は、非エンジニアであってもブラウザ上でデータ処理が行えるETLです。プログラミング不要のため、情報システム部門に都度処理を依頼することなく、データを必要な部門の担当者が「必要なそのタイミング」でデータ処理が可能となります。Snowflake以外のDWH製品(Amazon Redshift, Google BigQueryなど)にも対応するため、複数のDWH製品を稼働させている企業での利用も効果的です。
ぜひ、Reckonerの資料をダウンロードいただき、ご検討ください。
ETLツールについて詳しく知りたい、ETLツールの選び方を知りたいという方はこちらの「ETLツールとは?選び方やメリットを解説」をぜひご覧ください。