■ はじめに
BIツールの内、Pentaho (ペンタホ)について、調べてみた
■ Pentaho
* オープンソースのBIツール * Java製
参考文献
https://thinkit.co.jp/article/1153/1
http://m12i.hatenablog.com/entry/2015/04/12/083508
https://www.ossnews.jp/oss_info/Pentaho/1
■ Pentaho Data Integration(PDI)
* 日本語だと、Pentahoデータ統合 * 別名は、Kettle(ケトル) ⇒ Kettle Extraction Transformation Transportation & Loading Environment
構成
「Kettle」配下には、複数のコンポーネントが存在する 1)Spoon(スプーン) 2)Pan(パン) 3)Kitchen(キッチン) 4)Carte(カルテ)
1)Spoon(スプーン)
* ETLをモデリングするGUIツール
2)Pan(パン)
* SpoonでモデリングしたTransformationを 実行できるコマンドラインツール * 使い方は、以下の関連記事の 「【3】コマンドラインからの実行 ~ pan / kitchen ~」を参照のこと
https://dk521123.hatenablog.com/entry/2020/09/09/000000
3)Kitchen(キッチン)
* SpoonでモデリングしたJobを実行できる コマンドラインツール * 使い方は、以下の関連記事の 「【3】コマンドラインからの実行 ~ pan / kitchen ~」を参照のこと
https://dk521123.hatenablog.com/entry/2020/09/09/000000
4)Carte(カルテ)
* Webサーバーとして動作し、 サーバ側でTransformation/Jobを実行
■ 用語
BI
そもそも、BIとは?
* BI : ビジネスインテリジェンス(Business Intelligence) * 企業に蓄積.された大量データ(例:センサーログなど)を集め、分析し、 意思決定を助けるのためのツール
https://data.wingarc.com/what-is-bitool-6123
主なBIツール
[1] Pentaho [2] BI Browser [3] Tableau etc...
Tableau ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/12/15/000000
ETL
Extract ... 抽出 Transform ... 変換 Load ... ロード (読み込み)
Transformation / Job
Transformation
* ETL処理(データを抽出/変換/ロードする)を実行する処理単位
Job
* Transformationをまとめて実行する処理単位
関連記事
Pentaho ~ 環境設定編 ~
https://dk521123.hatenablog.com/entry/2020/09/10/174223
Pentaho ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/09/09/000000
Pentaho ~ 基本編 ~
https://dk521123.hatenablog.com/entry/2020/09/13/000209
Pentaho ~ DBを扱う ~
https://dk521123.hatenablog.com/entry/2020/09/11/154403
Pentaho ~ 簡単なETL処理を行ってみる ~
https://dk521123.hatenablog.com/entry/2020/09/12/164214