【Pentaho】Pentaho ~ 基礎知識編 ~

■ はじめに

BIツールの内、Pentaho (ペンタホ)について、調べてみた

■ Pentaho

* オープンソースのBIツール
* Java製

参考文献
https://thinkit.co.jp/article/1153/1
http://m12i.hatenablog.com/entry/2015/04/12/083508
https://www.ossnews.jp/oss_info/Pentaho/1

■ Pentaho Data Integration(PDI)

* 日本語だと、Pentahoデータ統合
* 別名は、Kettle(ケトル)
 ⇒ Kettle Extraction Transformation Transportation & Loading Environment

構成

「Kettle」配下には、複数のコンポーネントが存在する

1)Spoon(スプーン)
2)Pan(パン)
3)Kitchen(キッチン)
4)Carte(カルテ)

1)Spoon(スプーン)

* ETLをモデリングするGUIツール

2)Pan(パン)

* SpoonでモデリングしたTransformationを
 実行できるコマンドラインツール
* 使い方は、以下の関連記事の
 「【3】コマンドラインからの実行 ~ pan / kitchen ~」を参照のこと

https://dk521123.hatenablog.com/entry/2020/09/09/000000

3)Kitchen(キッチン)

* SpoonでモデリングしたJobを実行できる
 コマンドラインツール
* 使い方は、以下の関連記事の
 「【3】コマンドラインからの実行 ~ pan / kitchen ~」を参照のこと

https://dk521123.hatenablog.com/entry/2020/09/09/000000

4)Carte(カルテ)

* Webサーバーとして動作し、
 サーバ側でTransformation/Jobを実行

参考文献
https://www.compiere-distribution-lab.net/2013/06/25/pentaho-kettle-%E3%82%B1%E3%83%88%E3%83%AB-%E3%82%92%E4%BD%BF%E7%94%A8%E3%81%97%E3%81%A6%E3%81%BF%E3%82%8B/

■ 用語

BI

そもそも、BIとは?

* BI : ビジネスインテリジェンス(Business Intelligence)
* 企業に蓄積.された大量データ(例:センサーログなど)を集め、分析し、
   意思決定を助けるのためのツール

https://data.wingarc.com/what-is-bitool-6123
主なBIツール

[1] Pentaho
[2] BI Browser
[3] Tableau

etc...

Tableau ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/12/15/000000

ETL

Extract ... 抽出
Transform ... 変換
Load ... ロード (読み込み)

Transformation / Job

Transformation

* ETL処理(データを抽出/変換/ロードする)を実行する処理単位

Job

* Transformationをまとめて実行する処理単位

関連記事

Pentaho ~ 環境設定編 ~
https://dk521123.hatenablog.com/entry/2020/09/10/174223
Pentaho ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/09/09/000000
Pentaho ~ 基本編 ~
https://dk521123.hatenablog.com/entry/2020/09/13/000209
Pentaho ~ DBを扱う ~
https://dk521123.hatenablog.com/entry/2020/09/11/154403
Pentaho ~ 簡単なETL処理を行ってみる ~
https://dk521123.hatenablog.com/entry/2020/09/12/164214