■ はじめに

AWS Glue の CloudWatch Metrics(メトリクス) について、
徐々にメモする。

【１】公式ドキュメント
【２】関連用語
　１）ステージ（Stages）
　２）タスク（Tasks）
　３）ドライバ（Driver）
　４）エグゼキュタ（Executors）
【３】メトリクスの構成
　１）ETL Data Movement
　２）Data shuffle across executors
　３）Memory profile: Driver and Executors
　４）CPU Load: Driver and Executors
　５）Job Execution: Active Executors, Completed Stages & Maximum Needed Executors

【１】公式ドキュメント

要求の厳しいステージとストラグラータスクのデバッグ
https://docs.aws.amazon.com/ja_jp/glue/latest/dg/monitor-profile-debug-straggler.html
DPU の容量計画のモニタリング
https://docs.aws.amazon.com/ja_jp/glue/latest/dg/monitor-debug-capacity.html

を一読しておくといいかも。

１）ステージ（Stages）

* Sparkは 全体の処理を ステージ と呼ばれる単位で分割して扱う

２）タスク（Tasks）

* ステージを更に分割した処理単位（分散処理における最小処理単位）
* Task数 = Partition数 * Stage数

３）ドライバ（Driver）

* 処理全体を統括しているプロセス

４）エグゼキュタ（Executors）

* 分散処理(Task)を実際に実行するプロセス

【３】メトリクスの構成

以下で構成されている。

１）ETL Data Movement
２）Data shuffle across executors
３）Memory profile: Driver and Executors
４）CPU Load: Driver and Executors
５）Job Execution: Active Executors, Completed Stages & Maximum Needed Executors

１）ETL Data Movement

* ETL データ移動
 => 実行しているETLの
　　データの読み込み（Read）と書き込み（Writtern）の推移をグラフ表示

２）Data shuffle across executors

* エグゼキュタ間のデータシャッフル

３）Memory profile: Driver and Executors

* メモリプロファイル：ドライバとエグゼキュタ

グラフの読み取りについて

* メモリ使用率が全体的に高い・低すぎる場合
 => NumberOfWorkers / Worker typeの変更を検討する

https://docs.aws.amazon.com/ja_jp/glue/latest/dg/aws-glue-api-jobs-job.html

NumberOfWorkers 数値 (整数)。–
ジョブの実行時に割り当てられた、定義済みの workerType ワーカー数。

WorkerType – UTF-8 文字列 (有効な値: Standard="" | G.1X="" | G.2X="")。

４）CPU Load: Driver and Executors

* CPUロード：ドライバとエグゼキュタ

グラフの読み取りについて

* CPU使用率が全体的に高い・低すぎる場合
 => 「３）Memory profile: Driver and Executors」と同様に
　　NumberOfWorkers / Worker typeの変更を検討する

５）Job Execution: Active Executors, Completed Stages & Maximum Needed Executors

* ジョブ実行：アクティブなエクゼキュータ、完了したステージ、必要なエクゼキュータの最大数

グラフの読み取りについて

* Max Allocated Executors を超えている場合
 => DPU数を増やせば、処理速度の改善が期待できる

* Max Allocated Executors より著しく少ない場合
 => DPU数を減らせば、コスト削減できる可能性がある

参考文献

https://buildersbox.corp-sansan.com/entry/2021/02/04/110000
https://dev.classmethod.jp/articles/20180717-aws-glue-support-etl-job-metrics/
https://qiita.com/pioho07/items/4b97b61f2ec098afb695

AWS Glue ～入門編～
https://dk521123.hatenablog.com/entry/2019/10/01/221926

プログラムの超個人的なメモ

Memo for Programming.

【AWS】AWS Glue ～ CloudWatch Metrics ～

■ はじめに

目次

【１】公式ドキュメント

【２】関連用語

【３】メトリクスの構成

１）ETL Data Movement

２）Data shuffle across executors

３）Memory profile: Driver and Executors

４）CPU Load: Driver and Executors

５）Job Execution: Active Executors, Completed Stages & Maximum Needed Executors

参考文献

関連記事