【AWS】Athena ~ 入門編 ~

■ はじめに

AWS上のでかいファイルを確認するのに、
Amazon Athena (アテナ) をいじる機会を得たので、メモする。

目次

【1】Amazon Athena とは?
【2】S3上のファイルに対して、SELECT文を実行するまで
【ZZ】トラブルシューティング

【1】Amazon Athena とは?

* S3内のデータを標準SQLを利用して分析できるAWSのサーバレスサービス
 => EMRで利用されているオープンソースの分散型SQLクエリエンジンである
  Presto(プレスト)を内部で使用している
  (EMR については、以下の関連記事を参照のこと)

https://dk521123.hatenablog.com/entry/2020/02/20/230519

【2】S3上のファイルに対して、SELECT文を実行するまで

1)Athena の設定を行う

※ この処理を飛ばすと、後述の「1)エラー「No output location provided.」が表示される」が発生する

[1] AWSマネジメントコンソール画面で、[Athena]-[Settings](画面の右上にある)を選択
[2] 以下を入力し、「Save」ボタン押下
Query result location:任意のS3パス(今回は「s3://your-s3-bucket/athena/」)

2)データベースとテーブルを作成する

SQLぽくもできるし、GUI でできる。

GUIでやるなら、右上の [Tutorial] を押して、やるといいかも
以下が参考になる。

https://qiita.com/nghinv/items/c0dfd691e2c0b20ecb73

3)SQL文実行する

SQL文(今回は、SELECT文)を書いて、「Run query」をして、SQL文を実行する

【ZZ】トラブルシューティング

1)エラー「No output location provided.」が表示される

テーブルを作ろうとしたら、以下の「エラー内容」が表示され
テーブルが作れなかった。

エラー内容

No output location provided.
An output location is required either through
 the Workgroup result configuration setting or as an API input.

解決案

上記の「【2】 S3上のファイルに対して、SELECT文を実行するまで」の
手順「1)Athena の設定を行う」を行う。

参考文献
https://docs.aws.amazon.com/ja_jp/athena/latest/ug/workgroups-troubleshooting.html

参考文献

https://qiita.com/44yama/items/9b2f26b214de92a0f36c#aws-athena%E3%81%A3%E3%81%A6%E4%BD%95
https://tech.core-j.co.jp/entry/athena_simple_setting

関連記事

Athena ~ 基本編 / AWS Glue との連携 ~
https://dk521123.hatenablog.com/entry/2020/07/15/162459
Athena ~ AWS CLI
https://dk521123.hatenablog.com/entry/2023/10/13/144254
AWS Glue ~ 基本編 / クローラ ~
https://dk521123.hatenablog.com/entry/2019/12/01/003455
Amazon EMR ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/02/20/230519
AWS認定 ~ アソシエイト/ソリューションアーキテクト ~
https://dk521123.hatenablog.com/entry/2022/03/01/000000