【AWS】Amazon Redshift ~ 環境構築編 ~

■ はじめに

https://dk521123.hatenablog.com/entry/2020/02/22/002139

の続き。
今回は、環境構築についてのメモ。

■ 構築手順

事前準備

1) VPCを作成
 ⇒ 以下の「トラブル:目的の VPC が VPC のドロップダウンリストに表示されない」を参照

2)Redshift用のIAMロールを作成しておく
  ⇒ 今回は、IAMロールで、「Create Role」ボタン押下後に
   [Redshift]-[Redshift Customizable]を選択し、自分好みにロールを付与

手順

1)AWS マネジメントコンソールで、Redshiftのページにログインする
2)「Start cluster」ボタン押下
3)「Cluster configuration」画面で以下を入力
 3-1)Cluster identifier:任意の文字列(今回は「hello-world-redshift」)
 3-2)Node type:「RA3」or「DC2」を選択(今回は「RA3 (ra3.4xlarge)」)
 3-3)Nodes:ノード数(2-32)を入力 (今回は「2」)
 3-4)Database configurations:「Master user name/password」を入力
 3-5)Cluster permissions(optional):事前準備1)のIAMロールを選択し「Add IAM role」ボタン押下
4)「Network and security」を展開する
 4-1)VPC : 自環境のVPCを設定する(選べない場合は、以下の「トラブル」を参照)
5)「Create cluster」ボタン押下

■ トラブル

目的の VPCVPC のドロップダウンリストに表示されない

https://aws.amazon.com/jp/premiumsupport/knowledge-center/vpc-redshift-associate/

より抜粋

原因

考えられる原因は 2 つあります。

1. クラスターを作成しているリージョンに VPC が存在していない。
2. クラスターサブネットグループに VPC が関連付けられていない。
<< ★「サブネットグループ」が設定されているかを確認(確認方法は「動画」参照)★

解決方法

1. Amazon Redshift クラスターを起動するのと
 同じリージョンに VPC を作成します。
2. クラスターサブネットグループを作成します。
3. VPC 内で Amazon Redshift クラスターを起動します。
[Additional configurations] セクションで、[Use defaults] をオフにします。
次に、ドロップダウンリストから目的の VPC を選択します。

動画

上記のように書いてあるけど、よく分からないければ、
以下の動画(5:40付近から)を見たほうがいい。
英語だけど、確認方法までデモンストレーションしているので。

UIが新しくなっているので、以下、簡易手順。

[1] AWS マネージメントコンソール画面でRedshiftのページに飛ぶ
[2] 左ペインの[CONFIG]-[Subnet groups]を選択
 => Cluster subnet groupsページで、特に対象VPCに関わる設定がないことを確認
[3] 「Create cluster subnet group」ボタン押下し、Cluster subnet groupsを作成する
 => 作成後に、選択肢として、対象VPCが選択できることを確認する

https://www.youtube.com/watch?v=vJY9X-kdd9Q

参考文献

https://kikeda1104.hatenablog.com/entry/2018/07/05/213000
https://dev.classmethod.jp/articles/how-to-create-amazon-redshift-clusters/
https://qiita.com/zaburo/items/90ea92a64ac7e504a7a6

関連記事

Amazon Redshift ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/02/22/002139
Amazon Redshift ~ 基本編 ~
https://dk521123.hatenablog.com/entry/2020/08/31/171754
Amazon Redshift ~ COPY コマンド ~
https://dk521123.hatenablog.com/entry/2021/07/21/214248
Hiveテーブルデータ を Redshift に移行するには
https://dk521123.hatenablog.com/entry/2021/09/01/200818
Glue/Python から Redshift に接続することを考える
https://dk521123.hatenablog.com/entry/2020/08/26/193237
Glue/Spark から Redshift にデータ追加することを考える
https://dk521123.hatenablog.com/entry/2020/09/23/111741
Amazon VPC (Virtual Private Cloud)
https://dk521123.hatenablog.com/entry/2019/12/08/105415