Apache Flink

【Flink】Apache Flink ~ Table API & SQL ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/10/03/212007 の続き。 Flinkによる Lake Formationとの接続を ChatGPT でサンプルコード出してもらったら() 目次 【1】Table API & SQL 1)Table API 2)SQL 3)Catalogs 【2】準備 - 依存ラ…

【Flink】Apache Flink ~ DataStream API ~

■ はじめに Flinkによる Lake Formationとの接続を調べる際に DataStream API が候補に挙がったので調べてみた 目次 【1】DataStream API 1)公式ドキュメント 2)一般サイト 【2】準備 - 依存ライブラリ - 1)sbt 【3】サンプル 例1:Hello World 【…

【Flink】Apache Flink ~ RichParallelSourceFunction ~

■ はじめに RichParallelSourceFunction について調べてみた 目次 【1】RichParallelSourceFunction 1)使用上の注意 2)サンプル 【1】RichParallelSourceFunction 1)使用上の注意 調べた後に気が付いたが、非推奨だった https://nightlies.apache.or…

【AWS】Amazon EMR ~ Flink / あれこれ編 ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/07/16/000000 https://dk521123.hatenablog.com/entry/2023/08/19/025641 の続き。 今回は、Amazon EMR 上で Flink を動かすうえで学んだことを 徐々にではあるが、まとめておく 目次 【1】Flink を…

【AWS】Amazon EMR ~ Flink / 入門編 ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/07/16/000000 の続き。 今回は、Amazon EMR 上で、Flink を実行する際に 結構ハマりまくったので、メモっておく 目次 【1】Flink 実行までの手順 Step1:EMRクラスタを作成 Step2:Flink YARNを開…

【AWS】Amazon EMR ~ Flink / Glue Data Catalog ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/07/16/000000 の続き。 今回は、Amazon EMRのFlinkにおいて、 AWS Glue Data Catalog を使用する際の技術事項をメモっておく 目次 【0】注意点 1)AWS EMR の Flink 部分の公式ドキュメントの日本…

【Flink】Apache Flink ~ Flink to PostgreSQL ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/07/28/220039 で、環境構築したが、 今回は、Flink to PostgreSQLのFlinkコードのサンプルを書く 【0】前提条件 * 以下の関連記事を参考に環境構築していること Apache Flink ~ 環境構築 / Docker …

【Flink】Apache Flink ~ 引数の扱い / ParameterTool ~

# ■ はじめに 小ネタ。 FlinkでParameterTool ってのをしったのでメモ。 目次 【1】ParameterTool 【2】パラメータの取得方法 【3】パラメータの使用方法 【4】sbt run による引数設定の仕方 【5】サンプル 【1】ParameterTool * Flink が用意している…

【Flink】Apache Flink ~ 環境構築 / Docker compose編 ~

■ はじめに Apache Flink をやっているのだが、 ほとんど情報がない。 ましてや、ちょっとハードルをあげる、 例えば、Flinkで処理したデータをDBに入れる ってなると、ほぼほぼ皆無な状況。 そこで、今回は、そんな試行錯誤した Apache Flink + PostgreSQL …

【Flink】Apache Flink ~ 基本編 ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/03/01/235100 https://dk521123.hatenablog.com/entry/2023/05/29/000000 の続き。 今回は、Apache Flink の ベースとなるAPIやサンプルをまとめる。 目次 【1】Flink ソース外観 1)外観 【2】主…

【AWS】Amazon EMR ~ Flink / 基礎知識編 ~

■ はじめに EMR 上で Flink を動かす可能性がでてきたので 徐々にメモっておく 目次 【1】AWS環境でFlinkを実行するには 【2】ドキュメント 【3】バージョンの関連性 【4】ログの場所 【1】AWS環境でFlinkを実行するには * AWS環境でFlinkを実行する際…

【Flink】Apache Flink ~ Streaming vs Batch ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/04/26/103421 で、Kafkaの有用性を述べたが 仕事で、ストリーミング処理のメリデメなどを 纏めることになった。 そこで、ストリーミング処理と対比される処理として バッチ処理と比較して、その優位…

【Flink】Apache Flink ~ 入門編 ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/03/05/235755 https://dk521123.hatenablog.com/entry/2023/05/09/235256 https://dk521123.hatenablog.com/entry/2023/03/01/235100 の続き。 Apache Flink の Hello world をやってみる。 目次 【…

【Flink】Apache Flink ~ 環境構築 / Kubernetes 編 ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/03/05/235755 で、Windowsのローカル上に、Apache Flink の環境構築したのだが Kubernetes (Amazon EKS) で構築することになったので 予習として、自分のローカル上に構築してみる。 目次 【1】Kube…

【Flink】Apache Flink ~ 環境構築編 ~

■ はじめに https://dk521123.hatenablog.com/entry/2023/03/01/235100 の続き。 今回は、Apache Flinkの開発環境を整える 目次 【1】サポートOS 【2】Windows での環境構築について 失敗談1:.bat での実行 失敗談2:Cygwin での実行 【3】環境構築手…

【Flink】Apache Flink ~ 基礎知識編 ~

■ はじめに Apache Flink (アパッチフリンク) ってのが 話題にあがったので、調べてみた。 目次 【0】Top Big Data frameworks in 2023 【1】Apache Flink 0)公式サイト 1)ライセンス 2)最新バージョン 3)プログラム言語 【2】その他の特徴 1)E…