2020-05-20から1日間の記事一覧

【分散処理】PySpark ~ ユーザ定義関数 UDF 編 ~

■ はじめに PySpark の UDF (User Defined Function) っての学ぶ。 目次 【1】UDF とは 【2】UDF定義方法 1)udf関数から取り込む 2)デコレータを利用する方法 3)spark.udf.register() で登録する 【3】使用上の注意 【4】サンプル なお、以下の関…