2020-07-08から1日間の記事一覧

【分散処理】PySpark ~ データをクリーニングする ~

■ はじめに https://dk521123.hatenablog.com/entry/2020/07/06/232350 で行った処理を、PySpackで行ってみた 目次 【1】CASE文を使って値を置き換える 【1】CASE文を使って値を置き換える from pyspark import SparkContext from pyspark.sql import Spar…