2022-02-04から1日間の記事一覧

【分散処理】PySpark ~ CSV / MultiLine対応 ~

■ はじめに https://dk521123.hatenablog.com/entry/2019/11/24/225534 https://dk521123.hatenablog.com/entry/2020/07/30/195226 の続き。 今回は、PySparkにおいて、 CSVなどで改行が入った時の複数行(MultiLine)の対応について 触れたので、メモしてお…