2021-05-13から1日間の記事一覧

【分散処理】PySpark ~ パーティション ~

■ はじめに PySpark に関して、 パーティション (Partition) 付きでファイル出力があったので そのことを含めて、パーティションにまつわるTipsをまとめておく cf. Partition = 仕切り壁、分割、分配 目次 【1】パーティションの基本操作 1)現在のパーテ…