■ はじめに

次のプロジェクトで、ビッグデータを扱う仕事になりそうで、
Hadoop  とか Spark とか Hive とかってキーワードがでてきたので
足掛かりに「分散処理フレームワーク」を調べてみる

【１】分散処理 (Distributed Processing) とは？

*  処理速度の向上と負荷軽減のために、
　複数のコンピュータで分散して処理すること

１）Apache Hadoop
２）Apache Spark

* メモリに乗り切る以上の大きいデータを処理する場合

* リアルタイムの高速処理を行う場合

* 複数マシンで効率的にデータ処理を行う仕組み

Hadoop ～入門編～
https://dk521123.hatenablog.com/entry/2019/09/15/100727

Apache Spark ～入門編～ https://dk521123.hatenablog.com/entry/2019/09/14/123206