【Hadoop】Hadoop ~ 入門編 ~

■ はじめに

https://dk521123.hatenablog.com/entry/2019/09/13/212325

の続き。

Apache Hadoop について調べてみた

目次

【0】動画
【1】Hadoop(ハドゥープ)
【2】Hadoopの基本構成
 1)HDFS (Hadoop 分散ファイルシステム)
 2)Hadoop MapReduce (分散処理エンジン)  
 2’)Hadoop YARN

【0】動画

* Udacity(ユダシティ)の Freeコースがためになりそう。

Intro to Hadoop and MapReduce
https://www.udacity.com/course/intro-to-hadoop-and-mapreduce--ud617
Deploying a Hadoop Cluster
https://www.udacity.com/course/deploying-a-hadoop-cluster--ud1000
Big Data Analytics in Healthcare
https://www.udacity.com/course/big-data-analytics-in-healthcare--ud758
Machine Learning for Trading
https://www.udacity.com/course/machine-learning-for-trading--ud501

【1】Hadoop(ハドゥープ)

* 大量データを複数マシンで、
 分散して処理することができるオープンソース

プログラム言語

* Java

対応OS

* Linux

 【2】Hadoopの基本構成

Hadoopは、大きく分けて HDFS と MapReduce で構成されている。

1)HDFS (Hadoop 分散ファイルシステム)
2)Hadoop MapReduce (分散処理エンジン)  

構成図
https://www.casleyconsulting.co.jp/blog/engineer/150/

+---------------+---------------------+
|  Hadoop       |  HBase              |
|   MapReduce   | (分散データベース)    |
+---------------+---------------------+
|               HDFS                  |
|   (Hadoop Distributed File System)  |
+-------------------------------------+

1)HDFS (Hadoop 分散ファイルシステム)

* 以下の関連記事を参照のこと

Apache Hadoop ~ 基本編 / HDFS
https://dk521123.hatenablog.com/entry/2022/05/01/000000

2)Hadoop MapReduce (分散処理エンジン)

* 以下の関連記事を参照のこと

Apache Hadoop ~ 基本編 / MapReduce
https://dk521123.hatenablog.com/entry/2022/05/02/000000

2’)Hadoop YARN

* YARN : Yet-Another-Resource-Negotiator (まだ-ほかの-リソース-公証人)
* Hadoop2系
* 分散処理フレームワークHadoop MapReduceの仕組みが変更となり、
 分散リソース制御機構 Hadoop YARNとMapReduce ApplicationMasterの2つに分離

https://qiita.com/keigodasu/items/09f7e0a15d721b0b5212

  参考文献

http://www.atmarkit.co.jp/ait/articles/1106/21/news117.html
https://www.atmarkit.co.jp/ait/articles/1701/01/news013.html
http://www.atmarkit.co.jp/ait/articles/0807/08/news119.html
 https://blogs.itmedia.co.jp/itsolutionjuku/2015/06/hadoop.html
http://www.hitachi.co.jp/products/it/bigdata/column/column04.html

 関連記事

Hadoop ~ 環境設定 / Linux編 ~
https://dk521123.hatenablog.com/entry/2020/01/01/000000
Hadoop ~ 基本編 / HDFS
https://dk521123.hatenablog.com/entry/2022/05/01/000000
Hadoop ~ 基本編 / MapReduce
https://dk521123.hatenablog.com/entry/2022/05/02/000000
Hadoop ~ 設定プロパティ ~
https://dk521123.hatenablog.com/entry/2021/06/23/151148
Hive / HiveQL ~ 基礎知識編 ~
https://dk521123.hatenablog.com/entry/2019/11/25/235219
分散処理フレームワーク
https://dk521123.hatenablog.com/entry/2019/09/13/212325
Apache Spark ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2019/09/14/123206