【Hive】Hive / HiveQL ~ LOAD DATA ~

■ はじめに

 トラブルシュートの切り分けの一環で、
HDFS内にファイルをインポートすることをやったのでメモ。

目次

【1】LOAD DATA
【2】CSVファイルをHDFS内にインポートする
 0)前準備
 1)LOAD DATA 実行

【1】LOAD DATA

* CSVなどのファイルをHiveテーブルに対してインポートできる

【2】CSVファイルをHDFS内にインポートする

以下のサイトが大変参考になりました。感謝。。。

https://qiita.com/niwasawa/items/ff8335e0d5f9a67b97fa

0)前準備

* 以下をhiveで実行する

コマンド例

-- [1] データベース作成
CREATE DATABASE sample_db LOCATION '/user/hive/warehouse';

-- [1] の確認
show databases;

# [2] テーブル作成
CREATE TABLE sample_db.sample_table (
  id STRING,
  name STRING
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
LINES TERMINATED BY '\n'
STORED AS TEXTFILE
LOCATION '/user/hive/warehouse/sample_db/sample_table'
;
# [2] の確認
SHOW CREATE TABLE sample_db.sample_table;

インポートするCSV(/home/hadoop/sample.csv

X0001,Mike
X0002,Tom

1)LOAD DATA 実行

-- LOAD DATA を実行
LOAD DATA LOCAL INPATH 'file:/home/hadoop/sample.csv'
INTO TABLE sample_db.sample_table;

-- 確認 (サンプルデータが表示されたらOK!)
SELECT * FROM sample_db.sample_table;

OK
X0001 Mike
X0002 Tom
Time taken: 0.333 seconds, Fetched: 2 row(s)

参考文献

https://atmarkit.itmedia.co.jp/ait/articles/0903/09/news094.html

関連記事

Hive / HiveQL ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/02/25/231235
Hive / HiveQL ~ 基本編 ~
https://dk521123.hatenablog.com/entry/2020/06/02/183823
Hive / HiveQL ~ テーブル作成 ~
https://dk521123.hatenablog.com/entry/2020/11/03/000000
Hive / HiveQL ~ データベース関連 ~
https://dk521123.hatenablog.com/entry/2022/05/12/150249