機械学習を勉強する際のデータセットについて

■ はじめに

機械学習を勉強する際にデータセットが必要なのだが
チュートリアルするだけなのに自分でデータ集めんの大変。
無料で提供してくれるサイトもあるので、メモ。

目次

【1】UCI Machine Learning Repository
【2】Kaggle(カグル)
【3】SIGNATE

【1】UCI Machine Learning Repository

https://archive.ics.uci.edu/ml/index.php

 カリフォルニア大学アーバイン校(UCI; University of California, Irvine)
で監修された機械学習用データセット

使用した関連記事

Amazon SageMaker ~ 入門編 ~
https://dk521123.hatenablog.com/entry/2020/03/18/223033

【2】Kaggle(カグル)

https://www.kaggle.com/

世界中の機械学習・データサイエンスに携わっているコミニティ

使用した関連記事

「Titanic: Machine Learning from Disaster」を使用

scikit-learn ~ 決定木 / ランダムフォレスト ~
https://dk521123.hatenablog.com/entry/2020/04/04/021413

【3】SIGNATE

https://signate.jp/

* 登録が必要。
* 日本語

参考文献

https://ai-kenkyujo.com/2017/10/18/free-dataset/

関連記事

IT技術の学習サイト
https://dk521123.hatenablog.com/entry/2020/02/29/003619
機械学習に関する覚書
https://dk521123.hatenablog.com/entry/2018/10/23/230800