■ はじめに
機械学習に関する覚書をコツコツ、メモる。
■ 機械学習を導入する前に...
* 解決したいビジネス問題から始める => 機械学習で何をするかではなく、 何らかの問題がありその解決案として 機械学習を用いるであればOK => 別に機械学習を使用せずに解決できるのであれば、 そちらで対応すべき
■ AI / 機械学習 / ディープラーニング の違い
イメージ
+-<AI>------------------------------+ | +-<機械学習>------------------+ | | | +-<ディープラーニング>--+ | | | | | | | | | | | | | | | | +----------------------------+ | | | +---------------------------------+ | +-------------------------------------+
差異
* ML = Machine Learning (機械学習) * DL = Deep Learning (ディープラーニング)
学習 | 予測モデル | 教師データ | 特徴量設定 | |
---|---|---|---|---|
AI | なし (人間がモデル作成) | - | - | - |
ML | あり | 統計 | 表形式データ | 人間 |
DL | あり | ニューラルネットワーク | 画像,自然言語 | 自動 |
■ 機械学習のフロー
【1】データの収集 【2】データの前処理 【3】機械学習モデリング 【4】モデルのテスト 【5】モデルを公開
フロー図
+-------------+ | Start | +-------------+ | +-------------+ | | | Models | | | +-------------+ | | | Training | | | +-------------+ | | | Prediction | | | +-------------+ | +-------------+ | END | +-------------+
■ 機械学習の3分類
https://aidemy.net/courses/2010/exercises/5c01Gob_NY
【1】教師あり学習(supervised learning) 【2】教師なし学習(unsupervised learning) 【3】強化学習(reinforcement learning)
【1】教師あり学習
=> 正解ラベルのついたデータを学習し、 正解を予想するモデルを作成する手法 1-1)分類(classification) ... データからそのを予想 1-2)回帰(regression) ... データから数値を予想
【2】教師なし学習
=> 正解ラベルのないデータを学習し、 規則性などを発見する手法
【3】強化学習
=> 試行錯誤を通じて、価値を最大化するような 取るべき行動を決定する手法
■ 過学習(over-fitting)
* モデルが「訓練データさえ正解になればいい」と 状態になってしまうことで 未知のデータ(訓練データに含まれない,モデルが知らないデータ) に対する結果がデタラメになりがちになる
参考文献
http://gihyo.jp/dev/serial/01/machine-learning/0009?page=2
http://gihyo.jp/dev/serial/01/machine-learning/0021
関連記事
IT技術の学習サイト
https://dk521123.hatenablog.com/entry/2020/02/29/003619
機械学習を勉強する際のデータセットについて
https://dk521123.hatenablog.com/entry/2020/03/28/131839