【機械学習】機械学習に関する覚書

■ はじめに

機械学習に関する覚書をコツコツ、メモる。

https://aidemy.net/

 ■ 機械学習を導入する前に...

 * 解決したいビジネス問題から始める

  => 機械学習で何をするかではなく、
   何らかの問題がありその解決案として
   機械学習を用いるであればOK

  => 別に機械学習を使用せずに解決できるのであれば、
   そちらで対応すべき

■ AI / 機械学習 / ディープラーニング の違い

イメージ

+-<AI>------------------------------+
|  +-<機械学習>------------------+  |
|  | +-<ディープラーニング>--+  |  |
|  |  |                                            |   |  |
|  |  |                                            |   |  |
|  |  +----------------------------+   |  |
|  +---------------------------------+  |
+-------------------------------------+

差異

* ML = Machine Learning (機械学習)
* DL = Deep Learning (ディープラーニング)
学習 予測モデル 教師データ 特徴量設定
AI なし (人間がモデル作成) - - -
ML あり 統計 表形式データ 人間
DL あり ニューラルネットワーク 画像,自然言語 自動

 ■ 機械学習のフロー

【1】データの収集
【2】データの前処理
【3】機械学習モデリング
【4】モデルのテスト
【5】モデルを公開

フロー図

 +-------------+
 |    Start    |
 +-------------+
        |
 +-------------+
 |             |
 |   Models    |
 |             |
 +-------------+
 |             |
 |  Training   |
 |             |
 +-------------+
 |             |
 | Prediction  |
 |             |
 +-------------+
        |
 +-------------+
 |     END     |
 +-------------+

機械学習の3分類

https://aidemy.net/courses/2010/exercises/5c01Gob_NY

【1】教師あり学習(supervised learning)
【2】教師なし学習(unsupervised learning)
【3】強化学習(reinforcement learning)

【1】教師あり学習

 => 正解ラベルのついたデータを学習し、
    正解を予想するモデルを作成する手法

 1-1)分類(classification) ... データからそのを予想
 1-2)回帰(regression) ... データから数値を予想

【2】教師なし学習

 => 正解ラベルのないデータを学習し、
    規則性などを発見する手法

【3】強化学習

 => 試行錯誤を通じて、価値を最大化するような
   取るべき行動を決定する手法

 ■ 過学習(over-fitting)

 * モデルが「訓練データさえ正解になればいい」と
   状態になってしまうことで
   未知のデータ(訓練データに含まれない,モデルが知らないデータ)
   に対する結果がデタラメになりがちになる

 参考文献

http://gihyo.jp/dev/serial/01/machine-learning/0009?page=2
http://gihyo.jp/dev/serial/01/machine-learning/0021

関連記事

IT技術の学習サイト
https://dk521123.hatenablog.com/entry/2020/02/29/003619
機械学習を勉強する際のデータセットについて
https://dk521123.hatenablog.com/entry/2020/03/28/131839