まえおき
方針とか
実行環境とか
サンプルコード実行用Jupyter notebook
この文章を執筆しているRStudio
R sessionInfo
Python環境
1
はじめに
1.1
なぜ機械学習なのか
1.1.1
機械学習で解決可能な問題
1.1.2
タスクを知り、データを知る
1.2
なぜPythonなのか?
1.3
scikit-learn
1.3.1
インストール
1.4
必要なライブラリとツール
1.5
Python 2 vs. Python 3
1.6
最初のアプリケーション: アイリスのクラス分類
1.6.1
データを読む
1.6.2
成功度合いの測定: 訓練データとテストデータ
1.6.3
最初にすべきこと: データを良く観察する
1.6.4
最初のモデル: k-最近傍法
1.6.5
予測を行う
1.6.6
モデルの評価
2
教師あり学習 (1)
2.1
クラス分類と回帰
2.2
汎化、過剰適合、適合不足
2.2.1
モデルの複雑さとデータセットの大きさ
2.3
教師あり機械学習アルゴリズム
2.3.1
サンプルデータセット
2.4
アルゴリズム1
\(k\)
-最近傍法
2.4.1
\(k\)
-最近傍法によるクラス分類
2.4.2
KNeighborsClassifierの解析
2.4.3
\(k\)
-近傍回帰
2.4.4
KNeighborsRegressorの解析
2.4.5
利点と欠点とパラメータ
2.5
アルゴリズム2 線形モデル
2.5.1
線形モデルによる回帰
2.5.2
線形回帰(通常最小二乗法)
2.5.3
リッジ回帰
2.5.4
Lasso
2.5.5
クラス分類のための線形モデル
2.5.6
線形モデルによる多クラス分類
2.5.7
利点、欠点、パラメータ
2.6
アルゴリズム3 ナイーブベイズクラス分類器
2.6.1
利点、欠点、パラメータ
2.7
アルゴリズム4 決定木
2.7.1
決定木の構築
2.7.2
決定木の複雑さの制御
2.7.3
決定木の解析
2.7.4
決定木の特徴量の重要性
2.7.5
長所、短所、パラメータ
3
教師あり学習 (2)
3.1
アルゴリズム5 決定木のアンサンブル法
3.1.1
ランダムフォレスト
3.1.2
勾配ブースティング回帰木(勾配ブースティングマシン)
3.2
アルゴリズム6 カーネル法を用いたサポートベクタマシン
3.2.1
線形モデルと非線形特徴量
3.2.2
カーネルトリック
3.2.3
SVMを理解する
3.2.4
SVMパラメータの調整
3.2.5
SVMのためのデータの前処理
3.2.6
利点、欠点、パラメータ
3.3
ニューラルネットワーク(ディープラーニング)
3.3.1
ニューラルネットワークモデル
3.3.2
ニューラルネットワークのチューニング
3.3.3
長所、短所、パラメータ
Published with bookdown
Pythonで始める機械学習の学習
1.2
なぜPythonなのか?
つよい
汎用言語の強さとドメイン特価スクリプト言語の強さがある。
Jupyter Notebookが使える
データ解析はインタラクティブな過程。