2.2 汎化、過剰適合、適合不足

  • 汎化能力: 未知のデータ(訓練に使ってないデータ)に対する正しい値を予測する能力。
  • 過剰適合: 訓練データはめっちゃ正確に予測できるけど新しいデータはてんでダメという状態。
  • 適合不足: 訓練データすらちゃんと予測できてないという状態。

一般的にはモデルを複雑にするほど訓練データに適合していく。適合不足でなく、過剰適合にならない適度なモデルの複雑さの時に汎化能力が最大になる。そこを目指そう。

2.2.1 モデルの複雑さとデータセットの大きさ

  • モデルが複雑でも、データセットが大きければ過剰適合を避けられる。
  • 適度な複雑さのモデルと十分に大きなデータセットを使うことが成功のポイント。