機械学習のための【正規化】と【標準化】の違い

機械学習のための【正規化】と【標準化】の違い

統計学の書物を読んだり、機械学習の本を読んでいると、当たり前の様に【正規化】、【標準化】という言葉が出てきます。 特徴量のスケーリング(Feature Scaling)に使用します。 ググっても難しい表現が多いので、乞食(私です)でも解るように説明したいと思います。 定義 正規化…変数を0~1の値に収めること 標準化…変数を平均0、分散1に変換すること これだけです。 画像はとしやなさんより https://qiita.com/toshi_machine/items/0d72ebfbd42bdd030d38より 今回は変数を[1, 10, 100, 1000, 10000]とします。 つまり変数は5つです(-ω-)/ では、正規化からいきます。 変数=1のとき(最小値) 上記の式に、変数Xiに1を代入してみます。 1(変数)-1(最小値)÷ 10000(最大値)-1(最小値)= 0 変数=10000のとき(最大値) 上記の式に、変数Xiに10000を代入してみます。 10000(変数)-1(最小値)÷ 10000(最大値)-1(最小値)= 1 これだけです。 見事に変数は0~1の値に収