変数選択において大切なこと

公開日: 2016年5月15日日曜日 データ解析

こちらにもありますように、変数選択を行う手法はたくさんあります。

しかし、どの手法を使えば良いかは、特に問題ありません。つまりどれでも良いわけです。

基本的に、どの手法も何かの指標の値を大きくするように、もしくは小さくするように変数を選択します。

大事なことは、その指標を何にするか、です。

基本的にはクロスバリデーション後のRMSEが用いられ、RMSEの値を小さくするように変数選択されます。

これが問題です。

クロスバリデーション後のRMSEが小さくなったからといって、新しいデータにおける誤差が小さくなるわけではありません。

この指標を工夫する必要があります。

より良い指標については別の記事に書きます。

  • ?±??G???g???[?d????u?b?N?}?[?N???A