学習データ中の連続値の離散化

機械学習で分類器を作るのに、連続値の離散化が必要になったのでメモ。離散化1つにたくさんあるらしい。大体はRを使えばできそう。

今やりたい離散化が書いてある論文

Fayyad, Usama M.; Irani, Keki B. (1993) "Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning"

http://ijcai.org/Past%20Proceedings/IJCAI-93-VOL2/PDF/022.pdf

  

各離散化手法のまとめ・概説

d.hatena.ne.jp

MDLPってやつらしい。

 

Rでのチュートリアル

d.hatena.ne.jp 

 

MDLPをRで動かしてみる。手でプログラム書いてRと一致したらOK。