学習データ中の連続値の離散化
機械学習で分類器を作るのに、連続値の離散化が必要になったのでメモ。離散化1つにたくさんあるらしい。大体はRを使えばできそう。
今やりたい離散化が書いてある論文
Fayyad, Usama M.; Irani, Keki B. (1993) "Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning"
http://ijcai.org/Past%20Proceedings/IJCAI-93-VOL2/PDF/022.pdf
各離散化手法のまとめ・概説
MDLPってやつらしい。
Rでのチュートリアル
MDLPをRで動かしてみる。手でプログラム書いてRと一致したらOK。