Azure Machine Learning Tutorialに献血識別のチュートリアルを追加しました

前回作ったAzure Machine Learning Tutorialですが新しく献血データを使って献血に行った人とそうでない人を分類する識別チュートリアルを追加しました。 https://github.com/garicchi/azureml-tutorial/tree/master/blood-classify Azure Machine Learningにはデフォルトでいくつかサンプルのデータセットがついているのでその中の一つである「blood donation data」を使いました。データの内訳はこのようになっていて、0か1かが書かれているClassを識別します。 このチュートリアルを作っていて初めて気づいたのですがAzure MLにはSMOTEモジュールというものがあり、これを使うことによってデータの不均衡をオーバーサンプリングによって均等にすることができます。 Two Class Neuralnetworkを用いて識別、10点交差検証した結果、F値0.6とあまり良い結果にはなりませんでした。パラメータ調整とか特徴量選定とかの余地がありますね。

Azure Machine Learning チュートリアルを公開しました

先日CLR.H in TokyoでAzure Machine Learningについて登壇してきたわけですが、その時に作ったAzure Machine Learningのチュートリアルを公開します。 https://github.com/garicchi/azureml-tutorial 内容は気象庁の過去データを使って数時間後の気温を回帰分析で予測するという内容です。 インターネットのない環境でせこせこ作ってたのでスクリーンショット付きでわりとわかりやすいかと思います。 まあ機械学習系のチュートリアルは公式ドキュメントなどいろんなところに落ちてるわけですが、たいていデータセットが予め用意されているのでどういうデータがなぜ必要なのかとかがわからないパターンが多く そんな中で気象庁のデータは非常にわかりやすい形で回帰分析を学ぶことができるデータセットだと思っています。 Azure Machine Learningに入門したい方はぜひお試しあれ