Azure Machine Learning概要

Azure Machine Learningとは

  • Azureのコンピューティングリソースを使ってWebブラウザ上で行う機械学習プラットフォーム
  • データの取り込み、加工、機械学習、評価、データ出力などが可能
  • 既存の機械学習アルゴリズムだけでなくRやPythonのような既存スクリプトも利用可能

Azure Machine Learningのワークスペース

  • Azure MLはML Studioというツールで実験を行う
  • ML StudioはWebブラウザで操作する
  • 基本的な流れ
    • モジュール一覧(1)からモジュールをキャンバス(2)にドラッグアンドドロップ
    • モジュールのパラメータをプロパティ(3)から設定
    • モジュールを配置し終わったらRunボタンで実験開始

モジュールカテゴリ

  • Azure MLのモジュールはカテゴリごとに分けてある
  • カテゴリとその概要一覧
名前 概要
Saved Dataset 最初から提供されるもしくはユーザーが作成orアップロードしたデータ
Trained Models ユーザーが以前までの実験で学習、保存した学習モデル
Data Format Conversions モジュールに流れ込むデータを特定のフォーマット(CSVなど)に変換。モジュールから直接ダウンロードも可能
Data Input and Output ワークスペースにデータを入れる入出力のインターフェース。SQL Azureからのデータ取り込みや、HTTPサーバーによって提供されるCSVなども取り込める
Data Transformation データ変換を行う。機械学習におけるデータ加工を提供するモジュール一覧
Feature Selection 特徴抽出
Machine Learning 実際の機械学習アルゴリズムを提供する。アルゴリズムに対しデータを適用するScoreやScoreから生成されたデータを評価するEvaluateモジュールもある。
OpenCV Library Modules OpenCVのアルゴリズムを提供するモジュール
Python Language Modules Pythonスクリプトの実行モジュール
R Language Modules Rスクリプトの実行モジュール
Statistical Functions 統計計算を提供するモジュール
Text Analytics テキスト処理を提供する
Deprecated データ中の余分なデータを処理する
Web Service 学習モデルをWebServiceにするときのデータ入出力を提供する

Azure Machine LearningのWebサービス化

  • 作成した実験はWebサービスとして提供可能
  • Http PostでWebリクエストを行うことで利用できる
  • Azure MLが提供するWeb APIは以下の2つ
API名 概要
REQUEST/RESPONSE 少量のデータを送信することで結果を取得する
BATCH EXECUTION Azure Storage上にある大容量データを使用し、大量のデータに対し大量の結果を取得する。