6/04/2015

Azure Machine Learning の Execution Python Script モジュール向けコードのデバッグについて

 Azure Machine Learningには、Pythonスクリプトを実行することができるモジュールが存在しますが、Pythonスクリプトに慣れていない人にとっては苦痛です。しかも、Azure Machine Learningの実行時には、DataFrameのデータを操作しないといけないのです。今回はローカルのWindows PCでExecution Python Scriptのコードを書くために便利な方法を紹介します。

Pythonのインストール

 ローカルのWindows PCにPythonをインストールします。ローカルのWindows PCにPythonが入っていれば、コードのデバックもできて便利です。Azure Machine Learningで使用可能なPythonのモジュールを個別にインストールするのは大変ですので、下記のAnaconda Pythonディストリビューションを利用します。このAnaconda Pythonディストリビューションは、Azure Machine Learningで使われています。

https://store.continuum.io/cshop/anaconda/

Python Tools for Visual Studio のインストール

 Visual Studioを使っている方は、Python Tools for Visual Studioをインストールしてみてください。ブレイクポイントを使用したデバックも可能になります。

https://pytools.codeplex.com/

Execution Python Scriptのコードを書いてみる

 それでは、Execution Python Script のコードを書くために、Visual Studio から新規の Python Application のプロジェクトを作成します。作成したらPythonスクリプトを下記のコードに置き換えてください。このコードを使って、Execution Python Script の Pythonスクリプトを書いていきます。

 

 azureml_main に入力される Dataframe は、コードの下部にある csvファイルから読み込みます。csvファイルはラベル付のデータになります。書き終えたらブレイクポイントを設定したり、ステップ実行したり、変数を確認することができるので、デバックが楽しくなります。

ml07

 動作を確認したPythonスクリプトを作成したら、Azure Machine Learning の Execution Python Script にazureml_main のコードをコピーして完成です。

さいごに

 もっと良い方法があるかもしれませんが、この方法を使うと慣れないPythonスクリプトも簡単に書くことができます。

やっぱり、C#のほうが日本語を扱いやすいので、C#を使いたい。