Azure + Tensorflow + Kerasで画像認識やってみた part1

「Azure VMのGPUマシンにてKerasを使ってCNNで画像認識をしてみた」です。

最終目的はCTスキャンで取得したDICOMファイルを投げたら、臓器や骨ごとにラベリングした3Dモデルを返すことです。

が、とりあえずお約束のMNIST（エムニストと読むらしい）をやってみます。

はじめに

画像認識を始めようと思い色々調べてみて判明したことを簡単に羅列します。

手法について

画像認識には色々な手段があり、ディープラーニング（層の深いニューラルネット）はその一手法
よく聞くCNNはディープラーニングの一種であり、画像認識で目覚しい結果を出した

ライブラリについて

ディープラーニングライブラリにはTensorflow、Theanoなどの選択肢があるがいずれも学習コストが高い
自由度は下がるが、KerasやChainerだと初心者にも比較的敷居が低い
- KerasはTesorflow、Theanoのラッパー

マシンについて（GPU）

ディープラーニングでは計算量が膨大なのでGPUを使用する
- 並列計算できることでCPUより圧倒的に早い
クラウドGPUとしてAzure Virtual Machine、AWS EC2が選択肢に挙げられる
Azure Virtual Machineは分単位の課金なので個人でも気軽に始められる
- Microsoftの勉強会に参加すると無料でクレジットをプレゼントしてくれたりする
Azure Virtual Machineには様々なシリーズがあり、GPUを使えるのはNシリーズである
- NシリーズにはNV、NC、NC2など色々あるが、とりあえずは一番安いのを使えば良い
- 違いを知りたい方はこちらの記事にまとめました

AzureでGPUインスタンス作成

Azureにログイン

Virtual Machinesを選択します

左上の追加ボタンから新しいVMを作成します

OSは「Ubuntu 16.04 LTS」を選択しました。

デプロイモデルはデフォルトの「Resource Manager」にして作成をクリック。

2017/05 情報

今回GPUを使用したNC, NVシリーズを使用するのですが、こちらに

現時点では、Linux GPU ドライバーのサポートは、Azure NC VM でのみご利用いただけます。

とあります。2017年5月現在NCシリーズは東日本、西日本リージョンでは利用できないので、「リージョン別のAzure製品」から利用可能な地域を選択する必要があります。

2017/12/26 追記

こちらでもまとめたようにNVシリーズにこだわる必要はないです。

NCシリーズで妥協すれば東日本リージョンでもOKです。

ちなみに現在のリージョン別対応表。

SSHの応答速度的に快適さを求めるなら東日本でNVシリーズ

安さを求めるなら米国東部、米国西部2あたりでNCシリーズ

こんなところでしょうか。

お試し段階では何日もVM立てっぱなしってわけでもないので、東日本が快適かなと思います。

名前、ユーザー名、パスワード（or SSH鍵）、Resource groupをよしなに入力します。

ディスクの種類はHDDにします。

「東日本」を選択して「OK」（画像は米国西部2になっていますが）。

「サイズの選択」画面に移るので、「すべて表示」。

NVシリーズを選択します。

2017/05 情報

先の

現時点では、Linux GPU ドライバーのサポートは、Azure NC VM でのみご利用いただけます。

という文言が気になりますが、進めます。

こちらのチュートリアルはNVシリーズも対象にしていますが、やはりNVシリーズは推奨ではないようです。

Regarding the question of running GPU compute for deep learning on NV-Series, the GPU team has indicated that is not recommended. Bottom line is: Big GPU Computes (like deep learning) should only be done on NC-Series. NV is for visualization and graphics. See this blog for more details on NV vs NC series

可能ならばNCシリーズを使うべきなのでしょうが、今回はテストということもありますし、NVシリーズをディープラーニングに活用する勉強会を公式が主催しているようなので、このまま進めます。

Japan Azure NV シリーズローンチイベント

2017/12/26 追記

上記イベントで聞いてみたところ、問題ないみたいです。

詳しくはこちら。

StorageをHDDに変更して、OK。STEP4の内容を確認してOK。