C++ REST SDK 接続確認のpingでjsonをかえすときのresponseの確認
pplx::task<void> RequestJSONValueAsync() { // TODO: To successfully use this example, you must perform the request // against a server that provides JSON data. // This example fails because the returned Content-Type is text/html and not application/json. http_client client(L"http://133.34.174.246:5000/ping"); return client.request(methods::GET).then([](http_response response) -> pplx::task<json::value> { if (response.status_code() == status_codes::OK) { return response.extract_json(); } // Handle error cases, for now return empty json value... return pplx::task_from_result(json::value()); }) .then([](pplx::task<json::value> previousTask) { try { const json::value& v = previousTask.get(); // Perform actions here to process the JSON value... wcout << v << endl; } catch (const http_exception& e) { // Print error. wostringstream ss; ss << e.what() << endl; wcout << ss.str(); } }); /* Output: Content-Type must be application/json to extract (is: text/html) */ } int wmain() { /*std::wcout << L"Calling HTTPStreamingAsync..." << std::endl; HTTPStreamingAsync().wait();*/ wcout << L"Calling RequestJSONValueAsync..." << endl; RequestJSONValueAsync().wait(); getchar(); }
responseがvで帰ってくる
TensorFlowをDockerでコンテナ化
まずanacondaの設定がすでに行われているimageを引っ張ってくる。
docker pull continuumio/anaconda3
pullされたimageを確認
docker images
すると
REPOSITORY TAG IMAGE ID CREATED SIZE continuumio/anaconda3 latest e3f7f02f1c66 2 days ago 981.2 MB
ok
このイメージ内のコンテナにtensorflow, opencv, Flaskをダウンロードする
docker run -it continuumio/anaconda3 /bin/bash
コンテナ内のbashから
conda install opencv conda install Flask conda install tensorflow
を実行
docker commit 142 username/fruits_dis:ver1.0
でリポジトリ作成
ビルドするときは
docker build -t rkr7x/fruits-dis:ver1.0 /pullしたディレクトリ
runするときは
docker run -it -p 5000:5000 (buildしたIDなど)
pythonのopencvを用いてtensorflowでの学習に用いる画像のリサイズプログラム
tensorflowを用いてCIFAR-10のようなデータセットを作るために画像を集め、 それをあるディレクトリにまとめて保存した際そのディレクトリ内の 画像を学習用にリサイズするプログラム
# -*- coding: utf-8 -*- import cv2 import numpy as np import os #file_dirにオリジナルのサイズの画像を格納しているディレクトリのpath指定 #resize_dirに出力先ディレクトリのpath指定 file_dir = 'オリジナルサイズ画像のディレクトリに適宜変更' resize_dir = '出力先のディレクトリに適宜変更' files = os.listdir(file_dir) for i, file in enumerate(files): if i > 0: file_path = file_dir + '/' + file img = cv2.imread(file_path, cv2.IMREAD_COLOR) size = (28, 28) resize_img = cv2.resize(img, size) cv2.imwrite(resize_dir + '/' + file, resize_img)
TensorFlow Deep MNIST for Expertsの畳み込みニューラルネット
MNIST for ExpertsのCNNの実装 データは
MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
から取得。
# -*- coding: utf-8 -*- #多重畳み込みネットワークの構築 # TensorFlowのインポート import tensorflow as tf # MNISTを読み込むためinput_data.pyを同じディレクトリに置きインポートする import input_data import time # 開始時刻 start_time = time.time() print ("開始時刻: " + str(start_time)) # MNISTデータのロード # 60000点の訓練データ(mnist.train)と10000点のテストデータ(mnist.test)がある # 訓練データとテストデータにはそれぞれ0-9の画像とそれに対応するラベル(0-9)がある # 画像は28x28px(=784)のサイズ print ("--- MNISTデータの読み込み開始 ---") mnist = input_data.read_data_sets("MNIST_data/", one_hot=True) print ("--- MNISTデータの読み込み完了 ---") # 訓練画像を入れる変数 # 訓練画像は28x28pxであり、これらを1行784列のベクトルに並び替え格納する # Noneとなっているのは訓練画像がいくつでも入れられるようにするため x = tf.placeholder(tf.float32, [None, 784]) # y_は正解データのラベル y_ = tf.placeholder(tf.float32, [None, 10]) #重みの初期化 #対称性の破れのため、0の購買を防ぐために微量のノイズとともに重みを初期化 #"dead neurons"を回避するために生の初期バイアスで初期化する #モデルの構築を行う関数の作成 def weight_variable(shape): #tf.truncated_normalは切断正規分布から乱数値を出力 initial = tf.truncated_normal(shape, stddev=0.1) return tf.Variable(initial) def bias_variable(shape): initial = tf.constant(0.1, shape=shape) return tf.Variable(initial) #畳み込みとプーリング #畳み込みは1のストライド、0でパディング、出力は入力と同じサイズ #プーリングは2*2ブロック最大プーリング def conv2d(x, W): return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME') def max_pool_2x2(x): return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1],padding='SAME') #第一畳込み層 #各5*5パッチ、フィルタ数32、つまり重みテンソルは[5, 5, 1, 32]の形状 W_conv1 = weight_variable([5, 5, 1, 32]) b_conv1 = bias_variable([32]) #入力画像をreshape #第2、3次元は画像の幅と高さ、第4次元はカラーチャネル数 x_image = tf.reshape(x, [-1, 28, 28, 1]) #x_imageを重みテンソルで畳み込みバイアスを加算しReLU関数を適用し、最大プール h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1) h_pool1 = max_pool_2x2(h_conv1) #第2畳み込み層 #書く5*5パッチ、64フィルタ W_conv2 = weight_variable([5, 5, 32, 64]) b_conv2 = bias_variable([64]) h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) h_pool2 = max_pool_2x2(h_conv2) #画像サイズが7*7まで減じられている #1024の全結合層の構築 W_fc1 = weight_variable([7*7*64, 1024]) b_fc1 = bias_variable([1024]) h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64]) h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1) #ドロップアウト keep_prob = tf.placeholder(tf.float32) h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob) #softmax層の追加 W_fc2 = weight_variable([1024, 10]) b_fc2 = bias_variable([10]) y_conv = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2) #モデルの評価と訓練 cross_entropy = -tf.reduce_sum(y_ * tf.log(y_conv)) train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy) correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1)) accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) sess = tf.Session() sess.run(tf.initialize_all_variables()) print ("--- 訓練開始 ---") for i in range(20000): batch = mnist.train.next_batch(50) if i % 100 == 0: train_accuracy = accuracy.eval(session=sess, feed_dict={ x: batch[0], y_: batch[1], keep_prob: 1.0}) print("step %d, training accuracy %g" % (i, train_accuracy)) train_step.run(session=sess, feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5}) print("test accuracy %g" % accuracy.eval(session=sess, feed_dict={ x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0})) print ("--- 訓練終了 ---") # 終了時刻 end_time = time.time() print ("終了時刻: " + str(end_time)) print ("かかった時間: " + str(end_time - start_time))
CUDAGpuMatで3ch画像の扱い方
GpuMatの3ch画像の扱いに少し手間取ったのでメモ
GpuMatの構造はBGRBGR・・・とチャンネルが続いていく。 CUDAカーネルによってGpuMatを扱うときは PtrStepSzに変換すると扱いやすい
例えば
using namespace cv; Scalar black(0, 0, 0); Mat img(Size(1000, 1000), CV_8UC3, black); cuda::GpuMat gpuImg(img); cuda::PtrStepSz<uchar> ptrImg = cuda::PtrStepSz<uchar>(gpuImg.rows, gpuImg.cols * gpuImg.channels(), gpuImg.ptr<uchar>(),gpuImg.step);
とかくことによりPtrStepSz型に変換できる。 PtrStepSzはCUDAカーネルの引数に指定するのに便利な型である。
CUDAカーネル内で3chのPtrStepSzを扱う際は以下のようなマクロを定義すると便利
#define GRU(IMG, X, Y) ((IMG).data[(IMG).step * (Y) + 3 * sizeof(unsigned char) * X + sizeof(unsigned char) * 2]) #define GGU(IMG, X, Y) ((IMG).data[(IMG).step * (Y) + 3 * sizeof(unsigned char) * X + sizeof(unsigned char) * 1]) #define GBU(IMG, X, Y) ((IMG).data[(IMG).step * (Y) + 3 * sizeof(unsigned char) * X + sizeof(unsigned char) * 0])
このマクロを定義した後CUDAカーネル内でたとえば (R,G,B) = (255, 0, 0)の画像を作成するときは
__global__ void myKernel(cuda::PtrStepSz<uchar> ptrImg){ const int x = blockDim.x * blockIdx.x + threadIdx.x; const int y = blockDim.y * blockIdx.y + threadIdx.y; if((x < ptrImg.cols) && (y < ptrImg.rows)){ GRU(ptrImg, x, y) = 255; GGU(ptrImg, x, y) = 0; GBU(ptrImg, x, y) = 0; } }
によって作成することができる。
CUDA画面の一部しかアクセスできない問題
下記のページ GpuMatの内部を探検してみる
で紹介されているサンプルコード サンプルコード
を自分のコードにかきかえて(この段階でGlobPtrSzに変換しないで、GpuMatのままでもできるなと思いながら) 実行してみたところ 画像の左側3分の1の画素にしかアクセスできない状況に陥った。
しばらく考えたら当たり前のことで、このサンプルコードではグレースケール画像を用いていて、自分のコードではRGB3chの画像を用いていた。
Mat型ではBGRBGR・・・というように配列が連なっているのでこのままでは全画素にアクセスできないという状況。
すなおにGlobPtrSzで実行するとチャンネル数も反映されて解決。
ここで紹介されてるGlobPtrSzよりもPtrStepSzを使うほうがptrも参照可能なのでこっちのほうがいいと思う!