読者です 読者をやめる 読者になる 読者になる

まだそんなことやってんの?

技術系備忘録ブログがメイン

C++ REST SDK 接続確認のpingでjsonをかえすときのresponseの確認

pplx::task<void> RequestJSONValueAsync()
{
    // TODO: To successfully use this example, you must perform the request 
    // against a server that provides JSON data. 
    // This example fails because the returned Content-Type is text/html and not application/json.
    http_client client(L"http://133.34.174.246:5000/ping");
    return client.request(methods::GET).then([](http_response response) -> pplx::task<json::value>
    {
        if (response.status_code() == status_codes::OK)
        {
            return response.extract_json();
        }

        // Handle error cases, for now return empty json value...
        return pplx::task_from_result(json::value());
    })
        .then([](pplx::task<json::value> previousTask)
    {
        try
        {
            const json::value& v = previousTask.get();
            // Perform actions here to process the JSON value...
            wcout << v << endl;
        }
        catch (const http_exception& e)
        {
            // Print error.
            wostringstream ss;
            ss << e.what() << endl;
            wcout << ss.str();
        }
    });

    /* Output:
   Content-Type must be application/json to extract (is: text/html)
   */
}


int wmain()
{
    /*std::wcout << L"Calling HTTPStreamingAsync..." << std::endl;
   HTTPStreamingAsync().wait();*/
    
    wcout << L"Calling RequestJSONValueAsync..." << endl;
    RequestJSONValueAsync().wait();

    getchar();
}

responseがvで帰ってくる

docker for windowsをインストールしたらブルースクリーンでwindowsきどうしなくなる問題

docker for windowsをインストールするとwindowsの起動時ブルースクリーンになってしまい起動しなくなった

試行錯誤の結果 セーフモードで一旦windowsを起動後、 dockerとウイルスバスターを削除すると正常に起動することができた。 この際dockerを正常にアンインストールするのに失敗したが、 フォルダを無理やり削除して行って完全に削除した。

TensorFlowをDockerでコンテナ化

まずanacondaの設定がすでに行われているimageを引っ張ってくる。

docker pull continuumio/anaconda3 

pullされたimageを確認

docker images

すると

REPOSITORY              TAG                 IMAGE ID            CREATED             SIZE
continuumio/anaconda3   latest              e3f7f02f1c66        2 days ago          981.2 MB

ok このイメージ内のコンテナにtensorflow, opencv, Flaskをダウンロードする docker run -it continuumio/anaconda3 /bin/bash コンテナ内のbashから

conda install opencv
conda install Flask
conda install tensorflow

を実行

docker commit 142 username/fruits_dis:ver1.0

リポジトリ作成

ビルドするときは

docker build -t rkr7x/fruits-dis:ver1.0 /pullしたディレクトリ

runするときは

docker run -it -p 5000:5000 (buildしたIDなど)

pythonのopencvを用いてtensorflowでの学習に用いる画像のリサイズプログラム

tensorflowを用いてCIFAR-10のようなデータセットを作るために画像を集め、 それをあるディレクトリにまとめて保存した際そのディレクトリ内の 画像を学習用にリサイズするプログラム

# -*- coding: utf-8 -*-

import cv2
import numpy as np
import os

#file_dirにオリジナルのサイズの画像を格納しているディレクトリのpath指定
#resize_dirに出力先ディレクトリのpath指定

file_dir = 'オリジナルサイズ画像のディレクトリに適宜変更'
resize_dir = '出力先のディレクトリに適宜変更'
files = os.listdir(file_dir)
for i, file in enumerate(files):
    if i > 0:
        file_path = file_dir + '/' + file
        img = cv2.imread(file_path, cv2.IMREAD_COLOR)

        size = (28, 28)
        resize_img = cv2.resize(img, size)

        cv2.imwrite(resize_dir + '/' + file, resize_img)

TensorFlow Deep MNIST for Expertsの畳み込みニューラルネット

MNIST for ExpertsのCNNの実装 データは

MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges

から取得。

# -*- coding: utf-8 -*-

#多重畳み込みネットワークの構築
# TensorFlowのインポート
import tensorflow as tf
# MNISTを読み込むためinput_data.pyを同じディレクトリに置きインポートする
import input_data

import time

# 開始時刻
start_time = time.time()
print ("開始時刻: " + str(start_time))

# MNISTデータのロード
# 60000点の訓練データ(mnist.train)と10000点のテストデータ(mnist.test)がある
# 訓練データとテストデータにはそれぞれ0-9の画像とそれに対応するラベル(0-9)がある
# 画像は28x28px(=784)のサイズ
print ("--- MNISTデータの読み込み開始 ---")
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
print ("--- MNISTデータの読み込み完了 ---")

# 訓練画像を入れる変数
# 訓練画像は28x28pxであり、これらを1行784列のベクトルに並び替え格納する
# Noneとなっているのは訓練画像がいくつでも入れられるようにするため
x = tf.placeholder(tf.float32, [None, 784])

# y_は正解データのラベル
y_ = tf.placeholder(tf.float32, [None, 10])

#重みの初期化
#対称性の破れのため、0の購買を防ぐために微量のノイズとともに重みを初期化
#"dead neurons"を回避するために生の初期バイアスで初期化する
#モデルの構築を行う関数の作成
def weight_variable(shape):
    #tf.truncated_normalは切断正規分布から乱数値を出力
    initial = tf.truncated_normal(shape, stddev=0.1)
    return tf.Variable(initial)

def bias_variable(shape):
    initial = tf.constant(0.1, shape=shape)
    return tf.Variable(initial)

#畳み込みとプーリング
#畳み込みは1のストライド、0でパディング、出力は入力と同じサイズ
#プーリングは2*2ブロック最大プーリング
def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1],padding='SAME')

#第一畳込み層
#各5*5パッチ、フィルタ数32、つまり重みテンソルは[5, 5, 1, 32]の形状
W_conv1 = weight_variable([5, 5, 1, 32])
b_conv1 = bias_variable([32])

#入力画像をreshape
#第2、3次元は画像の幅と高さ、第4次元はカラーチャネル数
x_image = tf.reshape(x, [-1, 28, 28, 1])

#x_imageを重みテンソルで畳み込みバイアスを加算しReLU関数を適用し、最大プール
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_pool1 = max_pool_2x2(h_conv1)

#第2畳み込み層
#書く5*5パッチ、64フィルタ
W_conv2 = weight_variable([5, 5, 32, 64])
b_conv2 = bias_variable([64])

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)

#画像サイズが7*7まで減じられている
#1024の全結合層の構築
W_fc1 = weight_variable([7*7*64, 1024])
b_fc1 = bias_variable([1024])

h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)

#ドロップアウト
keep_prob = tf.placeholder(tf.float32)
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

#softmax層の追加
W_fc2 = weight_variable([1024, 10])
b_fc2 = bias_variable([10])

y_conv = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

#モデルの評価と訓練
cross_entropy = -tf.reduce_sum(y_ * tf.log(y_conv))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
sess = tf.Session()
sess.run(tf.initialize_all_variables())
print ("--- 訓練開始 ---")
for i in range(20000):
    batch = mnist.train.next_batch(50)
    if i % 100 == 0:
        train_accuracy = accuracy.eval(session=sess, feed_dict={
            x: batch[0], y_: batch[1], keep_prob: 1.0})
        print("step %d, training accuracy %g" % (i, train_accuracy))
    train_step.run(session=sess, feed_dict={x: batch[0], y_: batch[1], keep_prob: 0.5})

print("test accuracy %g" % accuracy.eval(session=sess, feed_dict={
    x: mnist.test.images, y_: mnist.test.labels, keep_prob: 1.0}))
print ("--- 訓練終了 ---")

# 終了時刻
end_time = time.time()
print ("終了時刻: " + str(end_time))
print ("かかった時間: " + str(end_time - start_time))

CUDAGpuMatで3ch画像の扱い方

GpuMatの3ch画像の扱いに少し手間取ったのでメモ

GpuMatの構造はBGRBGR・・・とチャンネルが続いていく。 CUDAカーネルによってGpuMatを扱うときは PtrStepSzに変換すると扱いやすい

例えば

using namespace cv;


Scalar black(0, 0, 0);
Mat img(Size(1000, 1000), CV_8UC3, black);
cuda::GpuMat gpuImg(img);
cuda::PtrStepSz<uchar> ptrImg = cuda::PtrStepSz<uchar>(gpuImg.rows, gpuImg.cols * gpuImg.channels(), gpuImg.ptr<uchar>(),gpuImg.step);

とかくことによりPtrStepSz型に変換できる。 PtrStepSzはCUDAカーネルの引数に指定するのに便利な型である。

CUDAカーネル内で3chのPtrStepSzを扱う際は以下のようなマクロを定義すると便利

#define GRU(IMG, X, Y) ((IMG).data[(IMG).step * (Y) + 3 * sizeof(unsigned char) * X + sizeof(unsigned char) * 2])
#define GGU(IMG, X, Y) ((IMG).data[(IMG).step * (Y) + 3 * sizeof(unsigned char) * X + sizeof(unsigned char) * 1])
#define GBU(IMG, X, Y) ((IMG).data[(IMG).step * (Y) + 3 * sizeof(unsigned char) * X + sizeof(unsigned char) * 0])

このマクロを定義した後CUDAカーネル内でたとえば (R,G,B) = (255, 0, 0)の画像を作成するときは

__global__ void myKernel(cuda::PtrStepSz<uchar> ptrImg){
    const int x = blockDim.x * blockIdx.x + threadIdx.x;
    const int y = blockDim.y * blockIdx.y + threadIdx.y;

    if((x < ptrImg.cols) && (y < ptrImg.rows)){
        GRU(ptrImg, x, y) = 255;
        GGU(ptrImg, x, y) = 0;
        GBU(ptrImg, x, y) = 0;
    }
}

によって作成することができる。

CUDA画面の一部しかアクセスできない問題

下記のページ GpuMatの内部を探検してみる

で紹介されているサンプルコード サンプルコード

を自分のコードにかきかえて(この段階でGlobPtrSzに変換しないで、GpuMatのままでもできるなと思いながら) 実行してみたところ 画像の左側3分の1の画素にしかアクセスできない状況に陥った。

しばらく考えたら当たり前のことで、このサンプルコードではグレースケール画像を用いていて、自分のコードではRGB3chの画像を用いていた。

Mat型ではBGRBGR・・・というように配列が連なっているのでこのままでは全画素にアクセスできないという状況。

すなおにGlobPtrSzで実行するとチャンネル数も反映されて解決。

ここで紹介されてるGlobPtrSzよりもPtrStepSzを使うほうがptrも参照可能なのでこっちのほうがいいと思う!