ichou1のブログ

主に音声認識、時々、データ分析のことを書く

画像認識

Deep Learningを使ったWEBサービスはメモリ1GBでも動かせる

TensorFlowやPyTorchといった深層学習ライブラリを使おうとした場合、動かす環境はそれなりのスペックが必要になる。物理メモリが2GBのPCを使っていた頃、「VGG16」モデルを転移学習しようとしたらメモリに乗り切らなくて断念したことがある。トレーニングの…

機械学習の手法を俯瞰してみる

『Pythonによる深層強化学習入門』で書かれている"機械学習の種類(一例)"を参考にして作成。どの系統に属するものなのか、まとめておく。 分類 概要 手法 例 教師あり学習 入力データと、それに対する答え(教師データ)がセットになったデータを学習する …

Kerasメモ(OpenFace)

Keras-OpenFaceを試してみる。モデルを通すと、顔画像を128次元の特徴量に落とし込める。 類似度が計算できるので、本人確認や似ている人物の検索ができる。学習済みのモデルは4種類ある。 Models and Accuracies - OpenFacelandmarkIndicesは2種類。 INNER_…

Kerasメモ(強化学習)

Deep Reinforcement Learningを試してみる。今回、使ったソース Deep-Learning-with-Keras/rl-network-train.py at master · PacktPublishing/Deep-Learning-with-Keras · GitHubゲーム内容は、プレイヤーが「paddle」を動かして、落下してくる「ball」をキ…

tensorflowメモ(手書き文字認識その4)

前回の続き。精度を上げることを試みる。tensorflowサンプル(「examples/tutorials/mnist/mnist_deep.py」)を参考にレイヤーを構成。"Fully connected layer 1"(上表のfc1)のdownsamplingはMNISTサンプルをもとに適当に設定。 「256」(=2 * 2 * 64)featu…

tensorflowメモ(手書き文字認識その3)

前回の続き。 モデルを畳み込みニューラルネットワーク (Convolutional Neural Network)に変更してみる。チュートリアルなどを見ると、畳み込み層を2回通しているケースが多いが、まずは1層のモデルで試してみる。パラメータは以下のとおりとした。 (参…

tensorflowメモ(手書き文字認識その2)

前回生成したモデルを掘り下げてみる。 重み付けを行うパラメータが「final_w」に入っているとする。 final_w.shape (64, 10) # 最小値 numpy.min(final_w) -1.68 # 最大値 numpy.max(final_w) 1.55「final_w」をグレースケール変換して視覚化してみる。 変…

tensorflowメモ(手書き文字認識その1)

ライブラリ「scikit-learn」の手書き文字データセット「digits」を使って、手書き文字認識を試してみる。 入力データ データセットの構成は以下のとおり。 8 x 8ピクセルの画像 「0」から「9」までの手書き文字 明暗を0から16までの値で表現 画像数は1797 1…