ichou1のブログ

主に音声認識、時々、データ分析のことを書く

2018-06-01から1ヶ月間の記事一覧

音声認識メモ(Kaldi)その17(Toolkitスクリプト)

Kaldiは、Bashスクリプトで実行するコマンドをコントロールしている。 今回はスクリプトについて確認してみる。GitHubからダウンロードした一式のディレクトリ構成については以下のとおり。 egs (今回の確認対象) src (ソースコード) misc (論文など?未確認…

音声認識メモ(Kaldi)その16(Backpropagation Dan's DNN(nnet2))

前回の続き。 Backpropagation(誤差逆伝播法)によるパラメータ更新の流れを追ってみる。Softmaxの出力結果(確率)が以下のとおりであったとする(正解となるpdf-classのみ記載)。 小数点第6位切り捨て確率の逆数にweightを掛けたものを求める(今回、wei…

音声認識メモ(Kaldi)その15(活性化関数 Dan's DNN(nnet2))

活性化関数に関するメモ。公式サイトの隠れ層に関する説明には、"tanh"(双曲線正接関数)と"p-norm"が登場する。この”p-norm”というのは、論文によると活性化関数"maxout"からヒントを得た独自版らしい。「egs/rm/s5/local/run_nnet2.sh」のコメントにも書…