ichou1のブログ

主に音声認識、時々、データ分析のことを書く

2018-01-01から1ヶ月間の記事一覧

音声認識メモ(Julius)その6(連続単語認識(N-gram))

The Julius bookより抜粋。 第1パスでは通常の前向き (left-to-right) の 2-gram,第2パスでは後ろ向きの N-gram がそれぞれ必要となる. 第1パスにおける確率計算の過程をトレースしてみる。 (確率は常用対数での計算になる)統計の元となるテキストが以下…

Bluetoothメモ(BlueZパッケージ、bluetoothctlコマンド)

Bluetoothキーボードを使おうとしてハマったのでメモ。サイトを見ると、接続するためのコマンドはいくつかある。 bluez-simple-agent gatttool bluetoothctl 使い方が悪いのか、「bluez-simple-agent」コマンドと「gatttool」コマンドでは接続できなかった。…

音声認識メモ(Julius)その5(連続単語認識(DFA))

前回の続き。孤立単語の場合、"単語内(intra word)の遷移"のみを計算したが、連続単語の場合は、単語内に加え、"単語間(inter word)の遷移"を計算する。連続単語の場合の木構造化辞書を以下に示す。丸枠の下はノード番号を表す。 単語間の接続は、DFA文法…

音声認識メモ(Julius)その4(連続単語認識(DFA))

Juliusでは、連続単語の言語モデルとして、「N-gram」と「DFA」をサポートしている。ここでのDFA(Deterministic finite automaton、決定性有限オートマトン)はMealy型有限オートマトンのことで、出力が現在状態と入力に決定されるモデル。 遷移は一方通行…

音声認識メモ(Julius)その3(孤立単語)

juliusで音声を認識する過程をトレースする。HMMはモノフォンのモデルとし、「m」、「o」、「s」、「i」、「silB」、「silE」が学習済みであるとする。言語モデルは孤立単語(-w オプション)とし、辞書は以下とした。 MOSIMOSI m o s i m o s i MOMO m o m…