音声認識メモ(Julius)その3(孤立単語)
juliusで音声を認識する過程をトレースする。
HMMはモノフォンのモデルとし、「m」、「o」、「s」、「i」、「silB」、「silE」が学習済みであるとする。
言語モデルは孤立単語(-w オプション)とし、辞書は以下とした。
MOSIMOSI m o s i m o s i MOMO m o m o IMO i m o
Julius起動時に「木構造化辞書」(lexicon tree、word-conjunction HMM)が構築される。
github.com
単語はソートされ、始まりから途中まで、音素列が同一のものは共有される。
整列後の単語
IMO i m o MOMO m o m o MOSIMOSI m o s i m o s i
time=3の時、可能性が有るノード
time=4の時、可能性が有るノード