ichou1のブログ

主に音声認識、時々、データ分析のことを書く

2018-02-01から1ヶ月間の記事一覧

音声認識メモ(Kaldi)その2(decode)

Kaldiで実際に音声を認識させてみる。以下のサイトを参考にさせていただいた。 Kaldi - Training 1Kaldiに関する処理を日本語のドキュメントでまとめてみた(デコーディング編)6 - Qiita 使ったのは"もしもし"という発話データ(frame数198)。 実行コマン…

音声認識メモ(Kaldi)その1(特徴量抽出)

音声認識Tool Kit「Kaldi」を試してみる。今回は特徴量抽出。 音声データはHTKのHCopyで試した時と同じものを使用。Kaldi公式サイトには次の記述があり、全く同じにはならないよう。 With the option –htk-compat=true, and setting parameters correctly, i…

言語モデルメモ(palmkit)その1(with Witten-Bell backoff)

palmkitの「idngram2lm」を使って、ARPA形式の前向き3-gramが作成されるまでの過程をトレースする。 コマンド指定 idngram2lm -n 3 -idngram learn.3gram -vocab learn.vocab -arpa learn.3gram.arpa 統計の元となるファイル <s> IMO MO II </s> <s> MOMO MO OMOI </s> lea…