ichou1のブログ

主に音声認識、時々、データ分析のことを書く

2020-09-01から1ヶ月間の記事一覧

音声合成メモ(tacotron2その2)

内部でどのような処理を行っているのか見てみる。論文より(Encoder/Decoderの枠線を加筆) 「torchsummaryX」を使って、モデルのサマリを出力してみる。 各レイヤ構成 Embedding (embedding): Embedding(148, 512) Encoder 「BatchNorm1d」レイヤに関して…

音声合成メモ(tacotron2その1)

NVIDIAのtacotron2を試してみる。GitHub - NVIDIA/tacotron2: Tacotron 2 - PyTorch implementation with faster-than-realtime inferenceまずは、Pre-trainedモデルを使ってinference(推論)「ちいさなうなぎやに」という音声を生成してみる。 text = 'che…