2020-02-22から1日間の記事一覧

2020-02-22

音声ファイル特徴量変換（その1）STFT

音声認識 python tensorflow

音声データを使う際は特徴量に変換する。よく使われているのは「MFCC」だが、深層学習では「log-mel spectrogram」を使う実装例も出ている。特徴量実装例 STFT Looking to Listen at the Cocktail Party log-mel spectrrogram Deep Learning for Audio Si…

ichou1のブログ

主に音声認識、時々、データ分析のことを書く

2020-02-22から1日間の記事一覧

音声ファイル特徴量変換（その1）STFT