ichou1のブログ

主に音声認識、時々、データ分析のことを書く

2020-02-01から1ヶ月間の記事一覧

日銀のEFT買い入れを可視化してみる(2020年2月末までのデータ)

2月最終週は、4日連続で日銀によるETF買い入れが入った。 この買いが無かったら、日経平均株価はもっと値を下げていたことだろう。 白のプロットが日経平均株価(終値) 紫の積み上げがETF買い入れ額(億円)日銀が公開している情報をもとに、2020年2月末ま…

音声ファイル特徴量変換(その4)STFT(TensorFlow)

TensorFlowで短時間フーリエ変換(Short-time Fourier Transform)を求めるには、「tf.signal.stft」関数が提供されている。 https://www.tensorflow.org/versions/r1.15/api_docs/python/tf/signal/stft音声データは「yes」という一秒間の発話データ。 「li…

音声ファイル特徴量変換(その3)MFCC

前回の続き。「MFCC」(メル周波数ケプストラム係数)について見ていく。ここでは、視覚的な結果確認のみ書くので、計算過程などは以下をご参照。 work-in-progress.hatenablog.com音声データは「yes」という一秒間の発話データ。 MFCC(メル周波数ケプストラ…

音声ファイル特徴量変換(その2)メルスペクトログラム

前回の続き。「log-mel spectrogram」(STFT+メル周波数変換+自然対数)について見ていく。音声データは「yes」という一秒間の発話データ。 log-mel spectrogram メル周波数(対数変換なし) メル尺度に変換する。 import librosa import numpy as np # Au…

音声ファイル特徴量変換(その1)STFT

音声データを使う際は特徴量に変換する。 よく使われているのは「MFCC」だが、深層学習では「log-mel spectrogram」を使う実装例も出ている。 特徴量 実装例 STFT Looking to Listen at the Cocktail Party log-mel spectrrogram Deep Learning for Audio Si…

音声ファイル前処理(データロード)

例えばTensorFlowなどの深層学習ライブラリで音声を扱おうとした時、どのような変換をしているのか把握していないと応用が効かないし、詰まってしまう。 基本的なところからまとめ直してみる。前回のTensorFlowチュートリアルに出てくる"yes"の音声データを…

TensorFlowメモ(Simple Audio Recognition)

TensorFlowのチュートリアル「Simple Audio Recognition」を試してみる。docs/audio_recognition.md at master · tensorflow/docs · GitHubソースコードtensorflow/tensorflow/examples/speech_commands at master · tensorflow/tensorflow · GitHubどのよう…