音声処理リファレンス
音声処理用のメモです
過去の記事
- まだない…
参考文献
本とか論文とか
ブログとかqiitaとかスライドとか
学会
音声分析に使えそうなlibrary・data
library
- wavio →本家
- wavファイルを扱うライブラリwavio(wavファイルをreadできる)
- scipy →本家
- librosa →本家
- 音声信号処理のlibrary。スペクトル解析とか簡単にできる
- pyaudioanalysis →本家
- 音声分析のlibrary。音の特徴量を抽出できたりする。詳しくは本家githubのwikiで
- multimodalAnalysis
- コース2が特徴量算出の勉強になる
- メモ:フレームサイズはだいたい20msc-100msc、フレームステップ(どれだけずらすか)はだいたいフレームサイズの5~7割
- 例、フレームサイズ 100mscの場合フレームステップは50msc〜70msc
- pyreaper →本家
特徴量について
- かなり複雑でいっぱいある。pyAudioAnalysisやlibrosaを利用すると音声識別でよく使われているっぽいMFCCやSpectralの特徴量は抽出できる。