開始行:
*音声ファイルについて
~
~
#contents
~
~
**Wavファイル形式
線形PCM方式では、音声データはサンプリング周波数(sampling...
~
~
**scipy.io.wavfileを利用した音声ファイルの読み込み
Pythonでwav形式の音声ファイルを読み込むために、SciPyを利...
~
~
**音声データの可視化
Librosa.display.waveshow関数を用いる。音声の振幅が時間に...
import librosa.display
import matplotlib.pyplot as plt
# 音声ファイルの読み込み
sr, x = wavfile.read(ttslearn.util.example_audio_file())
fig, ax = plt.subplots(figsize=(8,2))
librosa.display.waveshow(x.astype(np.float32))
ax.set_xlabel("時間 [秒]")
ax.set_ylabel("振幅")
~
~
**音声のフーリエ変換
周波数に関する情報は、音声波形を眺めるだけで映えることが...
時間軸ではなく、週ハスという別の軸から音声を見ることが可...
~
***高速フーリエ変換
高速フーリエ変換(fasr Fourier transfotm : FFT)とは、フ...
~
***短時間フーリエ変換
時間的に周波数成分が変化する特徴を捉えるための分析手段と...
全体に対してフーリエ変換を行うのではなく。短い区間を切り...
~
***逆短時間フーリエ変換による復元
逆短時間フーリエ変換(inverse short-time Fourier transfot...
ここではlibrosa.stft を用いる。
~
~
**メルスペクトログラム
~
***その計算
~
~
終了行:
*音声ファイルについて
~
~
#contents
~
~
**Wavファイル形式
線形PCM方式では、音声データはサンプリング周波数(sampling...
~
~
**scipy.io.wavfileを利用した音声ファイルの読み込み
Pythonでwav形式の音声ファイルを読み込むために、SciPyを利...
~
~
**音声データの可視化
Librosa.display.waveshow関数を用いる。音声の振幅が時間に...
import librosa.display
import matplotlib.pyplot as plt
# 音声ファイルの読み込み
sr, x = wavfile.read(ttslearn.util.example_audio_file())
fig, ax = plt.subplots(figsize=(8,2))
librosa.display.waveshow(x.astype(np.float32))
ax.set_xlabel("時間 [秒]")
ax.set_ylabel("振幅")
~
~
**音声のフーリエ変換
周波数に関する情報は、音声波形を眺めるだけで映えることが...
時間軸ではなく、週ハスという別の軸から音声を見ることが可...
~
***高速フーリエ変換
高速フーリエ変換(fasr Fourier transfotm : FFT)とは、フ...
~
***短時間フーリエ変換
時間的に周波数成分が変化する特徴を捉えるための分析手段と...
全体に対してフーリエ変換を行うのではなく。短い区間を切り...
~
***逆短時間フーリエ変換による復元
逆短時間フーリエ変換(inverse short-time Fourier transfot...
ここではlibrosa.stft を用いる。
~
~
**メルスペクトログラム
~
***その計算
~
~
ページ名: