본문 바로가기
728x90
반응형
SMALL

librosa3

오디오 데이터 처리 Python 라이브러리 import import pandas as pd import numpy as np import matplotlib.pylab as plt import seaborn as sns import librosa import librosa.display import IPython.display as ipd from glob import glob from itertools import cycle sns.set_theme(style="white", palette=None) color_pal = plt.rcParams["axes.prop_cycle"].by_key()["color"] color_cycle = cycle(plt.rcParams["axes.prop_cycle"].by_key()["c.. 2024. 3. 6.
Mel Spectrogram The Mel Scale Mel Scale은 수학적으로 말하면 주파수 스케일의 비선형 변환 결과이다. 인간은 주파수를 linear scale (선형 척도)로 인식하지 못한다. 인간은 높은 주파수보다 낮은 주파수에서의 차이를 더 잘 감지한다. 예를 들어, 00Hz와 1000Hz 사이의 차이는 분명한 반면, 7500Hz와 8000Hz 사이의 차이는 거의 눈에 띄지 않는다. 연구에서 사람이 동일한 거리에서 소리가 들리도록 하는 pitch 단위를 제안했다. 이것을 Mel Scale이라고 한다. 이 Mel Scale은 Mel Scale에서 서로 같은 거리에 있는 소리가 서로 거리가 같으므로 인간에게도 "소리"가 나도록 구성되었다. 주파수에 대한 수학적 연산을 수행하여 주파수를 Mel Scale로 변환한다. 비선형.. 2023. 9. 13.
[Audio Processing] librosa specshow librosa specshow import librosa as liimport librosa.displayimport numpy as npimport matplotlib.pyplot as pltimport scipy.signal as sig# load sample audiofile = li.ex('trumpet')aud, sr = li.load(file, sr=None)n_ftt = 512rsr = 11025# apply low pass filter before downsampling. Attenuate at resample rate divided by 2.cutoff = rsr / 2sos = sig.butter(10, cutoff, fs=sr, btype='lowpass', analog=False, .. 2023. 7. 5.
728x90
반응형
LIST