音乐检索

音频信号处理python库——librosa简介

做的项目需要提一些音频特征,而librosa这个库非常给力,这里写一些介绍。

Youtube上有一个介绍的视频,台上这位大佬非常帅呀,想想他也是librosa team member,我会更喜欢librosa的。
下面根据文档简单的介绍下librosa的安装、功能等等。
每天做一点吧,希望期末的时候能完成。

一、安装
1. Windows: pip install librosa
2. Linux: sudo pip install librosa
也有对应ffmpeg的接口
二、 主要的IO和信号处理功能
2.1 音频处理

load(path[, sr, mono, offset, duration, ...]) 加载音频,以连续的时间序列存储
to_mono(y) 使音频信号变为单声道
resample(y, orig_sr, target_sr[, res_type, ...]) 重新采样/改变音频的采样率
get_duration([y, sr, S, n_fft, hop_length, ...])计算音频时长,按帧计算
autocorrelate(y[, max_size, axis])有界自相关
zero_crossings(y[, threshold, ...])过零率,可以设阈值,结果用true或者false表示
clicks([times, frames, sr, hop_length, ...]) 返回特定位置信号

2.1 频谱表示
stft(y[, n_fft, hop_length, win_length, …]) 短时傅里叶变化 (STFT)
istft(stft_matrix[, hop_length, win_length, …]) 逆短时傅里叶变化 (ISTFT).
ifgram(y[, sr, n_fft, hop_length, …]) 计算瞬时频率(按照采样率的比例)来获得复杂的频谱的时间倒数
cqt(y[, sr, hop_length, fmin, n_bins, …]) 计算音频信号的常量Q变换
hybrid_cqt(y[, sr, hop_length, fmin, …]) 计算音频信号的混合常量Q变换
pseudo_cqt(y[, sr, hop_length, fmin, …]) 计算伪常量Q变换
fmt(y[, t_min, n_fmt, kind, beta, …]) The fast Mellin transform (FMT) [R5] of a uniformly sampled signal y.
interp_harmonics(x, freqs, h_range[, kind, …]) 计算均匀采样下的快速梅林变换 (FMT)
salience(S, freqs, h_range[, weights, …]) 谐波特征函数
phase_vocoder(D, rate[, hop_length]) 相位编码器
magphase(D) 将一个复制的频谱图D分离成它的幅值S和相位D分量,D=S*P

Be the First to comment.

Leave a Comment

电子邮件地址不会被公开。 必填项已用*标注