资源简介
该文件包含GMM-UBM模型和基于ivector的GMM-UBM模型。与其他MSR工具箱不同的是,在计算指标部分添加了AUC和EER。直接运行demo_gmm_ubm_artificial.m或者demo_ivector_plda_artificial.m即可。
代码片段和文件信息
function [aspectrumwts] = audspec(pspectrum sr nfilts fbtype minfreq maxfreq sumpower bwidth)
%[aspectrumwts] = audspec(pspectrum sr nfilts fbtype minfreq maxfreq sumpower bwidth)
%
% perform critical band analysis (see PLP)
% takes power spectrogram as input
if nargin < 2; sr = 16000; end
if nargin < 3; nfilts = ceil(hz2bark(sr/2))+1; end
if nargin < 4; fbtype = ‘bark‘; end
if nargin < 5; minfreq = 0; end
if nargin < 6; maxfreq = sr/2; end
if nargin < 7; sumpower = 1; end
if nargin < 8; bwidth = 1.0; end
[nfreqsnframes] = size(pspectrum);
nfft = (nfreqs-1)*2;
if strcmp(fbtype ‘bark‘)
wts = fft2barkmx(nfft sr nfilts bwidth minfreq maxfreq);
elseif strcmp(fbtype ‘mel‘)
wts = fft2melmx(nfft sr nfilts bwidth minfreq maxfreq);
elseif strcmp(fbtype ‘htkmel‘)
wts = fft2melmx(nfft sr nfilts bwidth minfreq maxfreq 1 1);
elseif strcmp(fbtype ‘fcmel‘)
wts = fft2melmx(nfft sr nfilts bwidth minfreq maxfreq 1 0);
else
disp([‘fbtype ‘ fbtype ‘ not recognized‘]);
error;
end
wts = wts(: 1:nfreqs);
% Integrate FFT bins into Mel bins in abs or abs^2 domains:
if (sumpower)
aspectrum = wts * pspectrum;
else
aspectrum = (wts * sqrt(pspectrum)).^2;
end
属性 大小 日期 时间 名称
----------- --------- ---------- ----- ----
文件 1306 2016-01-12 20:40 audspec.m
文件 554 2016-01-12 20:40 bark2hz.m
文件 1513 2016-01-12 20:40 cep2spec.m
文件 720 2016-01-12 20:40 cmvn.m
文件 2963 2016-01-12 20:40 compute_bw_stats.m
文件 3293 2017-11-19 11:03 compute_eer.m
文件 158 2016-01-12 20:40 cosscore.m
文件 858 2016-01-12 20:40 deltas.m
文件 4612 2017-11-19 11:05 demo_gmm_ubm_artificial.m
文件 3277 2017-11-18 08:17 demo_gmm_ubm.m
文件 5830 2017-11-19 11:05 demo_ivector_plda_artificial.m
文件 5372 2016-01-12 20:40 demo_ivector_plda.m
文件 1195 2016-01-12 20:40 demo_mfcc.m
文件 678 2016-01-12 20:40 dolpc.m
文件 672 2016-01-12 20:40 energy.m
文件 2421 2016-01-12 20:40 extract_ivector.m
文件 526 2016-01-12 20:40 featureExtract.m
文件 1557 2016-01-12 20:40 fea_warping.m
文件 1526 2016-01-12 20:40 fft2barkmx.m
文件 5134 2016-01-12 20:40 fft2melmx.m
文件 6214 2016-01-12 20:40 gmm_em.m
文件 5108 2016-01-12 20:40 gplda_em.m
文件 223 2016-01-12 20:40 hamming.m
文件 603 2016-01-12 20:40 htkread.m
文件 534 2016-01-12 20:40 htkwrite.m
文件 629 2016-01-12 20:40 hz2bark.m
文件 1003 2016-01-12 20:40 hz2mel.m
文件 1327 2016-01-12 20:40 invaudspec.m
文件 1689 2016-01-12 20:40 invmelfcc.m
文件 1520 2016-01-12 20:40 invpostaud.m
文件 1380 2016-01-12 20:40 invpowspec.m
............此处省略30个文件信息
- 上一篇:人脸识别源码,facenet,深度学习
- 下一篇:安卓地图源代码
相关资源
- 说话人识别数据集--Spoken Speaker Ident
- Alize说话人识别工具在window平台的编译
- 基于Alize的ivector算法
- 基于GMM模型的说话人识别
- 说话人识别和说话人性别识别SDK
- 麦克风阵列语音库
- 基于ivector的说话人识别SDK
- 基于I-Vector的说话人识别
- 语音识别说话人识别语音库
- 说话人识别数据集--Spoken Speaker Ident
- 论文研究-基于DNN处理的鲁棒性I-Vect
- ALIZE说话人识别系统理解.
- 声纹识别方面的优秀论文
- 用于录音 ,适用于语言识别,说话人
- 基于GMM-SVM的说话人识别系统研究
- 说话人识别完整源码 vs2010
- 基于高斯混合模型的说话人识别
评论
共有 条评论