MSR说话人识别工具箱

大小: 1.79MB

文件类型: .zip

金币: 2

下载: 0 次

发布日期: 2023-09-02
语言: 其他
标签:

高速下载

资源简介

该文件包含GMM-UBM模型和基于ivector的GMM-UBM模型。与其他MSR工具箱不同的是，在计算指标部分添加了AUC和EER。直接运行demo_gmm_ubm_artificial.m或者demo_ivector_plda_artificial.m即可。

资源截图

小图大图

代码片段和文件信息

function [aspectrumwts] = audspec（pspectrum sr nfilts fbtype minfreq maxfreq sumpower bwidth）
%[aspectrumwts] = audspec（pspectrum sr nfilts fbtype minfreq maxfreq sumpower bwidth）
%
% perform critical band analysis （see PLP）
% takes power spectrogram as input

if nargin < 2;  sr = 16000;                          end
if nargin < 3;  nfilts = ceil（hz2bark（sr/2））+1;      end
if nargin < 4;  fbtype = ‘bark‘;  end
if nargin < 5;  minfreq = 0;    end
if nargin < 6;  maxfreq = sr/2; end
if nargin < 7;  sumpower = 1;   end
if nargin < 8;  bwidth = 1.0;   end

[nfreqsnframes] = size（pspectrum）;

nfft = （nfreqs-1）*2;

if strcmp（fbtype ‘bark‘）
  wts = fft2barkmx（nfft sr nfilts bwidth minfreq maxfreq）;
elseif strcmp（fbtype ‘mel‘）
  wts = fft2melmx（nfft sr nfilts bwidth minfreq maxfreq）;
elseif strcmp（fbtype ‘htkmel‘）
  wts = fft2melmx（nfft sr nfilts bwidth minfreq maxfreq 1 1）;
elseif strcmp（fbtype ‘fcmel‘）
  wts = fft2melmx（nfft sr nfilts bwidth minfreq maxfreq 1 0）;
else
  disp（[‘fbtype ‘ fbtype ‘ not recognized‘]）;
  error;
end

wts = wts（: 1:nfreqs）;

% Integrate FFT bins into Mel bins in abs or abs^2 domains:
if （sumpower）
  aspectrum = wts * pspectrum;
else
  aspectrum = （wts * sqrt（pspectrum））.^2;
end

属性            大小     日期    时间   名称
----------- ---------  ---------- -----  ----
     文件        1306  2016-01-12 20:40  audspec.m
     文件         554  2016-01-12 20:40  bark2hz.m
     文件        1513  2016-01-12 20:40  cep2spec.m
     文件         720  2016-01-12 20:40  cmvn.m
     文件        2963  2016-01-12 20:40  compute_bw_stats.m
     文件        3293  2017-11-19 11:03  compute_eer.m
     文件         158  2016-01-12 20:40  cosscore.m
     文件         858  2016-01-12 20:40  deltas.m
     文件        4612  2017-11-19 11:05  demo_gmm_ubm_artificial.m
     文件        3277  2017-11-18 08:17  demo_gmm_ubm.m
     文件        5830  2017-11-19 11:05  demo_ivector_plda_artificial.m
     文件        5372  2016-01-12 20:40  demo_ivector_plda.m
     文件        1195  2016-01-12 20:40  demo_mfcc.m
     文件         678  2016-01-12 20:40  dolpc.m
     文件         672  2016-01-12 20:40  energy.m
     文件        2421  2016-01-12 20:40  extract_ivector.m
     文件         526  2016-01-12 20:40  featureExtract.m
     文件        1557  2016-01-12 20:40  fea_warping.m
     文件        1526  2016-01-12 20:40  fft2barkmx.m
     文件        5134  2016-01-12 20:40  fft2melmx.m
     文件        6214  2016-01-12 20:40  gmm_em.m
     文件        5108  2016-01-12 20:40  gplda_em.m
     文件         223  2016-01-12 20:40  hamming.m
     文件         603  2016-01-12 20:40  htkread.m
     文件         534  2016-01-12 20:40  htkwrite.m
     文件         629  2016-01-12 20:40  hz2bark.m
     文件        1003  2016-01-12 20:40  hz2mel.m
     文件        1327  2016-01-12 20:40  invaudspec.m
     文件        1689  2016-01-12 20:40  invmelfcc.m
     文件        1520  2016-01-12 20:40  invpostaud.m
     文件        1380  2016-01-12 20:40  invpowspec.m
............此处省略30个文件信息

上一篇：人脸识别源码，facenet，深度学习
下一篇：安卓地图源代码

共有条评论

MSR说话人识别工具箱

资源简介

资源截图

代码片段和文件信息

评论

相关资源