Blog Archive

Tuesday, June 23, 2020

第五届东方语种识别竞赛(以下简称“OLR”)基线系统及ASV-Subtools开源工具

Source:

https://mp.weixin.qq.com/s?__biz=MzA5MzQzMzE1NQ==&mid=2654444699&idx=1&sn=3e021b03a879a6ab6ff2433c7818de43&chksm=8b9ec0b7bce949a11a28bc155573a23eb48b60a99255a3011f7589801ae4d329c9fd3567d8f8&mpshare=1&scene=1&srcid=&sharer_sharetime=1592945342725&sharer_shareid=aa35f0a5ca293a73fb053895968df0b1#rd


第五届东方语种识别竞赛(以下简称“OLR”)基线系统及ASV-Subtools开源工具免费发布啦!


在今年的竞赛中,为了让参赛者们更好地评估自己的系统,以及为初次参赛的参赛者提供可以快速复现的系统,厦门大学智能语音实验室(XMUSPEECH)提供了基于Kaldi和Pytorch两个开源平台的基线系统:基于Kaldi的i-vector系统和x-vector系统,基于Pytorch的x-vector系统。参赛者们可以通过以下网址进行参考和下载基线系统:

https://github.com/Snowdar/asv-subtools#2-ap-olr-challenge-2020-baseline-recipe-language-identification

 

OLR基线系统可以帮助初次接触语种识别的参赛者快速搭建一套语种识别系统;另外,厦门大学智能语音实验室同时开源了ASV-Subtools工具,ASV-Subtools工具相比于其他开源工具的优势在于其整合了Pytorch的训练和Kaldi的前端后端处理,不仅可用在今年的语种识别竞赛,还可用于声纹识别系统的搭建。

 

ASV-Subtools提供了完整的基于shell脚本的recipe供参赛者快速搭建一套语种识别系统或者复现OLR基线系统。在提供的run.sh这一个脚本中就可以实现基于i-vector和x-vector的语种识别系统搭建,得到符合竞赛要求的输出分数文件。

 

如下图所示,ASV-Subtools工具同时整合了Kaldi工具和Pytorch工具:使用Pytorch来训练模型,其余流程使用Kaldi处理。除了ASV-Subtools中提供的配置选项外,使用者也很容易在Pytorch上补充选项之外的需求,快速自定义神经网络,用于声纹识别模型的训练。

 

关于ASV-Subtools的更多细节可以参考:

https://github.com/Snowdar/asv-subtools

No comments:

Post a Comment