国际最顶尖会议:
期刊方面:
国内:信号处理,电子学报、声学学报,应用声学,声学工程
国外:最著名的:IEEE Signal Processing Magazine (IF:2.655),一年6期,是双月刊)
还有IEEE Transactions on Signal Processing (TSP)-- (IF:1.57)
IEEE Transactions on Circuits and Systems-I: Regular Papers (CAS-I)---(IF:1.139)
Signal Processing: Image Communication (IF: 1.109)
IEE Electronics Letters (IF:1.063)
IEEE Transactions on Circuits and Systems-II: Express Briefs (CAS-II)---(IF:0.922)
Digital Signal Processing(IF: 0.889)
IEEE Signal Processing Letters (SPL)---(IF: 0.722)
Signal Processing (IF: 0.669)
IET Signal Processing
其中IF为影响因子
1.1 国际语音识别技术研究机构
AT&T .html
ATR .html
BBN /
Cambridge University Engineering Department (CUED) /
Carnegie Mellon University (CMU)
HP Labs /
Columbia University
Centre for Speech Technology Research at Edinburgh University
ESAT - PSI Speech Group at K.U.Leuven
International Computer Science Institute (ICSI)
IBM Human Language Technologies /
IDIAP Research Institute
INESC-ID Lisboa, Spoken Language Systems Lab
IRST
ISIP
Johns Hopkins University (CLSP)
Speech, Music and Hearing at KTH
LIMSI
Alcatel Lucent (Bell Labs)
Microsoft /
MIT Spoken Language Systems
Oregon Graduate Institute (OGI) Center for Spoken Language Understanding
Speech and Language Processing Laboratory at Rutgers University
RWTH Aachen
University of Colorado, Boulder (CLEAR)
University of Sheffield
SRI
Furui Laboratory, Tokyo Institute of Technology
University of Illinois at Urbana and Champaign
University of Washington
Universitaet Erlangen-Nürnberg
剑桥大学
/
CMU大学
/
张智星 语音识别,机器学习
/
安徽科大讯飞
/
1.2 国际语音识别技术期刊
(1)Speech Communication
(2)Computer Speech and Language (CSL)
(3)IEEE Transactions on Speech and Audio Processing
1.3 国际语音识别技术会议
(1)ICASSP(International Conference on Acoustic, Speech and Signal Processing)
每年一届,10月截稿,次年5月开会。
(2)ICSLP(International Conference on Spoken Language Processing)
偶数年举办,4月截稿,9月开会。
(3)EuroSpeech:奇数年举办,4月截稿,9月开会。
1.4 国际语音识别技术评测
NIST Spoken Language Technology Evaluations Benchmark Tests
(.htm)
1.5 语音识别技术工具包
AT&T FSM Library
CMU-Cambridge Statistical LM Toolkit
CMU Sphinx
CSLU toolkit
CUED HTK
Edinburgh Speech Tools Library
KTH WaveSurfer
MSState ASR Toolkit
NIST Utility Software
SPRACHcore software package
SRI Language Modelling Toolkit
SoX -- Sound eXchange
Transcriber
UCL Speech Filing System
FBVIEW multi-channel audio file viewer
1.6语音识别网站及相关论坛
/
.html
.html
/
有两种方法,一是直接查找文章的题目;二是可以根据期刊的名字找到期刊的数据库,可以根据时间阅读某一刊的所有文章。
另外一个重要来源是会议,首先通过去会议的官网了解会议文章被哪一个期刊所收录,然后按照期刊的方式去收集相关资料。比如ICASSP会议,它的文章被IEEE收录,所以到IEEE的Conference Publications模块,搜索会议的名称,就能找到对应的文章。
6篇入门论文
介绍深度学习在语音识别领域应用的6篇入门论文:
Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups
(2012年,Hinton,语音识别的突破)
Speech recognition with deep recurrent neural networks
(2013年,RNN在语音识别的应用)
Towards End-To-End Speech Recognition with Recurrent Neural Networks
(2014年)
Fast and accurate recurrent neural network acoustic models for speech recognition
(2015年,Google)
Deep speech 2: End-to-end speech recognition in english and mandarin
(2015年,Baidu)
Achieving Human Parity in Conversational Speech Recognition
(2016年,Microsoft)
尤其推荐第1,5,6篇
中文语音数据集
1、gale_mandarin: 中文新闻广播数据集(LDC2013S08, LDC2013S08)
2、hkust: 中文电话数据集(LDC2005S15, LDC2005T32)
3、thchs30: 清华大学30小时的数据集,可以在
1、Kaldi
Kaldi诞生于2009年的JohnsHopkins University,刚开始项目重点是子空间高斯模型(SGMM)建模和词汇学习抽样调查,代码也是基于HTK进行的开发,现在也是C++作为主要语言。
2、CMU-Sphinx
CMU-Sphinx是卡内基-梅隆大学(CarnegieMellon University,CMU)开发的一款开源的语音识别系统,后来Sun、三菱、惠普、加州大学圣克鲁斯分校和麻省理工也对其有所贡献。
3、Julius
Julius是日本京都大学和日本IPA(Information-tech-nologyPromotion Agency)联合开发的一个实用高效双通道的大词汇连续语音识别引擎。
4、HTK
HTK是Hidden Markov ModelToolkit(隐马尔科夫模型工具包)的简称,HTK主最初是由剑桥大学工程学院(Cambridge University Engineering Department ,CUED)的机器智能实验室于1989年开发的,它被用来构建CUED的大词汇量的语音识别系统。
5、RWTH ASR
RWTH ASR是一个包含语音识别解码器与工具的声学模型开发软件包,2001年由 RWTH Aachen 大学的Human Language Technology and Pattern Recognition Group 开发。
这里主要推荐Kaldi,当然还有Tensorflow(后续重点讲)。
1、Nuance NVP
2、Microsoft Speech API
3、Google Speech API
4、IBM viaVoice
5、科大讯飞语音
6、百度语音
本文发布于:2024-01-28 16:17:56,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/17064298818672.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |