总是把这三个弄混...
今天算是明白这三个不是一个概念...
标黑的是每个特征的特性。
*************************************************
BN特征是属于深度特征,这一点无可非议。不过deep feature应该除了bottle neck之外还可以包括d-vector等等,这个概念在Google的2014年ICASSP《DEEP NEURAL NETWORKS FOR SMALL FOOTPRINT TEXT-DEPENDENT SPEAKER VERIFICATION》上有提到。
这些深度特征也都可以适用在语音识别、说话人识别。这样认为BN等同deep feature也算是可以的。而DNN训练确实是pre-training加一个fine-tune,而这个过程可以视为DBN的过程,当在最后一层隐含层后再加一层softmax输出,就会成为DBN-DNN。这个过程在Hinton 的论文里有详细的分析《Deep Neural Networks for Acoustic Modeling in Speech Recognition》。而BN通常都是在倒数第二层提取。
bottleneck应该最早源于1994年的《CONNECTIONIST SPEECH RECOGNITION A Hybrid Approach》,里面首先提出到BN层应该要同时比inputoutput结点数都要少的概念,而把多种特征拼接起来Tandem的概念可以在2000的ICASSP《TANDEM CONNECTIONIST FEATURE EXTRACTION FOR CONVENTIONAL HMM SYSTEMS》里找到。
本文发布于:2024-01-27 17:45:23,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/17063487231721.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |