2024年2月5日发(作者:)
Journal
of
Computer
Applications ISSN 1001-9081
CODEN
JYIIDU计算机应用,2018, 38(4): 971 - 9772018-04-10
http: //www.
joca.
cnDOI:10.11772/j.
issn. 1001-9081.2017092149文章编号:1001-9081(2018)04-0971-07
基于TensorFlow的俄语词汇标音系统冯伟,易绵竹,马延周(战略支援部队信息工程大学(洛阳),河南洛阳471〇〇3)(*通信作者电子邮箱mianzhuyi@ gmail. com)摘要:针对俄语语音合成和语音识别系统中发音词典规模有限的问题,提出一种基于长短时记忆(LSTM )序列
到序列模型的俄语词汇标音算法,同时设计实现了标音原型系统。首先,对基于SAMPA的俄语音素集进行了改进设
计,使标音结果能够反映俄语单词的重音位置及元音弱化现象,并依据改进的新音素集构建了包含20 000词的俄语
发音词典;然后利用TensorFlow框架实现了这一算法,该算法通过编码LSTM将俄语单词转换为固定维数的向量,再
通过解码LSTM将向量转换为目标发音序列;最后,设计实现了具有交互式单词标音等功能的俄语词汇标音系统。实
验结果表明,该算法在集外词测试集上的词形正确率达到了
74.8%,音素正确率达到了
94.5%
,均高于Phonetisaums
方法。该系统能够有效为俄语发音词典的构建提供支持。关键词:俄语;词汇标音;长短时记忆网络;序列到序列;TensorFlow中图分类号:TP391.1 文献标志码:ARussian phonetic transcription system based on TensorFlowFENG Wei, YIMianzhu% MA Yanzhou(The PLA Strategic Support Force Information Engineering University (Luoyang),
, Luoyang Henan
471003,
China)Abstract:
Focusing
on
the
limited
pronunciation
dictionary
in
Russian
speech
synthesis
and
speech
recognition
system,
a
Russian
grapheme-to-phoneme
algorithm
based
on
Long
Short-Term
Memory (
LSTM)
sequence-to-sequence
model
was
proposed,
as
well
as
a
phonetic
transcription
system.
Firstly,
a
new
Russian
phoneme
set
based
on
Speech
Assessment
Methods
Phonetic
Alphabet (SAMPA)
was
designed,
making
transcription
results
can
reflect
the
stress
position
and
vowel
reduction
of
Russian
words,
and
a 20 000-word
Russian
pronunciation
dictionary
was
constructed
according
to
the
new
phoneme
set.
Then,
the
proposed
algorithm
was
implemented
by
using
the
TensorFlow
framework,
in
which
the
Russian
word
was
converted
into
a
fixed-length
vector
by
encoding
LSTM,
and
then
the
vector
was
converted
into
the
target
pronunciation
sequence
by
decoding
LSTM.
Finally,
the
Russian
phonetic
transcription
system
was
designed
and
implemented.
The
experimental
results
on
out-of-vocabulary
test
set
show
that
the
word
correct
rate
reaches 74.
8%reaches 94.
5%,
and
the
phoneme
correct
rate
,
which
are
higher
than
those
of
Phonetisaurus
method.
The
system
can
effectively
support
the
construction
of
the
Russian
pronunciation
words:
Russian;
phonetic
transcription;
Long
Short-Term
Memory (LSTM);
sequence-to-sequence;
TensorFlow〇引言发音词典是语音信息处理研究中的重要基础资源,在语
音合成和语音识别系统中发挥了关键作用。俄语作为一种拼
音文字,在语言发展中不断有新词和外来词产生,发音词典必
然难以包括所有俄语单词的发音。字音转换(〇13卩1«;1116-1〇-
Phoneme
conversion,
G2P规则,借助大规模俄语重音词典、形态词典以及同形词词典,
经过7个步骤、2次循环完成。Karpov等[1_2]利用该算法构
建了俄语语音识别系统需要的发音词典,但并没有对算法性
能进行严格的测试。由于俄语发音特征复杂多变,正字法的
约束也在逐渐减弱,规则中难免会出现无法覆盖到的例外情
况,这些都会对字音转换的准确率造成影响。2)数据驱动的方法,是目前主流的字音转换方法。典型
的数据驱动方法基于如下思想:首先对训练集中的字素和音
素建立对齐关系,然后利用概率统计算法建立发音模型,最后
通过解码算法计算概率最大的标音结果。例如,Jiampojamam
等[3]提出了多对多的对齐方法,并将隐马尔可夫模型
(Hidden
Markov
Model,
HMM)应用于发音模型建模;Bisani
等[4]提出了联合序列的建模方法,并在英语、德语和法语测
试集上进行了测试;Novak等[5]将加权有限状态转化器
(Weighted
Finaite-State
Transducer,
WFST)技术可以对俄语单词及其变化形式
进行自动注音,有效解决集外词(〇ut-Of-Vocabulary,
OOV)的
注音问题,为俄语发音词典的构建提供支持。字音转换可分为两类:1)基于规则的方法,即通过对俄语正字法和发音规律的
总结,人工制定出俄语的字音转换规则,然后根据规则实现
对单词发音的预测。俄罗斯圣彼得堡大学的Karpov等[1_2]
在俄语语音识别系统的开发过程中对基于规则的俄语字音转
换算法进行了研究。该算法利用俄语辅音变化和元音弱化等)运用于算法的对收稿日期:2017-09-04;修回日期:2017-11-18。
基金项目:洛阳市社会科学规划项目(2016B285)。作者简介:冯伟(1993—),男,陕西西安人,硕士研究生,主要研究方向:自然语言处理;易绵竹(1964—),男,四川营山人,教授,博士,主
要研究方向:计算语言学、语言信息处理;马延周(1977—),男,河南洛阳人,副教授,博士,主要研究方向:计算语言学、语言信息处理。
本文发布于:2024-02-05 15:45:21,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170711912157418.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |