基于TensorFlow的俄语词汇标音系统

阅读: 评论:0

2024年2月5日发(作者:)

基于TensorFlow的俄语词汇标音系统

Journal

of

Computer

Applications ISSN 1001-9081

CODEN

JYIIDU计算机应用,2018, 38(4): 971 - 9772018-04-10

http: //www.

joca.

cnDOI:10.11772/j.

issn. 1001-9081.2017092149文章编号:1001-9081(2018)04-0971-07

基于TensorFlow的俄语词汇标音系统冯伟,易绵竹,马延周(战略支援部队信息工程大学(洛阳),河南洛阳471〇〇3)(*通信作者电子邮箱mianzhuyi@ gmail. com)摘要:针对俄语语音合成和语音识别系统中发音词典规模有限的问题,提出一种基于长短时记忆(LSTM )序列

到序列模型的俄语词汇标音算法,同时设计实现了标音原型系统。首先,对基于SAMPA的俄语音素集进行了改进设

计,使标音结果能够反映俄语单词的重音位置及元音弱化现象,并依据改进的新音素集构建了包含20 000词的俄语

发音词典;然后利用TensorFlow框架实现了这一算法,该算法通过编码LSTM将俄语单词转换为固定维数的向量,再

通过解码LSTM将向量转换为目标发音序列;最后,设计实现了具有交互式单词标音等功能的俄语词汇标音系统。实

验结果表明,该算法在集外词测试集上的词形正确率达到了

74.8%,音素正确率达到了

94.5%

,均高于Phonetisaums

方法。该系统能够有效为俄语发音词典的构建提供支持。关键词:俄语;词汇标音;长短时记忆网络;序列到序列;TensorFlow中图分类号:TP391.1 文献标志码:ARussian phonetic transcription system based on TensorFlowFENG Wei, YIMianzhu% MA Yanzhou(The PLA Strategic Support Force Information Engineering University (Luoyang),

, Luoyang Henan

471003,

China)Abstract:

Focusing

on

the

limited

pronunciation

dictionary

in

Russian

speech

synthesis

and

speech

recognition

system,

a

Russian

grapheme-to-phoneme

algorithm

based

on

Long

Short-Term

Memory (

LSTM)

sequence-to-sequence

model

was

proposed,

as

well

as

a

phonetic

transcription

system.

Firstly,

a

new

Russian

phoneme

set

based

on

Speech

Assessment

Methods

Phonetic

Alphabet (SAMPA)

was

designed,

making

transcription

results

can

reflect

the

stress

position

and

vowel

reduction

of

Russian

words,

and

a 20 000-word

Russian

pronunciation

dictionary

was

constructed

according

to

the

new

phoneme

set.

Then,

the

proposed

algorithm

was

implemented

by

using

the

TensorFlow

framework,

in

which

the

Russian

word

was

converted

into

a

fixed-length

vector

by

encoding

LSTM,

and

then

the

vector

was

converted

into

the

target

pronunciation

sequence

by

decoding

LSTM.

Finally,

the

Russian

phonetic

transcription

system

was

designed

and

implemented.

The

experimental

results

on

out-of-vocabulary

test

set

show

that

the

word

correct

rate

reaches 74.

8%reaches 94.

5%,

and

the

phoneme

correct

rate

,

which

are

higher

than

those

of

Phonetisaurus

method.

The

system

can

effectively

support

the

construction

of

the

Russian

pronunciation

words:

Russian;

phonetic

transcription;

Long

Short-Term

Memory (LSTM);

sequence-to-sequence;

TensorFlow〇引言发音词典是语音信息处理研究中的重要基础资源,在语

音合成和语音识别系统中发挥了关键作用。俄语作为一种拼

音文字,在语言发展中不断有新词和外来词产生,发音词典必

然难以包括所有俄语单词的发音。字音转换(〇13卩1«;1116-1〇-

Phoneme

conversion,

G2P规则,借助大规模俄语重音词典、形态词典以及同形词词典,

经过7个步骤、2次循环完成。Karpov等[1_2]利用该算法构

建了俄语语音识别系统需要的发音词典,但并没有对算法性

能进行严格的测试。由于俄语发音特征复杂多变,正字法的

约束也在逐渐减弱,规则中难免会出现无法覆盖到的例外情

况,这些都会对字音转换的准确率造成影响。2)数据驱动的方法,是目前主流的字音转换方法。典型

的数据驱动方法基于如下思想:首先对训练集中的字素和音

素建立对齐关系,然后利用概率统计算法建立发音模型,最后

通过解码算法计算概率最大的标音结果。例如,Jiampojamam

等[3]提出了多对多的对齐方法,并将隐马尔可夫模型

(Hidden

Markov

Model,

HMM)应用于发音模型建模;Bisani

等[4]提出了联合序列的建模方法,并在英语、德语和法语测

试集上进行了测试;Novak等[5]将加权有限状态转化器

(Weighted

Finaite-State

Transducer,

WFST)技术可以对俄语单词及其变化形式

进行自动注音,有效解决集外词(〇ut-Of-Vocabulary,

OOV)的

注音问题,为俄语发音词典的构建提供支持。字音转换可分为两类:1)基于规则的方法,即通过对俄语正字法和发音规律的

总结,人工制定出俄语的字音转换规则,然后根据规则实现

对单词发音的预测。俄罗斯圣彼得堡大学的Karpov等[1_2]

在俄语语音识别系统的开发过程中对基于规则的俄语字音转

换算法进行了研究。该算法利用俄语辅音变化和元音弱化等)运用于算法的对收稿日期:2017-09-04;修回日期:2017-11-18。

基金项目:洛阳市社会科学规划项目(2016B285)。作者简介:冯伟(1993—),男,陕西西安人,硕士研究生,主要研究方向:自然语言处理;易绵竹(1964—),男,四川营山人,教授,博士,主

要研究方向:计算语言学、语言信息处理;马延周(1977—),男,河南洛阳人,副教授,博士,主要研究方向:计算语言学、语言信息处理。

基于TensorFlow的俄语词汇标音系统

本文发布于:2024-02-05 15:45:21,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170711912157418.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:发音   词典   标音   算法   单词   语音   研究   序列
留言与评论(共有 0 条评论)
   
验证码:
排行榜

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23