首页 > 编程札记 > javascript

基于TensorFlow的俄语词汇标音系统

阅读：评论：0

2024年2月5日发(作者：)

Journal

Computer

Applications ISSN 1001-9081

CODEN

JYIIDU计算机应用，2018, 38(4): 971 - 9772018-04-10

http: //www.

joca.

cnDOI：10.11772/j.

issn. 1001-9081.2017092149文章编号：1001-9081(2018)04-0971-07

基于TensorFlow的俄语词汇标音系统冯伟，易绵竹，马延周(战略支援部队信息工程大学(洛阳)，河南洛阳471〇〇3)(*通信作者电子邮箱mianzhuyi@ gmail. com)摘要:针对俄语语音合成和语音识别系统中发音词典规模有限的问题，提出一种基于长短时记忆（LSTM )序列

到序列模型的俄语词汇标音算法，同时设计实现了标音原型系统。首先，对基于SAMPA的俄语音素集进行了改进设

计，使标音结果能够反映俄语单词的重音位置及元音弱化现象，并依据改进的新音素集构建了包含20 000词的俄语

发音词典；然后利用TensorFlow框架实现了这一算法，该算法通过编码LSTM将俄语单词转换为固定维数的向量，再

通过解码LSTM将向量转换为目标发音序列；最后，设计实现了具有交互式单词标音等功能的俄语词汇标音系统。实

验结果表明，该算法在集外词测试集上的词形正确率达到了

74.8%，音素正确率达到了

94.5%

,均高于Phonetisaums

方法。该系统能够有效为俄语发音词典的构建提供支持。关键词：俄语;词汇标音；长短时记忆网络;序列到序列；TensorFlow中图分类号:TP391.1 文献标志码:ARussian phonetic transcription system based on TensorFlowFENG Wei, YIMianzhu% MA Yanzhou(The PLA Strategic Support Force Information Engineering University (Luoyang),

， Luoyang Henan

471003,

China)Abstract：

Focusing

the

limited

pronunciation

dictionary

Russian

speech

synthesis

and

speech

recognition

system,

Russian

grapheme-to-phoneme

algorithm

based

Long

Short-Term

Memory (

LSTM)

sequence-to-sequence

model

was

proposed,

well

phonetic

transcription

system.

Firstly,

new

Russian

phoneme

set

based

Speech

Assessment

Methods

Phonetic

Alphabet (SAMPA)

was

designed,

making

transcription

results

can

reflect

the

stress

position

and

vowel

reduction

Russian

words,

and

a 20 000-word

Russian

pronunciation

dictionary

was

constructed

according

the

new

phoneme

set.

Then,

the

proposed

algorithm

was

implemented

using

the

TensorFlow

framework,

which

the

Russian

word

was

converted

into

fixed-length

vector

encoding

LSTM,

and

then

the

vector

was

converted

into

the

target

pronunciation

sequence

decoding

LSTM.

Finally,

the

Russian

phonetic

transcription

system

was

designed

and

implemented.

The

experimental

results

out-of-vocabulary

test

set

show

that

the

word

correct

rate

reaches 74.

8%reaches 94.

5%,

and

the

phoneme

correct

rate

which

are

higher

than

those

Phonetisaurus

method.

The

system

can

effectively

support

the

construction

the

Russian

pronunciation

words：

Russian;

phonetic

transcription;

Long

Short-Term

Memory (LSTM);

sequence-to-sequence;

TensorFlow〇引言发音词典是语音信息处理研究中的重要基础资源，在语

音合成和语音识别系统中发挥了关键作用。俄语作为一种拼

音文字，在语言发展中不断有新词和外来词产生，发音词典必

然难以包括所有俄语单词的发音。字音转换（〇13卩1«；1116-1〇-

Phoneme

conversion,

G2P规则，借助大规模俄语重音词典、形态词典以及同形词词典，

经过7个步骤、2次循环完成。Karpov等[1_2]利用该算法构

建了俄语语音识别系统需要的发音词典，但并没有对算法性

能进行严格的测试。由于俄语发音特征复杂多变，正字法的

约束也在逐渐减弱，规则中难免会出现无法覆盖到的例外情

况，这些都会对字音转换的准确率造成影响。2)数据驱动的方法，是目前主流的字音转换方法。典型

的数据驱动方法基于如下思想:首先对训练集中的字素和音

素建立对齐关系，然后利用概率统计算法建立发音模型，最后

通过解码算法计算概率最大的标音结果。例如，Jiampojamam

等[3]提出了多对多的对齐方法，并将隐马尔可夫模型

(Hidden

Markov

Model,

HMM)应用于发音模型建模；Bisani

等[4]提出了联合序列的建模方法，并在英语、德语和法语测

试集上进行了测试；Novak等[5]将加权有限状态转化器

(Weighted

Finaite-State

Transducer,

WFST)技术可以对俄语单词及其变化形式

进行自动注音，有效解决集外词（〇ut-Of-Vocabulary,

OOV)的

注音问题，为俄语发音词典的构建提供支持。字音转换可分为两类：1)基于规则的方法，即通过对俄语正字法和发音规律的

总结，人工制定出俄语的字音转换规则，然后根据规则实现

对单词发音的预测。俄罗斯圣彼得堡大学的Karpov等[1_2]

在俄语语音识别系统的开发过程中对基于规则的俄语字音转

换算法进行了研究。该算法利用俄语辅音变化和元音弱化等)运用于算法的对收稿日期:2017-09-04;修回日期:2017-11-18。

基金项目：洛阳市社会科学规划项目（2016B285)。作者简介:冯伟（1993—)，男，陕西西安人，硕士研究生，主要研究方向：自然语言处理；易绵竹（1964—)，男，四川营山人，教授，博士，主

要研究方向:计算语言学、语言信息处理；马延周（1977—），男，河南洛阳人，副教授，博士，主要研究方向:计算语言学、语言信息处理。

本文发布于:2024-02-05 15:45:21，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/170711912157418.html

上一篇：人工智能基础(习题卷75)

下一篇：基于神经网络的音频识别系统设计与实现

标签：发音词典标音算法单词语音研究序列

留言与评论（共有 0 条评论）