专栏介绍:本栏目为 “2021秋季中国科学院大学胡玥老师的自然语言处理” 课程记录,不仅仅是课程笔记噢~ 如果感兴趣的话,就和我一起入门NLP吧🥰
目录
- 1.语言模型基本概念
- 2.语言模型参数估计
- 3.参数的数据平滑
- 4.语言模型性能评价
- 5.语言模型应用
语言模型的基本思想:
对语句合理性的判断:
语言模型结构:
说明:
- wi 可以是字、词、短语或词类等等,称为统计基元。通常以“词”代之。
- wi 的概率由 w1, …, wi-1 决定,由特定的一组w1, …, wi-1 构成的一个序列,称为 wi 的历史(history)。
原始定义存在的问题:
问题解决方法:
为什么叫二元模型呢?这里要继续介绍n-gram
那么应该如何获得 n 元语法模型中的各概率值(参数)呢?
例题:
给定训练语料如下:如何 训练 2 元文法
“John read Moby Dick”
“Mary read a different book”
“She read a book by Cher”
第一步:预处理(给训练语料加上开始符合结束符号)
John read Moby Dick
Mary read a different book
She read a book by Cher
第二步:用最大似然估计求参数
其他参数不再赘述
在参数训练好之后就可以预测句子出现的概率了。
如果需要求Cher read a book出现的概率呢?
因为p(read|Cher)的概率为0,因此连乘之后必然会得到该句子的概率为0,这是因为训练语料中,并不存在(Cher read),这种由于数据缺乏而引起的零概率问题需要通过数据平滑来解决。
数据平滑的基本思想:
基本目标:
基本约束:
数据平滑方法:
加1法例子:
主要有两种评价方法:
困惑度定义:
例一:
例二:
本文发布于:2024-01-29 10:50:28,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170649663214752.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |