机器学习(10)

阅读: 评论:0

机器学习(10)

机器学习(10)

1.NLP是什么

自然语言处理
用于对文本的分类
用于对中英文的互相翻译
用于打字时候的自动纠错
垃圾邮件过滤

1.1本次的目标
这次学习是1000个英文的对一餐馆的评价,以及手动分类的结果,看一下是正面还是负面的评价。
用NLP算法自动辨别评价的好坏,当在拿到一个评价时,就可以自动进行好坏的分类了。
这次要做的就是对评论就行分类,完成以后可以拓展到文本文章英文报道等进行应用。
1.2观察数据

打开评论的tsv文件(文本很特殊,特殊的表单符号被处理)1正面评论、2负面评论,都是手动添加

2.NLP源码分析

2.1.导入数据,利用panda
导入tsv文件,分隔符是‘Tab’,就是‘t’
quoting = 3:去除引号

dataset = pd.read_csv('R_Reviews.tsv', delimiter = 't', quoting = 3)

从Spyder中的Variable explorer

本文发布于:2024-01-29 05:10:09,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170647621312920.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

下一篇:餐馆点菜
标签:机器
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23