鈥榟 鈥淒等csv乱码怎么解决???

阅读: 评论:0

鈥榟 鈥淒等csv乱码怎么解决???

鈥榟 鈥淒等csv乱码怎么解决???

打开csv文件我就慌了,我做文本分析,最后居然要处理的文本里这么多乱码,关键是某些单词的部分由于乱码而确实,如hom,少了个e,这还怎么分析。

我首先一顿百度猛如虎,查找了如下几个办法,感觉最让人看到希望的是这一条:
 

#!/usr/bin/env python# -*- encoding: utf-8 -*-'''
@Author  :   {Jack Zhao}@Time    :   2019/11/11 13:26@Contact :   {zc_dlmu@163}@Desc    :  测试
'''from io import StringIO
import pandas as pd
# Read the csv file into a StringIO object
sio = StringIO()
with open('../data/test.csv', 'r', encoding='unicode-escape') as f:for line in f:print(line)line = de('latin1').decode('utf8')print(line)sio.write(line)
sio.seek(0)    # Reset file pointer to the beginning# Call read_csv, passing the StringIO object
df = pd.read_csv(sio, encoding="utf8")

没有任何卵用

下面第二次尝试:
 

x = b"it\xe2\x80\x99s time to eat"
x = x.decode('unicode-escape').encode('latin1').decode('utf8')
print(x)     # it’s time to eat

并没有什么卵用

上述说的都是Unicode字符编码的问题,但我不是很懂,反正没效果就对了。

解决办法:

Notepad++打开csv文件-》Ctrl+A全选,修改为ANSI编码-》再修改为UTF-8 BOM编码/UTF-8编码-》另存为

转变结果如下图:

这样就不会影响分析了(注意home变的完整了)。

然后操作

本文发布于:2024-01-30 02:47:10,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170655403218695.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:乱码   鈥榟   csv
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23