首页 > 编程札记 > 编程

Python2 中文字典读写

阅读：评论：0

Python2 中文字典读写

Python2 中文字典读写

Python2 中文字典读写

Intro
几个préacquis
读取
写入
读取字典
完成代码

Intro

在做新词提取任务时，被python2的编码恶心到了，研究了半天，整理出以下tips，希望以后不要被编码问题折磨了。！
环境：windows + python 2.7.15 + spyder
ps. 直接从notebook里复制来的，就变成了图片。完整代码在最后。

几个préacquis

python默认的编码时ASCII，需要在第一行加入 # -- coding: utf-8 --，意义是: 以utf-8编码储存字符。
Unicode是集所有语言字符的查询表，ASCII只有英文字母字符和数字。
Utf-8是被最广泛应用的一种编码方案，编码长度从1到16不等。
gbk是主要用于中文的编码方案
decode(): 将其他形式的编码解码为Unicode
encode(): 将Unicode编码为其他形式

读取

写入

读取字典

完成代码

本文发布于:2024-01-29 15:07:52，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/170651207716143.html

版权声明：本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

上一篇：Elasticsearch中文字典排序解决方案

下一篇：Java中如何对汉字进行字典序排序

标签：中文字典

留言与评论（共有 0 条评论）

推荐文章

排行榜

热门标签

我要关灯

我要开灯
返回顶部