使用正则表达筛选出中文汉字

阅读: 评论:0

使用正则表达筛选出中文汉字

使用正则表达筛选出中文汉字

a = '屠杀 massacre 4.167 6'
jie= a.split(' ')
res = re.findall('d+.?d*|[a-zA-Z]+', a)
for item in res:if item in ve(item)
print(' '.join(jie))

上述方法太复杂,且限制条件太多,只允许出现数字,中文,英文,且以空格的方式分开。

现在直接用汉字的匹配规则进行匹配

content = """yingjie1111n
222   .  xyx  ying  杰哥 ?
"""
pattern = repile(r'[u4e00-u9fa5]+')
result = pattern.findall(content)
print(result)

或者使用排除法,[^]去反的方式,去处数字d, 字母a-zA-Z, 去除.,去除?去除空格s换行n

content = """yingjie1111n
222   .  xyx  ying  杰哥 ?
"""
# pattern = repile(r'[u4e00-u9fa5]+')
# result = pattern.findall(content)
# print(result)
result = re.findall('[^?A-Za-z.n0-9s]+',content)
print(result)

本文发布于:2024-01-28 00:33:37,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/17063732143573.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:汉字   正则   中文
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23