a = '屠杀 massacre 4.167 6'
jie= a.split(' ')
res = re.findall('d+.?d*|[a-zA-Z]+', a)
for item in res:if item in ve(item)
print(' '.join(jie))
上述方法太复杂,且限制条件太多,只允许出现数字,中文,英文,且以空格的方式分开。
现在直接用汉字的匹配规则进行匹配
content = """yingjie1111n
222 . xyx ying 杰哥 ?
"""
pattern = repile(r'[u4e00-u9fa5]+')
result = pattern.findall(content)
print(result)
或者使用排除法,[^]去反的方式,去处数字d, 字母a-zA-Z, 去除.,去除?去除空格s换行n
content = """yingjie1111n
222 . xyx ying 杰哥 ?
"""
# pattern = repile(r'[u4e00-u9fa5]+')
# result = pattern.findall(content)
# print(result)
result = re.findall('[^?A-Za-z.n0-9s]+',content)
print(result)
本文发布于:2024-01-28 00:33:37,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/17063732143573.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |