pythonchalleage leve2

阅读：评论：0

题目网址.html

从网页源代码的指定的大段注释中找“rare character“。

import sys, urllib
import reurl = ".html"
wp = urllib.urlopen(url)  #打开
content = wp.read()  #读入p = repile(r'<!--([sS]*?)-->')  #正则
out = p.findall(content)[1]
res = [c for c in out if c.isalpha()]
print ''.join(res)

注意点：

正则表达式不能用''。

1. '.'不能匹配空格，换行符等。

2. '.*'是贪婪匹配，会匹配尽量多的字符。比如content='<body>...</body>','<(.*)>'匹配的结果是'body>...</body'。*号后面加?号，则是以最少的内容匹配。

本文发布于:2024-02-02 08:03:55，感谢您对本站的认可！

本文链接：https://www.4u4v.net/it/170683223642463.html

上一篇：攻防世界xctf PWN leve2详细讲解，两个地址方法

下一篇：1.leve1

标签：pythonchalleage

留言与评论（共有 0 条评论）