(1)邮件爬取收集工具:常见的搜索引擎,例如百度、Bing等
(2)邮件爬取原理:在指定网页上对邮件的关键字进行搜索,对搜索到的邮件相关信息进行爬取,处理
(3)邮件爬取作用:在得到邮件相关信息后,可以进行邮件钓鱼,通过邮件钓鱼来达到渗透的目的。
(1)输入相关库函数
import sys
import getopt
import requests
from bs4 import BeautifulSoup
import re
(2) 利用pt()函数来处理命令行参数,这个函数有两种格式,一种为短选项,即“-"加上单个字母选项,另外一种为长选项,即“--”加一个单词选项。
def start(argv):url = ""pages = ""if len(sys.argv) < 2:print("-h 帮助信息;n")it()try:banner()opts,args = pt(argv,"-u:-p:-h") #这个函数是为了从外部输入不同的命令行选项时,对应执行不同的功能,函数返回两个列表:opts 和argexcept getopt.GetoptError:print('Error an argument!')it()for opt, arg in opts: #opts 是一个两元组的列表。每个元素为:( 选项串, 附加参数),输出opts列表数值并赋值给自定义的变量。if opt == "-u":url = argelif opt == "-p":pages = argelif opt =="-h":print(usage())launcher(url, pages) #后面自己编写的函数
(3)帮助信息,其实就是说明使用规则,使得输出结果显得简洁美观,编辑显示方式、前景色、背景色。输入格式:python xx.py -u 域名 -p 页数
#开头: 33[显示方式;前景色;背景色m
#结尾: 33[0m
def banner(): #输出帮助信息print('