使用Tesseract-ocr识别验证码,暴力破解某高校学生登录系统
声明:本文章仅限于技术交流,严禁用于非法途径,转载需联系我
文章用到的工具、还有项目放在百度云盘,地址在文章最后面
使用到了技术点:
1.Tesseract-ocr本地安装(用于后面的字库训练)
2.Tesseract-ocr对应java开源的tess4j使用
3.使用jTessBoxEditor训练字库(提高验证码识别率)
4.模拟登录,随机密码进行尝试破解。
一、Tesseract-ocr本地安装(用于后面的字库训练)
介绍:Tesseract:开源的OCR识别引擎,初期Tesseract引擎由HP实验室研发,后来贡献给了开源软件业,后经由Google进行改进,消除bug,优化,重新发布。当前版本为3.02.
项目地址为:
1、下载安装Tesseract-OCR引擎(3.0版本+才支持中文识别)
下载完后进行安装,默认情况下安装程序会给你配置系统环境变量,以指向安装目录(之后可以通过DOS界面在任意目录运行tesseract)。安装完成后目录如下:
附录:
tessdata 目录存放的是语言字库文件,和在命令行界面中可能用到的参数所对应的文件. 这个安装程序默认包含了英文字库。
如果想能识别中文,可以到.
简体中文字库文件下载地址为:. 下载完成后解压,然后将该文件剪切到tessdata目录下去就可以了。
注意:语言字库文件很大,而且图片的识别率是很低的,要提高破解率的话只能进行针对性的字库训练(后面会讲到的)
2.使用Tesseract-ocr识别
打开Dos命令输入tesseract -v,如下图:
本文发布于:2024-02-02 04:35:53,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170681975641393.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |