最近做验证码的时候遇到了一个杂色背景验证码识别的问题,虽然可以通过finetune的方式直接解决识别问题,但是为了减少标注量和额外的工作,考虑通过图像处理的方式去除背景提取文字,然后只需要直接掉用现有识别模型就行了。没查到比较好的办法,自己琢磨了一下,大家可以参考一下我的思路。
验证码图像长这样:
整体思路比较简单,弱化背景,把文字给提取出来。
首先,需要考虑如何减少杂色的干扰,由于背景杂色都是短线条和色点,最直接的方式就是使用滤波将杂色过滤掉,采用中值滤波可以弱化背景影响。
背景杂色基本不明显了,可是文字本身也不明显了😂。
所以下一步是如何把文字提取出来,经过分析,文字颜色在滤波后相对来说比较深,一把阈值化就可以了。
至此,已有识别模型就可以识别了。
本文发布于:2024-02-02 13:56:06,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170685336544251.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |