使用开源模型实现验证码识别

兰涛 lands

前言

本文介绍一个开源库,在自我使用下来,发现其识别率较高,且速度也很快,因此推荐给大家。在运行此项目之前需要检查自己的服务器是有代理 和 python 版本管理器

python 版本管理器

在启动 python 的项目时,常常会因为 python 版本过高或者过低导致,无法 pip 安装一些库,因此推荐使用pyenv (python 版本管理器),可以方便控制 python 版本。

1
2
3
pyenv install 3.6  # 安装 Python 3.8.10
pyenv global 3.6 # 设置全局的 Python 版本
pyenv local 3.6 # 设置 Python 本地版本

基于 Clash Core 开源的 Linux 代理

在 pip 过程中很多资源需要梯子才能下载

clash-for-linux-backup

1
# 不多叙述,请自行安装

ddddocr 安装

ddddocr 是一款开源的验证码识别库,内部有两个模型可自行切换,该项目可实现验证码 OCR 识别、滑块检测。请自行点击链接按照官方说明安装。

注: 记得根据文档说明切换 python 版本,和正常的网络环境。

ddddocr-fastapi

ddddocr-fastapi 是一个基于 ddddocr 功能向外开出来的接口服务,该接口有部分 BUG,已经向该库提交 PR。如果作者一直没有合并该 PR,可自行修改并运行

  1. https://github.com/sml2h3/ddddocr-fastapi/pull/43
  2. https://github.com/sml2h3/ddddocr-fastapi/pull/42

效果

ocr 验证码

image

滑块检测

image
返回的是 xy 坐标, 使用 python 的 opencv 库可以也可以实现滑块的识别。
获取到坐标后可自行使用 python 实现滑块的点击和拖动,不会的话可自行 ChatGPT。

  • 标题: 使用开源模型实现验证码识别
  • 作者: 兰涛
  • 创建于 : 2024-08-19 16:00:00
  • 更新于 : 2024-08-19 17:45:22
  • 链接: https://lands.work/e072c53e/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论