自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用OCR技術,自動識別各種驗證碼,工具已開源

人工智能 知識圖譜
OCR的核心技術包含兩方面,一是目標檢測模型檢測圖片中的文字,二是文字識別模型,將圖片中的文字轉(zhuǎn)成文本文字。

今天我在給大家分享一個 OCR? 應用——ddddocr自動識別驗證碼。

前面 4 個d是“帶帶弟弟”的首拼音。[/笑哭]。

項目地址:https://github.com/sml2h3/ddddocr。

使用的時候用pip?命令直接安裝即可pip install ddddocr。

OCR的核心技術包含兩方面,一是目標檢測模型檢測圖片中的文字,二是文字識別模型,將圖片中的文字轉(zhuǎn)成文本文字。

第一類驗證碼最簡單,它們沒有復雜的背景圖片,所以目標檢測模型可以省略,直接將圖片送入文字識別模型即可。

圖片

識別代碼如下:

import ddddocr
from PIL import Image

# 模型
ocr = ddddocr.DdddOcr(beta=True)

# 驗證碼圖片
with open('test.jpg', 'rb') as f:
image = f.read()

res = ocr.classification(image)
# 驗證碼文字內(nèi)容
print(res)

第二類驗證碼有復雜的背景,需要先用目標檢測模型框出文字,在進行識別。

圖片

代碼如下:

import ddddocr
import cv2

det = ddddocr.DdddOcr(det=True)

with open("test2.jpg", 'rb') as f:
image = f.read()

# 目標檢測
poses = det.detection(image)
print(poses)

im = cv2.imread("test2.jpg")

# 遍歷檢測出的文字
for box in poses:
x1, y1, x2, y2 = box
# 給每個文字畫矩形框
im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

cv2.imwrite("result.jpg", im)

輸出結果如下:

圖片

可以看到文字部分已經(jīng)被框出來了,如果我們在上述代碼直接將im[y1:y2, x1:x2]送入文字識別模型,就可以識別出對應的文本內(nèi)容了。

ddddocr還能識別下面這種帶滑塊的驗證碼。

圖片

圖片

這種雖然不屬于OCR的業(yè)務范疇,但作為一個通用的驗證碼識別工具,作者還是支持了,必須給作者點個贊。

責任編輯:武曉燕 來源: 渡碼
相關推薦

2023-10-27 08:53:13

Python驗證碼圖片識別

2024-01-29 08:32:10

Python驗證碼識別

2013-06-19 10:19:59

2021-07-22 10:25:07

JS驗證碼前端

2020-12-29 05:33:03

Serverless驗證碼架構

2020-11-16 07:28:53

驗證碼

2015-03-23 18:03:36

短信驗證碼正則自動填寫

2021-06-16 06:58:09

TensorFlow識別驗證碼

2016-12-22 12:40:06

辦公外設

2009-06-26 15:17:27

jQuery

2014-04-24 10:09:05

驗證碼C#

2011-06-01 13:49:00

Android 內(nèi)存

2024-03-08 12:04:22

PythonPillow驗證碼

2009-08-11 14:05:28

JSP驗證碼

2009-02-09 14:17:36

2023-05-17 15:22:45

識別開源工具

2015-03-23 17:58:04

驗證碼倒計時并行

2015-09-21 15:31:05

php實現(xiàn)驗證碼

2021-01-19 10:29:34

短信驗證碼密碼
點贊
收藏

51CTO技術棧公眾號