OpenCV 常用的七個(gè)示例：從讀取到人臉檢測(cè)（Python版）

作者：二旺 2023-11-29 20:38:49

OpenCV 庫(kù)是2500多個(gè)優(yōu)化算法的組合。它可以用來(lái)檢測(cè)和識(shí)別不同的人臉，在圖像中或?qū)崟r(shí)識(shí)別物體。

OpenCV

OpenCV是計(jì)算機(jī)視覺領(lǐng)域最流行的庫(kù)之一。它最初是用 C 和 C++ 編寫的。現(xiàn)在也可以在 Python 中使用。它最初是由英特爾開發(fā)的。該庫(kù)是一個(gè)跨平臺(tái)的開源庫(kù)。免費(fèi)使用。OpenCV 庫(kù)是一個(gè)高度優(yōu)化的庫(kù)，其主要重點(diǎn)是實(shí)時(shí)應(yīng)用程序。

OpenCV 庫(kù)是2500多個(gè)優(yōu)化算法的組合。它可以用來(lái)檢測(cè)和識(shí)別不同的人臉，在圖像中或?qū)崟r(shí)識(shí)別物體，使用視頻和網(wǎng)絡(luò)攝像頭分類不同的人類行為，跟蹤攝像機(jī)的運(yùn)動(dòng)，跟蹤像汽車、人類等移動(dòng)物體，實(shí)時(shí)計(jì)數(shù)物體，將圖像拼接在一起產(chǎn)生高分辨率圖像，從圖像數(shù)據(jù)庫(kù)中找到類似的圖像，從使用閃光燈拍攝的圖像中去除紅眼，提高圖像質(zhì)量，跟蹤眼球運(yùn)動(dòng)，跟蹤人臉等

它擁有大約4.7萬(wàn)活躍用戶社區(qū)，估計(jì)下載量超過1800萬(wàn)次。許多大公司，如谷歌，亞馬遜，特斯拉，微軟，本田等使用OpenCV，使他們的產(chǎn)品更好，更智能。

先決條件

在開始編寫代碼之前，我們需要在我們的設(shè)備上安裝 OpenCV 。如果你是專業(yè)的編程人員并且知道每一個(gè) IDE，那么去 Pycharm 并且在設(shè)置中從它的包管理器中安裝 OpenCV-python。

如果您是初學(xué)者或中級(jí)程序員，或者只是想關(guān)注該博客，那么我們將使用代碼編輯器而不是IDE。只需轉(zhuǎn)到Visual Studio Code網(wǎng)站并根據(jù)您的操作系統(tǒng)下載最新版本即可?，F(xiàn)在，我們將創(chuàng)建一個(gè)虛擬環(huán)境，在其中將安裝 OpenCV。打開終端，然后使用cd定位到桌面。使用名為opencv的mkdir創(chuàng)建一個(gè)文件夾然后在以下命令中運(yùn)行。

python -m venv env

現(xiàn)在使用 env\scripts\activate 命令激活環(huán)境，你會(huì)看到在 C:\Users\username\Desktop\opencv 前出現(xiàn)一個(gè)帶小括號(hào)的 (env)?，F(xiàn)在只需使用 pip 安裝 OpenCV。

pip install opencv-python

我們將在這個(gè)博客中涵蓋7個(gè)主題：

讀、寫和展示一個(gè)圖像
讀取視頻與集成網(wǎng)絡(luò)攝像頭
縮放和裁剪圖像
使用函數(shù)的基本圖像濾波器
繪制不同的形狀
在圖像上寫文字
檢測(cè)和裁剪人臉

1.讀、寫和展示一個(gè)圖像

為了使用 OpenCV 讀取圖像，我們使用函數(shù) imread() ，為了顯示圖像，我們使用函數(shù) imshow() ，為了寫入圖像，我們使用函數(shù) imwrite()。讓我們看看每一個(gè)的語(yǔ)法。

imread()：

img = cv2.imread("PATH_TO_IMAGE.jpg/png")

Example
img = imread("images/dog0.jpg")

imshow()：

cv2.imshow("WINDOW NAME",IMG_VAR)

Example
imshow("Dog Image",img)

imwrite():

cv2.imwrite(FILENAME, IMAGE)
filename: A string representing the file name. The filename must include image format like .jpg, .png, etc.
image: It is the image that is to be saved.

Example
cv2.imwrite('images/img',img)

.讀取視頻與集成網(wǎng)絡(luò)攝像頭

讀取視頻文件與讀取 OpenCV 中的圖像文件非常相似。不同之處在于我們使用 cv2.videocapture()

語(yǔ)法：

video = cv2.VideoCapture("FILEPATH.mp4")

Example
video = cv2.VideoCapture("video/dog/dog.mp4")

視頻是許多幀圖像在一起的集合，每一幀都是一個(gè)圖像。要使用 OpenCV 觀看視頻，我們只需要使用 while 循環(huán)顯示視頻的每一幀。

while True:
   success , img = cap.read()
   cv2.imshow("Video",img)
   if cv2.waitKey(1) & 0xff==ord('q'):##key 'q' will break the loop
       break

為了與網(wǎng)絡(luò)攝像頭集成，我們需要傳遞網(wǎng)絡(luò)攝像頭的端口值，而不是路徑到視頻。如果你使用的是筆記本電腦，沒有連接任何外部攝像頭，那么簡(jiǎn)單地傳遞0，如果你連接了任何外部攝像頭，那么傳遞一個(gè)攝像頭端口值。

cap = cv2.VideoCapture(0)
cap.set(3,640)  ## Frame width
cap.set(4,480)  ## Frame Height
cap.set(10,100) ## Brightness
while True:
   success, img = cap.read()
   cv2.imshow("Video",img)
   if cv2.waitKey(1) & 0xff == ord('q'):
        break

3.縮放和裁剪圖像

(1) 縮放圖像

縮放是一個(gè)改變圖像形狀的過程。在 Opencv，我們可以使用 resize 函數(shù)來(lái)調(diào)整圖像的形狀。

語(yǔ)法：

cv2.resize(IMG,(WIDTH,HEIGHT))
IMG: image which we want to resize
WIDTH: new width of the resize image
HEIGHT: new height of the resize image

Example
cv2.resize(img,(224,224))

要調(diào)整圖像的大小，我們首先需要知道圖像的形狀。我們可以利用 shape 找到圖像的形狀，然后根據(jù)當(dāng)前圖像的形狀，我們可以增大或減小圖像的大小。讓我們舉個(gè)例子來(lái)看看。

import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
imgResize = cv2.resize(img,(224,224)) ##Decrease size
imgResize2 = cv2.resize(img,(1024,1024)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)

如果您不想把圖像寬度和高度寫死，您也可以根據(jù)現(xiàn)有的形狀，然后根據(jù)比例改變圖像的寬度和高度。

import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
shape = img.shape
imgResize = cv2.resize(img,(shape[0]//2,shape[1]//2))##Decrease size
imgResize2 = cv2.resize(img,(shape[0]*2,shape[1]*2)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)

(2) 裁剪圖像

裁剪是獲取部分圖像的過程。在 OpenCV 中，我們可以通過定義裁剪后的矩形坐標(biāo)來(lái)執(zhí)行裁剪。

語(yǔ)法：

imgCropped = img[y1:y2, x1:x2](x1,y1): top-left vertex
(x2,y2): bottom-right vertex

Example
imgCropped = img[0:100,200:200]

使用裁剪方法，讓我們嘗試從圖像中提取 Monalisa 的臉。

import cv2
img = cv2.imread("images/img0.jpg")
imgCropped = img[50:250,120:330]
cv2.imshow("Image cropped",imgCropped)
cv2.imshow("Image",img)
cv2.waitKey(0)

您還可以使用繪畫模式來(lái)查找(x1，y1)、(x2，y2)的正確坐標(biāo)。

這里有個(gè)小任務(wù)：

任務(wù)：右鍵單擊圖像并保存它; 嘗試從圖像中獲取國(guó)王卡。
提示：使用繪畫模式找到正確的坐標(biāo)，最后，使用調(diào)整大小，以增加裁剪圖像的大小。

4.使用函數(shù)的基本圖像濾波器

我們可以在圖像上使用許多基本的濾波器，比如將圖片轉(zhuǎn)換成灰度、模糊等等。

(1) 從 Img 到 gray

為了將圖像從彩色圖像轉(zhuǎn)換為灰度圖像，我們可以使用函數(shù) cv2.cvtColor，在這里我們傳遞 cv2.COLOR_BGR2GRAY 作為參數(shù)。

語(yǔ)法：

imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2GRAY)

Example
imgGray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

(2) 從 Img 到 HSV

為了將圖像轉(zhuǎn)換為 HSV 顏色空間，我們可以使用函數(shù) cv2.cvtColor，這里我們傳遞 cv2.COLOR_BGR2HSV 作為參數(shù)。它主要用于目標(biāo)跟蹤。

語(yǔ)法：

imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2HSV)

Example
imgHsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)

(3) 模糊圖像

模糊用于去除圖像中的噪聲，也稱為平滑。它是對(duì)圖像應(yīng)用低通濾波器的過程。在 OpenCV 中對(duì)圖像進(jìn)行模糊，我們常用 GaussianBlur。

語(yǔ)法：

imgBlur = cv2.GaussianBlur(img,(sigmaX,sigmaY),kernalSize)

kernalsize ? A Size object representing the size of the kernel.
sigmaX ? A variable representing the Gaussian kernel standard deviation in X direction.
sigmaY - same as sigmaX

Exmaple
imgBlur = cv2.GaussianBlur(img,(3,3),0)

(4) 邊緣檢測(cè)

在 OpenCV 中，我們使用 Canny算子來(lái)檢測(cè)圖像中的邊緣。也有不同的邊緣檢測(cè)器，但最著名的是 Canny算子。Canny算子邊緣檢測(cè)是一種邊緣檢測(cè)算子，它使用多級(jí)算法來(lái)檢測(cè)圖像中的大范圍邊緣，是由 John F. Canny 在1986年提出的。

語(yǔ)法：

imgCanny = cv2.Canny(img,threshold1,threshold2)

threshold1,threshold2:Different values of threshold different for every images

Example
imgCanny = cv2.Canny(img,100,150)

(5) 膨脹

膨脹被用來(lái)增加圖像中邊緣的大小。首先，我們定義了奇數(shù)(5,5)的核矩陣大小。然后使用內(nèi)核，我們對(duì)圖像執(zhí)行膨脹。下面我們對(duì) Canny 算子的輸出圖像進(jìn)行了膨脹。

語(yǔ)法：

kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.dilate(imgCanny,kernel,iterations=1) ##DIALATION

(6) 腐蝕

侵蝕與膨脹正好相反。該算法用于減小圖像中邊緣的大小。首先，我們定義了奇數(shù)(5,5)的核矩陣大小。然后使用內(nèi)核，我們對(duì)圖像執(zhí)行腐蝕。下面我們對(duì) Canny 算子的輸出圖像進(jìn)行腐蝕處理。

kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.erode(imgCanny,kernel,iterations=1) ##EROSION

現(xiàn)在，在同一個(gè)程序中使用上述基本函數(shù)處理 Monalisa 圖像。

5.繪制不同的形狀

我們可以使用 OpenCV 繪制不同的形狀，像矩形，圓形，線等。

(1) 長(zhǎng)方形：

要在圖像上繪制一個(gè)矩形，我們使用 cv2.rectangle 函數(shù)。在函數(shù)中，我們將寬度、高度、 x、 y、 RGB 中的顏色、深度作為參數(shù)傳遞。

語(yǔ)法：

cv2.rectangle(img,(w,h),(x,y),(R,G,B),THICKNESS)
w: width
h: height
x: distance from x axis
y: distance from y axis
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.rectangle(img,(100,300),(200,300),(255,0,255),2)

(2) 圓形：

為了繪制一個(gè)圓形，我們使用 cv2.circle 函數(shù)。我們傳遞 x，y，半徑大小，RGB 顏色，深度作為參數(shù)。

語(yǔ)法：

cv2.circle(img,(x,y),radius,(R,G,B),THICKNESS)
x: distance from x axis
y: distance from y axis
radius: size of radius(integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.circle(img,(200,130),90,(255,255,0),2)

(3) 直線：

要繪制一條直線，我們使用 cv2.line 函數(shù)傳遞起始點(diǎn)(x1，y1)、終點(diǎn)(x2，y2)、 RGB 格式的顏色、深度作為參數(shù)。

語(yǔ)法：

cv2.line(img,(x1,y1),(x2,y2),(R,G,B),THICKNESS)x1,y1: start point of line (integer)
x2,y2: end point of line (integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.line(img,(110,260),(300,260),(0,255,0),3)

6.在圖像上寫文字

在 OpenCV 中，我們有一個(gè)函數(shù) cv2.puttext，用于在特定位置在圖像上寫入文本。它以圖像、文本、 x、 y、顏色、字體、字號(hào)、粗細(xì)作為輸入?yún)?shù)。

語(yǔ)法：

cv2.putText(img,text,(x,y),FONT,FONT_SCALE,(R,G,B),THICKNESS)
img: image to put text on
text: text to put on image
X: text distance from X axis
Y: text distance from Y axis
FONT: Type of FONT (ALL FONT TYPES)
FONT_SCALE: Scale of Font(Integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.putText(img,"HELLO",(120,250),cv2.FONT_HERSHEY_COMPLEX,1,(255,255,255),2)

7.檢測(cè)和裁剪人臉

人臉檢測(cè)在人臉識(shí)別系統(tǒng)中非常有用。在 OpenCV 中，我們有許多預(yù)先訓(xùn)練的 haar 級(jí)聯(lián)分類器可用于不同的任務(wù)。以下網(wǎng)址可以查看 OpenCV GitHub 上的分類器列表：https://github.com/opencv/opencv/tree/master/data/haarca

scades。

我們使用 haarcascade_frontalface_default.xml 分類器來(lái)檢測(cè)圖像中的人臉。它將返回圖像的四個(gè)坐標(biāo)(w，h，x，y)。使用這些坐標(biāo)，我們要在臉上畫一個(gè)矩形，然后使用相同的坐標(biāo)，繼續(xù)裁剪人臉。最后使用 imwrite，把裁剪后的圖像保存到目錄中。

import cv2
# Load the cascade
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# Read the input image
img = cv2.imread('images/img0.jpg')# Convert into grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Detect faces
faces = face_cascade.detectMultiScale(gray, 1.3, 4)# Draw rectangle around the faces
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
    # Cropping Face
    crop_face = img[y:y + h, x:x + w]
    #Saving Cropped Face
    cv2.imwrite(str(w) + str(h) + '_faces.jpg', crop_face)
cv2.imshow('img', img)
cv2.imshow("imgcropped",crop_face)
cv2.waitKey()