OpenCV 常用的七個(gè)示例:從讀取到人臉檢測(cè)(Python版)
OpenCV
OpenCV是計(jì)算機(jī)視覺領(lǐng)域最流行的庫(kù)之一。它最初是用 C 和 C++ 編寫的。現(xiàn)在也可以在 Python 中使用。它最初是由英特爾開發(fā)的。該庫(kù)是一個(gè)跨平臺(tái)的開源庫(kù)。免費(fèi)使用。OpenCV 庫(kù)是一個(gè)高度優(yōu)化的庫(kù),其主要重點(diǎn)是實(shí)時(shí)應(yīng)用程序。
OpenCV 庫(kù)是2500多個(gè)優(yōu)化算法的組合。它可以用來(lái)檢測(cè)和識(shí)別不同的人臉,在圖像中或?qū)崟r(shí)識(shí)別物體,使用視頻和網(wǎng)絡(luò)攝像頭分類不同的人類行為,跟蹤攝像機(jī)的運(yùn)動(dòng),跟蹤像汽車、人類等移動(dòng)物體,實(shí)時(shí)計(jì)數(shù)物體,將圖像拼接在一起產(chǎn)生高分辨率圖像,從圖像數(shù)據(jù)庫(kù)中找到類似的圖像,從使用閃光燈拍攝的圖像中去除紅眼,提高圖像質(zhì)量,跟蹤眼球運(yùn)動(dòng),跟蹤人臉等
它擁有大約4.7萬(wàn)活躍用戶社區(qū),估計(jì)下載量超過1800萬(wàn)次。許多大公司,如谷歌,亞馬遜,特斯拉,微軟,本田等使用OpenCV,使他們的產(chǎn)品更好,更智能。
先決條件
在開始編寫代碼之前,我們需要在我們的設(shè)備上安裝 OpenCV 。如果你是專業(yè)的編程人員并且知道每一個(gè) IDE,那么去 Pycharm 并且在設(shè)置中從它的包管理器中安裝 OpenCV-python。
如果您是初學(xué)者或中級(jí)程序員,或者只是想關(guān)注該博客,那么我們將使用代碼編輯器而不是IDE。只需轉(zhuǎn)到Visual Studio Code網(wǎng)站并根據(jù)您的操作系統(tǒng)下載最新版本即可?,F(xiàn)在,我們將創(chuàng)建一個(gè)虛擬環(huán)境,在其中將安裝 OpenCV。打開終端,然后使用cd定位到桌面。使用名為opencv的mkdir創(chuàng)建一個(gè)文件夾然后在以下命令中運(yùn)行。
python -m venv env
現(xiàn)在使用 env\scripts\activate 命令激活環(huán)境,你會(huì)看到在 C:\Users\username\Desktop\opencv 前出現(xiàn)一個(gè)帶小括號(hào)的 (env)?,F(xiàn)在只需使用 pip 安裝 OpenCV。
pip install opencv-python
我們將在這個(gè)博客中涵蓋7個(gè)主題:
- 讀、寫和展示一個(gè)圖像
- 讀取視頻與集成網(wǎng)絡(luò)攝像頭
- 縮放和裁剪圖像
- 使用函數(shù)的基本圖像濾波器
- 繪制不同的形狀
- 在圖像上寫文字
- 檢測(cè)和裁剪人臉
1.讀、寫和展示一個(gè)圖像
為了使用 OpenCV 讀取圖像,我們使用函數(shù) imread() ,為了顯示圖像,我們使用函數(shù) imshow() ,為了寫入圖像,我們使用函數(shù) imwrite()。讓我們看看每一個(gè)的語(yǔ)法。
imread():
img = cv2.imread("PATH_TO_IMAGE.jpg/png")
Example
img = imread("images/dog0.jpg")
imshow():
cv2.imshow("WINDOW NAME",IMG_VAR)
Example
imshow("Dog Image",img)
imwrite():
cv2.imwrite(FILENAME, IMAGE)
filename: A string representing the file name. The filename must include image format like .jpg, .png, etc.
image: It is the image that is to be saved.
Example
cv2.imwrite('images/img',img)
.讀取視頻與集成網(wǎng)絡(luò)攝像頭
讀取視頻文件與讀取 OpenCV 中的圖像文件非常相似。不同之處在于我們使用 cv2.videocapture()
語(yǔ)法:
video = cv2.VideoCapture("FILEPATH.mp4")
Example
video = cv2.VideoCapture("video/dog/dog.mp4")
視頻是許多幀圖像在一起的集合,每一幀都是一個(gè)圖像。要使用 OpenCV 觀看視頻,我們只需要使用 while 循環(huán)顯示視頻的每一幀。
while True:
success , img = cap.read()
cv2.imshow("Video",img)
if cv2.waitKey(1) & 0xff==ord('q'):##key 'q' will break the loop
break
為了與網(wǎng)絡(luò)攝像頭集成,我們需要傳遞網(wǎng)絡(luò)攝像頭的端口值,而不是路徑到視頻。如果你使用的是筆記本電腦,沒有連接任何外部攝像頭,那么簡(jiǎn)單地傳遞0,如果你連接了任何外部攝像頭,那么傳遞一個(gè)攝像頭端口值。
cap = cv2.VideoCapture(0)
cap.set(3,640) ## Frame width
cap.set(4,480) ## Frame Height
cap.set(10,100) ## Brightness
while True:
success, img = cap.read()
cv2.imshow("Video",img)
if cv2.waitKey(1) & 0xff == ord('q'):
break
3.縮放和裁剪圖像
(1) 縮放圖像
縮放是一個(gè)改變圖像形狀的過程。在 Opencv,我們可以使用 resize 函數(shù)來(lái)調(diào)整圖像的形狀。
語(yǔ)法:
cv2.resize(IMG,(WIDTH,HEIGHT))
IMG: image which we want to resize
WIDTH: new width of the resize image
HEIGHT: new height of the resize image
Example
cv2.resize(img,(224,224))
要調(diào)整圖像的大小,我們首先需要知道圖像的形狀。我們可以利用 shape 找到圖像的形狀,然后根據(jù)當(dāng)前圖像的形狀,我們可以增大或減小圖像的大小。讓我們舉個(gè)例子來(lái)看看。
import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
imgResize = cv2.resize(img,(224,224)) ##Decrease size
imgResize2 = cv2.resize(img,(1024,1024)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)
如果您不想把圖像寬度和高度寫死,您也可以根據(jù)現(xiàn)有的形狀,然后根據(jù)比例改變圖像的寬度和高度。
import cv2
img = cv2.imread("images/img0.jpg") ##Choose any image
print(img.shape)
shape = img.shape
imgResize = cv2.resize(img,(shape[0]//2,shape[1]//2))##Decrease size
imgResize2 = cv2.resize(img,(shape[0]*2,shape[1]*2)) ##Increase size
cv2.imshow("Image",img)
cv2.imshow("Image Resize",imgResize)
cv2.imshow("Image Increase size",imgResize2)
print(imgResize.shape)
cv2.waitKey(0)
(2) 裁剪圖像
裁剪是獲取部分圖像的過程。在 OpenCV 中,我們可以通過定義裁剪后的矩形坐標(biāo)來(lái)執(zhí)行裁剪。
語(yǔ)法:
imgCropped = img[y1:y2, x1:x2](x1,y1): top-left vertex
(x2,y2): bottom-right vertex
Example
imgCropped = img[0:100,200:200]
使用裁剪方法,讓我們嘗試從圖像中提取 Monalisa 的臉。
import cv2
img = cv2.imread("images/img0.jpg")
imgCropped = img[50:250,120:330]
cv2.imshow("Image cropped",imgCropped)
cv2.imshow("Image",img)
cv2.waitKey(0)
您還可以使用繪畫模式來(lái)查找(x1,y1)、(x2,y2)的正確坐標(biāo)。
這里有個(gè)小任務(wù):
- 任務(wù):右鍵單擊圖像并保存它; 嘗試從圖像中獲取國(guó)王卡。
- 提示:使用繪畫模式找到正確的坐標(biāo),最后,使用調(diào)整大小,以增加裁剪圖像的大小。
4.使用函數(shù)的基本圖像濾波器
我們可以在圖像上使用許多基本的濾波器,比如將圖片轉(zhuǎn)換成灰度、模糊等等。
(1) 從 Img 到 gray
為了將圖像從彩色圖像轉(zhuǎn)換為灰度圖像,我們可以使用函數(shù) cv2.cvtColor,在這里我們傳遞 cv2.COLOR_BGR2GRAY 作為參數(shù)。
語(yǔ)法:
imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2GRAY)
Example
imgGray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
(2) 從 Img 到 HSV
為了將圖像轉(zhuǎn)換為 HSV 顏色空間,我們可以使用函數(shù) cv2.cvtColor,這里我們傳遞 cv2.COLOR_BGR2HSV 作為參數(shù)。它主要用于目標(biāo)跟蹤。
語(yǔ)法:
imgGray = cv2.cvtColor(IMG,cv2.CODE)
IMG: Original image
CODE: Conversion code for Gray(COLOR_BGR2HSV)
Example
imgHsv = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)
(3) 模糊圖像
模糊用于去除圖像中的噪聲,也稱為平滑。它是對(duì)圖像應(yīng)用低通濾波器的過程。在 OpenCV 中對(duì)圖像進(jìn)行模糊,我們常用 GaussianBlur。
語(yǔ)法:
imgBlur = cv2.GaussianBlur(img,(sigmaX,sigmaY),kernalSize)
kernalsize ? A Size object representing the size of the kernel.
sigmaX ? A variable representing the Gaussian kernel standard deviation in X direction.
sigmaY - same as sigmaX
Exmaple
imgBlur = cv2.GaussianBlur(img,(3,3),0)
(4) 邊緣檢測(cè)
在 OpenCV 中,我們使用 Canny算子來(lái)檢測(cè)圖像中的邊緣。也有不同的邊緣檢測(cè)器,但最著名的是 Canny算子。Canny算子邊緣檢測(cè)是一種邊緣檢測(cè)算子,它使用多級(jí)算法來(lái)檢測(cè)圖像中的大范圍邊緣,是由 John F. Canny 在1986年提出的。
語(yǔ)法:
imgCanny = cv2.Canny(img,threshold1,threshold2)
threshold1,threshold2:Different values of threshold different for every images
Example
imgCanny = cv2.Canny(img,100,150)
(5) 膨脹
膨脹被用來(lái)增加圖像中邊緣的大小。首先,我們定義了奇數(shù)(5,5)的核矩陣大小。然后使用內(nèi)核,我們對(duì)圖像執(zhí)行膨脹。下面我們對(duì) Canny 算子的輸出圖像進(jìn)行了膨脹。
語(yǔ)法:
kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.dilate(imgCanny,kernel,iterations=1) ##DIALATION
(6) 腐蝕
侵蝕與膨脹正好相反。該算法用于減小圖像中邊緣的大小。首先,我們定義了奇數(shù)(5,5)的核矩陣大小。然后使用內(nèi)核,我們對(duì)圖像執(zhí)行腐蝕。下面我們對(duì) Canny 算子的輸出圖像進(jìn)行腐蝕處理。
kernel = np.ones((5,5),np.uint8) ## DEFINING KERNEL OF 5x5
imgDialation = cv2.erode(imgCanny,kernel,iterations=1) ##EROSION
現(xiàn)在,在同一個(gè)程序中使用上述基本函數(shù)處理 Monalisa 圖像。
5.繪制不同的形狀
我們可以使用 OpenCV 繪制不同的形狀,像矩形,圓形,線等。
(1) 長(zhǎng)方形:
要在圖像上繪制一個(gè)矩形,我們使用 cv2.rectangle 函數(shù)。在函數(shù)中,我們將寬度、高度、 x、 y、 RGB 中的顏色、深度作為參數(shù)傳遞。
語(yǔ)法:
cv2.rectangle(img,(w,h),(x,y),(R,G,B),THICKNESS)
w: width
h: height
x: distance from x axis
y: distance from y axis
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.rectangle(img,(100,300),(200,300),(255,0,255),2)
(2) 圓形:
為了繪制一個(gè)圓形,我們使用 cv2.circle 函數(shù)。我們傳遞 x,y,半徑大小,RGB 顏色,深度作為參數(shù)。
語(yǔ)法:
cv2.circle(img,(x,y),radius,(R,G,B),THICKNESS)
x: distance from x axis
y: distance from y axis
radius: size of radius(integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.circle(img,(200,130),90,(255,255,0),2)
(3) 直線:
要繪制一條直線,我們使用 cv2.line 函數(shù)傳遞起始點(diǎn)(x1,y1)、終點(diǎn)(x2,y2)、 RGB 格式的顏色、深度作為參數(shù)。
語(yǔ)法:
cv2.line(img,(x1,y1),(x2,y2),(R,G,B),THICKNESS)x1,y1: start point of line (integer)
x2,y2: end point of line (integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.line(img,(110,260),(300,260),(0,255,0),3)
6.在圖像上寫文字
在 OpenCV 中,我們有一個(gè)函數(shù) cv2.puttext,用于在特定位置在圖像上寫入文本。它以圖像、文本、 x、 y、顏色、字體、字號(hào)、粗細(xì)作為輸入?yún)?shù)。
語(yǔ)法:
cv2.putText(img,text,(x,y),FONT,FONT_SCALE,(R,G,B),THICKNESS)
img: image to put text on
text: text to put on image
X: text distance from X axis
Y: text distance from Y axis
FONT: Type of FONT (ALL FONT TYPES)
FONT_SCALE: Scale of Font(Integer)
R,G,B: color in RGB form (255,255,0)
THICKNESS: thickness of rectangel(integer)Example
cv2.putText(img,"HELLO",(120,250),cv2.FONT_HERSHEY_COMPLEX,1,(255,255,255),2)
7.檢測(cè)和裁剪人臉
人臉檢測(cè)在人臉識(shí)別系統(tǒng)中非常有用。在 OpenCV 中,我們有許多預(yù)先訓(xùn)練的 haar 級(jí)聯(lián)分類器可用于不同的任務(wù)。以下網(wǎng)址可以查看 OpenCV GitHub 上的分類器列表:https://github.com/opencv/opencv/tree/master/data/haarca
scades。
我們使用 haarcascade_frontalface_default.xml 分類器來(lái)檢測(cè)圖像中的人臉。它將返回圖像的四個(gè)坐標(biāo)(w,h,x,y)。使用這些坐標(biāo),我們要在臉上畫一個(gè)矩形,然后使用相同的坐標(biāo),繼續(xù)裁剪人臉。最后使用 imwrite,把裁剪后的圖像保存到目錄中。
import cv2
# Load the cascade
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# Read the input image
img = cv2.imread('images/img0.jpg')# Convert into grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Detect faces
faces = face_cascade.detectMultiScale(gray, 1.3, 4)# Draw rectangle around the faces
for (x, y, w, h) in faces:
cv2.rectangle(img, (x, y), (x+w, y+h), (255, 0, 0), 2)
# Cropping Face
crop_face = img[y:y + h, x:x + w]
#Saving Cropped Face
cv2.imwrite(str(w) + str(h) + '_faces.jpg', crop_face)
cv2.imshow('img', img)
cv2.imshow("imgcropped",crop_face)
cv2.waitKey()