OpenCV 也可以檢測(cè)、跟蹤移動(dòng)物體
想象一下,你用手機(jī)拍攝視頻,按下一個(gè)按鈕,相機(jī)就開始錄制視頻。在幕后,手機(jī)相機(jī)非??焖俚夭蹲綀D像,當(dāng)你觀看視頻時(shí),你看到的是一幅接一幅的圖像,但你沒注意到,因?yàn)檫@個(gè)過程發(fā)生得非常快。一秒鐘內(nèi),你的手機(jī)顯示了30多幅圖像。如果你比較這些圖像并找到它們之間的差異,你就可以檢測(cè)到移動(dòng)物體,這正是背景減除器的工作原理。
使用背景減除器檢測(cè)和追蹤鳥類
在本文中,我將解釋背景減除器的工作原理、不同類型的背景減除器以及如何使用 OpenCV 在 Python 中使用它們。
檢測(cè)移動(dòng)物體的方法
1. 基本運(yùn)動(dòng)檢測(cè)
第一種方法也是最直觀的方法是計(jì)算幀與幀之間,或一個(gè)被認(rèn)為是“背景”的幀和所有其他幀之間的差異。這個(gè)想法在最高層次上相當(dāng)簡(jiǎn)單:首先,保存第一幀。保存后,將其與新幀進(jìn)行比較。通過逐像素比較,簡(jiǎn)單地從兩幅圖像中減去。通過這種方式,你將獲得移動(dòng)物體。
這種技術(shù)實(shí)現(xiàn)起來相當(dāng)快,但并不適合應(yīng)用,因?yàn)槟阈枰獙⒛J(rèn)幀設(shè)置為背景,而背景在你的應(yīng)用中可能不會(huì)保持恒定。
想象一下,你正在檢測(cè)汽車。設(shè)置一個(gè)默認(rèn)背景并不會(huì)有效,因?yàn)槠囋诓粩嘁苿?dòng),一切都在變化。光線在變化,物體在移動(dòng)。例如,你將第一幀設(shè)置為背景圖像,背景圖像中有3輛汽車,但僅僅一秒鐘后,它們就不會(huì)再存在,因?yàn)樗鼈冊(cè)谝苿?dòng)。因此,背景圖像變得不準(zhǔn)確,因?yàn)橐磺卸荚谘杆僮兓?。因此,算法不?huì)很準(zhǔn)確,特別是在環(huán)境快速變化的情況下。
看看圖像;算法是工作的,但不是很準(zhǔn)確??纯醋筮叺膱D像;有一些無意義的區(qū)域。那是因?yàn)樵谝曨l中,背景幾乎每秒鐘都在變化,但在算法中,背景是恒定的。
左邊的圖像顯示了默認(rèn)背景幀和當(dāng)前幀之間的差異,而右邊的圖像顯示了帶有邊界框的當(dāng)前幀
我想你已經(jīng)理解了基本運(yùn)動(dòng)檢測(cè)的主要思想。根據(jù)你的期望,它可能有用。如果你不期望高精度,你可以考慮使用它。為了解決我上面討論的問題,背景減除器開始發(fā)揮作用?,F(xiàn)在是時(shí)候談?wù)劚尘皽p除和減除器了。
2. 背景減除
背景減除是計(jì)算機(jī)視覺中的一項(xiàng)基本技術(shù),用于在視頻流中將移動(dòng)物體從背景中隔離出來。通過將視頻中的每一幀與背景模型進(jìn)行比較,可以識(shí)別出顯著差異的區(qū)域作為潛在的前景物體。然后,這個(gè)前景信息可以用于各種目的,包括目標(biāo)檢測(cè)和追蹤。背景減除通常是許多目標(biāo)追蹤和檢測(cè)算法中的關(guān)鍵步驟。
在背景減除中,背景圖像不是恒定的;由于光線變化、物體移動(dòng)和場(chǎng)景動(dòng)態(tài)等各種因素,它會(huì)隨著時(shí)間變化。背景減除算法的目標(biāo)是適應(yīng)性地建模和更新背景,以在變化的環(huán)境中準(zhǔn)確檢測(cè)前景物體。通過這種方式,背景問題得到了解決。
在 OpenCV 中,背景減除器可以檢測(cè)陰影,并且通過閾值處理,它們可以從減除器檢測(cè)到的物體中排除陰影。這確實(shí)是準(zhǔn)確檢測(cè)物體的一個(gè)非常重要的特性,因?yàn)槲醋R(shí)別的陰影區(qū)域可能被減除器錯(cuò)誤地解釋為單獨(dú)的移動(dòng)物體,這是不可取的。
使用 OpenCV 中的背景減除器
Opencv 有幾種不同的背景減除器。我將使用其中兩個(gè)最著名的減除器:
- K-最近鄰 (KNN)
- 高斯混合 (MOG2)
我將只解釋 MOG2 如何進(jìn)行背景減除,但我將使用這兩種方法來檢測(cè)和追蹤視頻。
下面是 MOG2 如何進(jìn)行背景減除的:
- 初始化:初始化 K 個(gè)高斯分布的混合,以模擬場(chǎng)景的背景。每個(gè)像素的背景模型由高斯混合表示,K 是一個(gè)預(yù)定義的參數(shù)。
- 適應(yīng):隨著時(shí)間的推移,更新每個(gè)像素的背景模型,調(diào)整高斯分布的參數(shù)以適應(yīng)場(chǎng)景的變化。
- 前景檢測(cè):根據(jù)高斯混合模型計(jì)算每個(gè)像素屬于背景的概率。概率低的像素被分類為前景。
- 更新背景:對(duì)于被分類為背景的像素,更新高斯分布以納入新的觀察結(jié)果并適應(yīng)場(chǎng)景的變化
- 后處理:應(yīng)用形態(tài)學(xué)操作(腐蝕、膨脹..)或其他技術(shù)來細(xì)化前景掩碼并去除噪聲。
代碼 / 檢測(cè)和追蹤移動(dòng)物體
在代碼中,我已經(jīng)解釋了大部分過程,但理解它的最佳方式是復(fù)制代碼并使用 cv2.imshow 函數(shù)觀察每個(gè)操作后的每一幀。
Subtraction
Threshold
Dilation
# import libraries
import cv2
import numpy as np
# KNN
KNN_subtractor = cv2.createBackgroundSubtractorKNN(detectShadows = True) # detectShadows=True : exclude shadow areas from the objects you detected
# MOG2
MOG2_subtractor = cv2.createBackgroundSubtractorMOG2(detectShadows = True) # exclude shadow areas from the objects you detected
# choose your subtractor
bg_subtractor=MOG2_subtractor
camera = cv2.VideoCapture("resources/run.mp4")
while True:
ret, frame = camera.read()
# Every frame is used both for calculating the foreground mask and for updating the background.
foreground_mask = bg_subtractor.apply(frame)
# threshold if it is bigger than 240 pixel is equal to 255 if smaller pixel is equal to 0
# create binary image , it contains only white and black pixels
ret , treshold = cv2.threshold(foreground_mask.copy(), 120, 255,cv2.THRESH_BINARY)
# dilation expands or thickens regions of interest in an image.
dilated = cv2.dilate(treshold,cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (3,3)),iterations = 2)
# find contours
contours, hier = cv2.findContours(dilated,cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# check every contour if are exceed certain value draw bounding boxes
for contour in contours:
# if area exceed certain value then draw bounding boxes
if cv2.contourArea(contour) > 50:
(x,y,w,h) = cv2.boundingRect(contour)
cv2.rectangle(frame, (x,y), (x+w, y+h), (255, 255, 0), 2)
cv2.imshow("Subtractor", foreground_mask)
cv2.imshow("threshold", treshold)
cv2.imshow("detection", frame)
if cv2.waitKey(30) & 0xff == 27:
break
camera.release()
cv2.destroyAllWindows()