幾行代碼,實(shí)現(xiàn)Python捕獲、播放和保存攝像頭視頻!
前幾天有個(gè)讀者在粉絲群里面提了一個(gè)問(wèn)題:
Python 怎樣提高視頻清晰度和對(duì)比度?
我之前沒(méi)有涉及到使用 Python 操作視頻這一方面,所以當(dāng)時(shí)很抱歉地跟讀者朋友說(shuō)暫未涉及。
這兩天想了下,感覺(jué)應(yīng)該補(bǔ)一下這一塊的內(nèi)容,一方面是增加自己涉獵的廣度,另一方面也可以給粉絲答疑解惑。
今天先分享一下 Python 操作視頻最基本的操作,包括讀取和播放視頻和保存視頻。
讀取視頻
要捕獲視頻,你需要?jiǎng)?chuàng)建一個(gè) VideoCapture 對(duì)象。它的參數(shù)可以是設(shè)備索引或視頻文件的名稱。所以,我們讀取視頻有兩種方式,分別是從相機(jī)中讀取視頻和從文件中讀取視頻。
從相機(jī)中讀取視頻
對(duì)于有攝像頭的設(shè)備,例如帶攝像頭的筆記本電腦,我們可以直接調(diào)起電腦的攝像頭,讀取攝像頭的視頻流。
import cv2 as cv
cap = cv.VideoCapture(0)
if not cap.isOpened():
print("Cannot open camera")
exit()
while True:
# 逐幀捕獲
ret, frame = cap.read()
# 如果正確讀取幀,ret為True
if not ret:
break
# 顯示結(jié)果幀
cv.imshow('frame', frame)
if cv.waitKey(1) == ord('q'):
break
# 完成所有操作后,釋放捕獲器
cap.release()
cv.destroyAllWindows()
這里我向 VideoCapture 對(duì)象傳入了參數(shù) 0,表示設(shè)備索引,設(shè)備索引就是指定哪個(gè)攝像頭的數(shù)字。正常情況下,一個(gè)攝像頭會(huì)被連接(就像我的情況一樣)。所以我簡(jiǎn)單地傳0。你可以通過(guò)傳遞1來(lái)選擇第二個(gè)相機(jī),以此類推。
cap.isOpened() 用來(lái)判斷是否捕獲到視頻。
cap.read() 返回布爾值(True/ False)。如果正確讀取了幀,它將為True。因此,你可以通過(guò)檢查此返回值來(lái)檢查視頻的結(jié)尾。
cv.imshow 方法用來(lái)顯示視頻的幀。我們播放視頻的原理就是逐幀播放。
在最后,不要忘記通過(guò) cap.release() 釋放俘虜。
運(yùn)行這段代碼,你就可以看到一個(gè)彈窗實(shí)時(shí)地播放你電腦攝像頭中的圖像了。
從文件中播放視頻
與從相機(jī)捕獲相同,只是用視頻文件名更改攝像機(jī)索引。
另外,在顯示視頻時(shí),可以通過(guò) cv.waitKey() 來(lái)控制視頻播放的速度。如果設(shè)置太小,則視頻將非???,相當(dāng)于倍速播放;而如果太大,則視頻將變得很慢,相當(dāng)于延遲播放。正常情況下25毫秒就可以了。
import cv2 as cv
cap = cv.VideoCapture('video.mp4')
while cap.isOpened():
ret, frame = cap.read()
# 如果正確讀取幀,ret為True
if not ret:
break
cv.imshow('frame', frame)
if cv.waitKey(1) == ord('q'):
break
cap.release()
cv.destroyAllWindows()
運(yùn)行這段代碼,你就可以看到一個(gè)彈窗播放你選擇的視頻文件了。
保存視頻
從相機(jī)讀取視頻,我們可以將視頻保存到本地。我們捕捉一個(gè)視頻,一幀一幀地處理,如果我們想要保存這個(gè)視頻,非常簡(jiǎn)單,只需使用 cv.VideoWriter()。
cv.VideoWriter() 有5個(gè)參數(shù):
- 參數(shù)1:輸出文件名,例如: output.mp4。
- 參數(shù)2:FourCC 代碼,F(xiàn)ourCC 是用于指定視頻編解碼器的4字節(jié)代碼。
- 參數(shù)3:幀率的數(shù)量。
- 參數(shù)4:幀大小。
- 參數(shù)5:顏色標(biāo)志。如果為 True,正常顏色輸出,否則就是灰色圖像輸出。
關(guān)于 FourCC 與視頻格式的對(duì)照關(guān)系,我列舉了一些常見(jiàn)的格式:
cv2.VideoWriter_fourcc(‘P’,‘I’,‘M’,‘1’) = MPEG-1 codec cv2.VideoWriter_fourcc(‘M’,‘J’,‘P’,‘G’) = motion-jpeg codec --> mp4v cv2.VideoWriter_fourcc(‘M’, ‘P’, ‘4’, ‘2’) = MPEG-4.2 codec cv2.VideoWriter_fourcc(‘D’, ‘I’, ‘V’, ‘3’) = MPEG-4.3 codec cv2.VideoWriter_fourcc(‘D’, ‘I’, ‘V’, ‘X’) = MPEG-4 codec --> avi cv2.VideoWriter_fourcc(‘U’, ‘2’, ‘6’, ‘3’) = H263 codec cv2.VideoWriter_fourcc(‘I’, ‘2’, ‘6’, ‘3’) = H263I codec cv2.VideoWriter_fourcc(‘F’, ‘L’, ‘V’, ‘1’) = FLV1 codec
保存視頻的代碼:
import cv2 as cv
cap = cv.VideoCapture(0)
# 定義編解碼器并創(chuàng)建VideoWriter對(duì)象
fourcc = cv.VideoWriter_fourcc(*'MJPG')
out = cv.VideoWriter('output.mp4', fourcc, 20.0, (640, 480))
while cap.isOpened():
ret, frame = cap.read()
if not ret:
break
frame = cv.flip(frame, 1)
# 寫翻轉(zhuǎn)的框架
out.write(frame)
cv.imshow('frame', frame)
if cv.waitKey(1) == ord('q'):
break
# 完成工作后釋放所有內(nèi)容
cap.release()
out.release()
cv.destroyAllWindows()
運(yùn)行這段代碼,你就可以在代碼目錄下找到一個(gè) output.mp4 的視頻文件了。
上面幾段代碼中,如果想要退出視頻操作,敲擊鍵盤的 q 就可以。
總結(jié)
以上就是今天要介紹的內(nèi)容了,使用 python-opencv 來(lái)操作視頻還是比較簡(jiǎn)單的。當(dāng)然,你也可以在讀取或者保存視頻時(shí)對(duì)視頻進(jìn)行一些處理,這個(gè)我們后續(xù)再發(fā)文介紹。