自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="ez1sy"></cite><legend id="ez1sy"><track id="ez1sy"></track></legend>

<style id="ez1sy"></style>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

基于Python的圖像預(yù)處理完整指南

作者：小R 2024-01-03 16:01:23

開(kāi)發(fā) 前端機(jī)器學(xué)習(xí)

你是否曾在機(jī)器學(xué)習(xí)或計(jì)算機(jī)視覺(jué)項(xiàng)目中遇到過(guò)質(zhì)量較差的圖像問(wèn)題？圖像是許多AI系統(tǒng)的生命線，但并非所有圖像都是相同的。在訓(xùn)練模型或運(yùn)行算法之前，通常需要對(duì)圖像進(jìn)行一些預(yù)處理以獲得最佳結(jié)果。在Python中進(jìn)行圖像預(yù)處理將成為您的新伙伴。

你是否曾在機(jī)器學(xué)習(xí)或計(jì)算機(jī)視覺(jué)項(xiàng)目中遇到過(guò)質(zhì)量較差的圖像問(wèn)題？圖像是許多AI系統(tǒng)的生命線，但并非所有圖像都是相同的。在訓(xùn)練模型或運(yùn)行算法之前，通常需要對(duì)圖像進(jìn)行一些預(yù)處理以獲得最佳結(jié)果。在Python中進(jìn)行圖像預(yù)處理將成為您的新伙伴。

在本指南中，您將學(xué)到使用Python準(zhǔn)備圖像進(jìn)行分析的所有技巧和竅門。我們將涵蓋從調(diào)整大小和裁剪到減少噪聲和歸一化的所有內(nèi)容。到時(shí)候，您的圖像將準(zhǔn)備就緒，可以進(jìn)行詳細(xì)分析。借助諸如OpenCV、Pillow和scikit-image等庫(kù)的幫助，您將很快就能增強(qiáng)圖像。因此，請(qǐng)做好準(zhǔn)備，開(kāi)始深入了解Python中圖像預(yù)處理技術(shù)的完整指南！

什么是圖像預(yù)處理，為什么它很重要？

圖像預(yù)處理是將原始圖像數(shù)據(jù)處理為可用且有意義的格式的過(guò)程。它允許您消除不必要的失真并增強(qiáng)計(jì)算機(jī)視覺(jué)應(yīng)用程序所需的特定特性。預(yù)處理是在將圖像數(shù)據(jù)輸入機(jī)器學(xué)習(xí)模型之前準(zhǔn)備圖像數(shù)據(jù)的關(guān)鍵第一步。

圖像預(yù)處理中使用了幾種技術(shù)：

調(diào)整大?。簩D像調(diào)整為統(tǒng)一大小對(duì)于機(jī)器學(xué)習(xí)算法的正常運(yùn)行非常重要。我們可以使用OpenCV的resize()方法來(lái)調(diào)整圖像大小。
灰度化：將彩色圖像轉(zhuǎn)換為灰度圖像可以簡(jiǎn)化圖像數(shù)據(jù)，并減少某些算法的計(jì)算需求。cvtColor()方法可用于將RGB轉(zhuǎn)換為灰度。
降噪：可以應(yīng)用平滑、模糊和濾波技術(shù)來(lái)去除圖像中的不必要噪聲。GaussianBlur()和medianBlur()方法通常用于此目的。
歸一化：歸一化調(diào)整像素的強(qiáng)度值到所需范圍，通常在0到1之間。scikit-image中的Normalize()可用于此目的。
二值化：通過(guò)閾值處理將灰度圖像轉(zhuǎn)換為黑白圖像。在OpenCV中，使用threshold()方法對(duì)圖像進(jìn)行二值化。
對(duì)比度增強(qiáng)：可以使用直方圖均衡化來(lái)調(diào)整圖像的對(duì)比度。equalizeHist()方法可以增強(qiáng)圖像的對(duì)比度。

通過(guò)正確組合這些技術(shù)，您可以顯著改進(jìn)圖像數(shù)據(jù)并構(gòu)建更好的計(jì)算機(jī)視覺(jué)應(yīng)用程序。圖像預(yù)處理允許您將原始圖像精煉為適用于您要解決的問(wèn)題的格式。

使用Python庫(kù)加載和轉(zhuǎn)換圖像

要開(kāi)始使用Python進(jìn)行圖像處理，您需要加載和轉(zhuǎn)換圖像為庫(kù)可處理的格式。這方面最流行的兩個(gè)選項(xiàng)是OpenCV和Pillow。

使用OpenCV加載圖像：OpenCV可以加載PNG、JPG、TIFF和BMP等格式的圖像。您可以使用以下代碼加載圖像：

import cv2
image = cv2.imread('path/to/image.jpg')

這將把圖像加載為NumPy數(shù)組。由于圖像位于BGR色彩空間，您可能希望將其轉(zhuǎn)換為RGB。

使用Pillow加載圖像：Pillow是友好的PIL（Python Image Library）分支。它支持比OpenCV更多的格式，包括PSD、ICO和WEBP。您可以使用以下代碼加載圖像：

from PIL import Image
image = Image.open('path/to/image.jpg')

圖像將處于RGB色彩空間。

在色彩空間之間轉(zhuǎn)換：您可能需要在RGB、BGR、HSV和灰度等色彩空間之間進(jìn)行轉(zhuǎn)換。這可以使用OpenCV或Pillow完成。例如，要在OpenCV中將BGR轉(zhuǎn)換為灰度，可以使用：

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

或者要在Pillow中將RGB轉(zhuǎn)換為HSV，可以使用：

image = image.convert('HSV')

有了這些基礎(chǔ)技能，您就可以轉(zhuǎn)向更高級(jí)的技術(shù)，如調(diào)整大小、濾波、邊緣檢測(cè)等等。可能性是無(wú)限的！您將建立什么樣的圖像處理項(xiàng)目呢？

調(diào)整大小和裁剪圖像至標(biāo)準(zhǔn)尺寸

調(diào)整大小和裁剪圖像是圖像預(yù)處理的重要第一步。圖像大小各異，但機(jī)器學(xué)習(xí)算法通常需要標(biāo)準(zhǔn)大小。您需要將圖像調(diào)整大小和裁剪為方形尺寸，通常是224x224或256x256像素。在Python中，您可以使用OpenCV或Pillow庫(kù)進(jìn)行調(diào)整大小和裁剪。使用OpenCV，可以使用resize()函數(shù)。例如：

import cv2
img = cv2.imread('original.jpg')
resized = cv2.resize(img, (224, 224))

這將將圖像調(diào)整為224x224像素。要將圖像裁剪為正方形，可以計(jì)算中心正方形裁剪大小并使用OpenCV的crop()與中心坐標(biāo)。例如：

height, width, _ = img.shape
size = min(height, width)
x = (width size) // 2
y = (height size) // 2
cropped = img[y:y+size, x:x+size]

使用Pillow，您可以使用Image.open()和resize()函數(shù)。例如：

from PIL import Image
img = Image.open('original.jpg')
resized = img.resize((224, 224))

裁剪圖像時(shí)，使用img.crop()。例如：

width, height = img.size
size = min(width, height)
left = (width size) / 2
top = (height size) / 2
right = (width + size) / 2
bottom = (height + size) / 2
cropped = img.crop((left, top, right, bottom))

調(diào)整大小和裁剪圖像至標(biāo)準(zhǔn)尺寸是一個(gè)至關(guān)重要的第一步。這將使您的機(jī)器學(xué)習(xí)模型能夠有效地處理圖像，并提高結(jié)果的準(zhǔn)確性?；〞r(shí)間仔細(xì)調(diào)整大小和裁剪圖像，您的模型將感激不盡！

對(duì)像素值進(jìn)行歸一化以保持一致的亮度

在處理圖像數(shù)據(jù)時(shí)，將像素值歸一化以保持一致的亮度并提高對(duì)比度是很重要的。這使圖像更適合進(jìn)行分析，并使機(jī)器學(xué)習(xí)模型能夠獨(dú)立于光照條件學(xué)習(xí)模式。

像素值重新縮放：最常見(jiàn)的歸一化技術(shù)是將像素值重新縮放到0到1的范圍內(nèi)。這是通過(guò)將所有像素除以最大像素值（RGB圖像通常為255）來(lái)實(shí)現(xiàn)的。例如：

import cv2
img = cv2.imread('image.jpg')
normalized = img / 255.0

這將使所有像素在0到1之間縮放，其中0為黑色，1為白色。

直方圖均衡化：另一種有用的技術(shù)是直方圖均衡化。這將像素強(qiáng)度均勻分布到整個(gè)范圍以提高對(duì)比度?？梢允褂肙penCV的equalizeHist()方法應(yīng)用它：

eq_img = cv2.equalizeHist(img)

這對(duì)于像素值集中在一個(gè)狹窄范圍內(nèi)的低對(duì)比度圖像效果很好。對(duì)于一些算法，將像素值歸一化為零均值和單位方差是有用的。這可以通過(guò)減去均值并縮放到單位方差來(lái)實(shí)現(xiàn)：

mean, std = cv2.meanStdDev(img)
std_img = (img mean) / std

這將使圖像以零為中心，標(biāo)準(zhǔn)差為1。還有一些其他更復(fù)雜的歸一化技術(shù)，但這三種方法——重新縮放為0-1范圍、直方圖均衡化和標(biāo)準(zhǔn)化——涵蓋了基礎(chǔ)知識(shí)，將為大多數(shù)機(jī)器學(xué)習(xí)應(yīng)用準(zhǔn)備好圖像數(shù)據(jù)。確保對(duì)訓(xùn)練和測(cè)試數(shù)據(jù)都應(yīng)用相同的歸一化以獲得最佳結(jié)果。

應(yīng)用濾鏡以減少噪聲并銳化圖像

一旦您在Python中加載了圖像，就是時(shí)候開(kāi)始增強(qiáng)它們了。圖像濾鏡用于減少噪聲、增強(qiáng)細(xì)節(jié)，總體提高圖像在分析之前的質(zhì)量。以下是您需要了解的一些主要濾鏡：

高斯模糊：

高斯模糊濾鏡用于減少圖像中的細(xì)節(jié)和噪聲。它通過(guò)對(duì)每個(gè)像素及其周圍像素應(yīng)用高斯函數(shù)來(lái)“模糊”圖像。這有助于在進(jìn)行邊緣檢測(cè)或其他處理技術(shù)之前平滑邊緣和細(xì)節(jié)。

中值模糊：

中值模糊濾鏡用于從圖像中去除椒鹽噪聲。它通過(guò)用其鄰近像素的中值替換每個(gè)像素來(lái)工作。這有助于平滑孤立的嘈雜像素同時(shí)保留邊緣。

拉普拉斯濾波器：

拉普拉斯濾波器用于檢測(cè)圖像中的邊緣。它通過(guò)檢測(cè)強(qiáng)度變化較快的區(qū)域來(lái)工作。輸出將是突出顯示邊緣的圖像，可用于邊緣檢測(cè)。這有助于識(shí)別和提取圖像中的特征。

反向掩蔽：

反向掩蔽是一種用于增強(qiáng)圖像中細(xì)節(jié)和邊緣的技術(shù)。它通過(guò)從原始圖像中減去模糊版本來(lái)實(shí)現(xiàn)。這會(huì)放大邊緣和細(xì)節(jié)，使圖像看起來(lái)更清晰。反向掩蔽可用于在特征提取或?qū)ο髾z測(cè)之前增強(qiáng)細(xì)節(jié)。

雙邊濾波器：

雙邊濾波器在平滑圖像的同時(shí)保留邊緣。它通過(guò)考慮像素的空間接近度和顏色相似度來(lái)實(shí)現(xiàn)?？臻g上接近且顏色相似的像素被一起平滑，而在顏色上不同的像素則不被平滑。這導(dǎo)致一個(gè)平滑的圖像，其邊緣保持清晰。雙邊濾波器對(duì)于在邊緣檢測(cè)之前進(jìn)行噪聲降低很有用。

通過(guò)應(yīng)用這些濾鏡，您將獲得高質(zhì)量的增強(qiáng)圖像，準(zhǔn)備進(jìn)行深入分析和計(jì)算機(jī)視覺(jué)任務(wù)。嘗試一下，看看它們?nèi)绾胃倪M(jìn)您的圖像處理結(jié)果！

使用分割檢測(cè)和去除背景

在許多計(jì)算機(jī)視覺(jué)任務(wù)中，檢測(cè)和去除圖像背景是一個(gè)重要的預(yù)處理步驟。分割將前景主體與背景分離，使您得到一個(gè)只包含主體的清晰圖像。在Python中使用OpenCV和scikit-image執(zhí)行圖像分割的幾種常見(jiàn)方法有：

閾值化：

閾值化將灰度圖像轉(zhuǎn)換為二進(jìn)制圖像（黑白），通過(guò)選擇閾值值。比閾值值暗的像素變?yōu)楹谏?，比閾值值亮的像素變?yōu)榘咨?。這對(duì)于對(duì)比度高、光照均勻的圖像效果很好。您可以使用OpenCV的threshold()方法應(yīng)用閾值化。

邊緣檢測(cè)：

邊緣檢測(cè)找到圖像中對(duì)象的邊緣。通過(guò)連接邊緣，您可以孤立前景主體。Canny邊緣檢測(cè)器是scikit-image的canny()方法中實(shí)現(xiàn)的一種流行的算法。調(diào)整low_threshold和high_threshold參數(shù)以檢測(cè)邊緣。

區(qū)域生長(zhǎng)：

區(qū)域生長(zhǎng)從一組種子點(diǎn)開(kāi)始，向外擴(kuò)展以檢測(cè)圖像中的連續(xù)區(qū)域。您提供種子點(diǎn)，算法檢查相鄰像素以確定是否將其添加到區(qū)域。這將繼續(xù)，直到無(wú)法再添加更多像素。skimage.segmentation.region_growing()方法實(shí)現(xiàn)了這種技術(shù)。

分水嶺：

分水嶺算法將圖像視為地形圖，高強(qiáng)度像素表示山峰，而谷底表示區(qū)域之間的邊界。它從峰頂開(kāi)始洪水般地流下，當(dāng)不同區(qū)域相遇時(shí)創(chuàng)建隔離障礙。skimage.segmentation.watershed()方法執(zhí)行分水嶺分割。

通過(guò)嘗試這些技術(shù)，您可以在圖像中隔離出主體。分割是一個(gè)關(guān)鍵的第一步，使您能夠?qū)⒂?jì)算機(jī)視覺(jué)模型集中在圖像的最重要部分——前景主體上。

使用數(shù)據(jù)增強(qiáng)擴(kuò)展您的數(shù)據(jù)集

數(shù)據(jù)增強(qiáng)是一種通過(guò)從現(xiàn)有圖像生成新圖像來(lái)人為地?cái)U(kuò)展數(shù)據(jù)集大小的技術(shù)。這有助于減少過(guò)擬合并提高模型的泛化性能。圖像數(shù)據(jù)的一些常見(jiàn)增強(qiáng)技術(shù)包括：

翻轉(zhuǎn)和旋轉(zhuǎn)：

簡(jiǎn)單地翻轉(zhuǎn)（水平或垂直）或旋轉(zhuǎn)（90、180、270度）圖像可以生成新的數(shù)據(jù)點(diǎn)。例如，如果您有1,000張貓的圖像，對(duì)其進(jìn)行水平翻轉(zhuǎn)和垂直翻轉(zhuǎn)，再旋轉(zhuǎn)90度，可以得到4,000張總圖像（1,000原始+1,000水平翻轉(zhuǎn)+1,000垂直翻轉(zhuǎn)+1,000旋轉(zhuǎn)90度）。

裁剪：

將圖像裁剪到不同的大小和比例可從相同的原始圖像創(chuàng)建新圖像。這使您的模型能夠看到相同內(nèi)容的不同構(gòu)圖和組合。您可以創(chuàng)建不同尺寸的隨機(jī)裁剪，或者針對(duì)更具體的裁剪比例，如正方形。

顏色操作：

調(diào)整亮度、對(duì)比度、色調(diào)和飽和度是創(chuàng)建新的增強(qiáng)圖像的簡(jiǎn)單方法。例如，您可以隨機(jī)調(diào)整圖像的亮度和對(duì)比度，最多可達(dá)30%，以生成新的數(shù)據(jù)點(diǎn)。請(qǐng)注意不要過(guò)度扭曲圖像，否則可能會(huì)混淆您的模型。

圖像疊加：

將透明圖像、紋理或噪聲覆蓋到現(xiàn)有圖像上是另一種簡(jiǎn)單的增強(qiáng)技術(shù)。添加水印、標(biāo)志、污垢/劃痕或高斯噪聲等內(nèi)容可以創(chuàng)建原始數(shù)據(jù)的現(xiàn)實(shí)變化。從微妙的疊加開(kāi)始，看看您的模型的反應(yīng)如何。

結(jié)合技術(shù)：

為了在數(shù)據(jù)上取得最大的增加，您可以在相同的圖像上組合多種增強(qiáng)技術(shù)。例如，您可以翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪和調(diào)整圖像的顏色，從單個(gè)原始圖像生成許多新的數(shù)據(jù)點(diǎn)。但要注意不要過(guò)度增強(qiáng)，否則可能使圖像變得無(wú)法識(shí)別！

使用數(shù)據(jù)增強(qiáng)，您可以輕松地將圖像數(shù)據(jù)集的大小增加4倍、10倍或更多，而無(wú)需收集任何新圖像。這有助于抵制過(guò)擬合，并提高模型的準(zhǔn)確性，同時(shí)保持訓(xùn)練時(shí)間和成本不變。

選擇適合您應(yīng)用的預(yù)處理步驟

選擇適合您圖像分析項(xiàng)目的預(yù)處理技術(shù)取決于您的數(shù)據(jù)和目標(biāo)。一些常見(jiàn)的步驟包括：

調(diào)整大?。?/h4>
將圖像調(diào)整為一致的大小對(duì)于機(jī)器學(xué)習(xí)算法的正常運(yùn)行很重要。通常希望所有圖像具有相同的高度和寬度，通常是較小的尺寸，如28x28或64x64像素。OpenCV或Pillow庫(kù)中的resize()方法可以輕松地以編程方式執(zhí)行此操作。

顏色轉(zhuǎn)換：

將圖像轉(zhuǎn)換為灰度或黑白可以簡(jiǎn)化您的分析并減少噪音。OpenCV的cvtColor()方法將圖像從RGB轉(zhuǎn)換為灰度。對(duì)于黑白圖像，使用閾值化。

降噪：

諸如高斯模糊、中值模糊和雙邊濾波等技術(shù)可以減少噪音并平滑圖像。OpenCV的GaussianBlur()、medianBlur()和bilateralFilter()方法應(yīng)用這些濾鏡。

歸一化：

將像素值歸一化到0到1或-1到1的標(biāo)準(zhǔn)范圍有助于算法更好地工作。您可以使用scikit-image中的normalize()方法對(duì)圖像進(jìn)行歸一化。

對(duì)比度增強(qiáng)：

對(duì)于低對(duì)比度圖像，直方圖均衡化可以提高對(duì)比度。OpenCV的equalizeHist()方法執(zhí)行此任務(wù)。

邊緣檢測(cè)：

找到圖像中的邊緣或輪廓對(duì)于許多計(jì)算機(jī)視覺(jué)任務(wù)都很有用。OpenCV的Canny()方法中的Canny邊緣檢測(cè)器是一個(gè)受歡迎的選擇。

關(guān)鍵是選擇適合您特定需求的技術(shù)。從基本步驟如調(diào)整大小開(kāi)始，然后嘗試不同的方法以改進(jìn)質(zhì)量，并查看哪些方法優(yōu)化了您的結(jié)果。通過(guò)一些實(shí)驗(yàn)，您將找到理想的預(yù)處理工作流程。

圖像預(yù)處理技術(shù)FAQ

現(xiàn)在您已經(jīng)對(duì)Python中的各種圖像預(yù)處理技術(shù)有了很好的了解，可能還有一些懸而未決的問(wèn)題。以下是關(guān)于圖像預(yù)處理最常見(jiàn)的問(wèn)題及其答案：

Python支持哪些圖像格式？

Python通過(guò)OpenCV和Pillow等庫(kù)支持各種圖像格式。一些主要的格式包括：

? JPEG — 常見(jiàn)的有損圖像格式

? PNG — 無(wú)損圖像格式，適用于帶有透明度的圖像

? TIFF — 無(wú)損圖像格式，適用于高顏色深度圖像

? BMP — 無(wú)壓縮的光柵圖像格式

何時(shí)應(yīng)該調(diào)整圖像大小？

應(yīng)調(diào)整圖像大小的情況包括：

? 圖像太大，以至于無(wú)法有效處理。減小尺寸可以加快處理速度。

? 圖像需要匹配機(jī)器學(xué)習(xí)模型的輸入大小。

? 圖像需要在屏幕或網(wǎng)頁(yè)上以特定大小顯示。

有哪些常見(jiàn)的降噪技術(shù)？

一些流行的降噪技術(shù)包括：

? 高斯模糊 — 使用高斯濾波器對(duì)圖像進(jìn)行模糊，減少高頻噪聲。

? 中值模糊 — 用鄰近像素的中值替換每個(gè)像素。對(duì)于去除椒鹽噪聲非常有效。

? 雙邊濾波器 — 在平滑圖像的同時(shí)保留邊緣。它可以去除噪聲同時(shí)保持清晰的邊緣。

OpenCV支持哪些顏色空間，如何在它們之間進(jìn)行轉(zhuǎn)換？

OpenCV支持RGB、HSV、LAB和灰度顏色空間。您可以使用cvtColor函數(shù)在這些顏色空間之間進(jìn)行轉(zhuǎn)換。例如：

將RGB轉(zhuǎn)換為灰度：

gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

將RGB轉(zhuǎn)換為HSV：

hsv = cv2.cvtColor(img, cv2.COLOR_RGB2HSV)

將RGB轉(zhuǎn)換為L(zhǎng)AB：

lab = cv2.cvtColor(img, cv2.COLOR_RGB2LAB)

將圖像轉(zhuǎn)換為不同的顏色空間對(duì)于某些計(jì)算機(jī)視覺(jué)任務(wù)（如閾值處理、邊緣檢測(cè)和目標(biāo)跟蹤）非常有用。

結(jié)論

這就是您所需要的，一個(gè)在Python中準(zhǔn)備圖像進(jìn)行分析的完整指南。借助OpenCV和其他庫(kù)的強(qiáng)大功能，您現(xiàn)在擁有調(diào)整大小、增強(qiáng)、過(guò)濾和轉(zhuǎn)換圖像的所有工具。隨意嘗試不同的技術(shù)，調(diào)整參數(shù)，找到最適合您特定數(shù)據(jù)集和計(jì)算機(jī)視覺(jué)任務(wù)的方法。圖像預(yù)處理可能不是構(gòu)建AI系統(tǒng)中最引人注目的部分，但它絕對(duì)是至關(guān)重要的。

責(zé)任編輯：華軒來(lái)源：深度學(xué)習(xí)愛(ài)好者

機(jī)器學(xué)習(xí)Python

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)