自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="bnvrk"></style>

<u id="bnvrk"><form id="bnvrk"></form></u>

<cite id="bnvrk"></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

基于Python的圖像預(yù)處理完整指南

作者：小R 2024-05-15 15:27:39

在本文中，您將學(xué)到使用Python準(zhǔn)備圖像進行分析的所有技巧和竅門。我們將涵蓋從調(diào)整大小和裁剪到減少噪聲和歸一化的所有內(nèi)容。

你是否曾在機器學(xué)習(xí)或計算機視覺項目中遇到過質(zhì)量較差的圖像問題？圖像是許多AI系統(tǒng)的生命線，但并非所有圖像都是相同的。在訓(xùn)練模型或運行算法之前，通常需要對圖像進行一些預(yù)處理以獲得最佳結(jié)果。在Python中進行圖像預(yù)處理將成為您的新伙伴。

在本指南中，您將學(xué)到使用Python準(zhǔn)備圖像進行分析的所有技巧和竅門。我們將涵蓋從調(diào)整大小和裁剪到減少噪聲和歸一化的所有內(nèi)容。到時候，您的圖像將準(zhǔn)備就緒，可以進行詳細(xì)分析。借助諸如OpenCV、Pillow和scikit-image等庫的幫助，您將很快就能增強圖像。因此，請做好準(zhǔn)備，開始深入了解Python中圖像預(yù)處理技術(shù)的完整指南！

什么是圖像預(yù)處理，為什么它很重要？

圖像預(yù)處理是將原始圖像數(shù)據(jù)處理為可用且有意義的格式的過程。它允許您消除不必要的失真并增強計算機視覺應(yīng)用程序所需的特定特性。預(yù)處理是在將圖像數(shù)據(jù)輸入機器學(xué)習(xí)模型之前準(zhǔn)備圖像數(shù)據(jù)的關(guān)鍵第一步。

圖像預(yù)處理中使用了幾種技術(shù)：

調(diào)整大小：將圖像調(diào)整為統(tǒng)一大小對于機器學(xué)習(xí)算法的正常運行非常重要。我們可以使用OpenCV的resize()方法來調(diào)整圖像大小。
灰度化：將彩色圖像轉(zhuǎn)換為灰度圖像可以簡化圖像數(shù)據(jù)，并減少某些算法的計算需求。cvtColor()方法可用于將RGB轉(zhuǎn)換為灰度。
降噪：可以應(yīng)用平滑、模糊和濾波技術(shù)來去除圖像中的不必要噪聲。GaussianBlur()和medianBlur()方法通常用于此目的。
歸一化：歸一化調(diào)整像素的強度值到所需范圍，通常在0到1之間。scikit-image中的Normalize()可用于此目的。
二值化：通過閾值處理將灰度圖像轉(zhuǎn)換為黑白圖像。在OpenCV中，使用threshold()方法對圖像進行二值化。
對比度增強：可以使用直方圖均衡化來調(diào)整圖像的對比度。equalizeHist()方法可以增強圖像的對比度。

通過正確組合這些技術(shù)，您可以顯著改進圖像數(shù)據(jù)并構(gòu)建更好的計算機視覺應(yīng)用程序。圖像預(yù)處理允許您將原始圖像精煉為適用于您要解決的問題的格式。

使用Python庫加載和轉(zhuǎn)換圖像

要開始使用Python進行圖像處理，您需要加載和轉(zhuǎn)換圖像為庫可處理的格式。這方面最流行的兩個選項是OpenCV和Pillow。

(1) 使用OpenCV加載圖像：OpenCV可以加載PNG、JPG、TIFF和BMP等格式的圖像。您可以使用以下代碼加載圖像：

import cv2
image = cv2.imread('path/to/image.jpg')

這將把圖像加載為NumPy數(shù)組。由于圖像位于BGR色彩空間，您可能希望將其轉(zhuǎn)換為RGB。

(2) 使用Pillow加載圖像：Pillow是友好的PIL（Python Image Library）分支。它支持比OpenCV更多的格式，包括PSD、ICO和WEBP。您可以使用以下代碼加載圖像：

from PIL import Image
image = Image.open('path/to/image.jpg')

圖像將處于RGB色彩空間。

(3) 在色彩空間之間轉(zhuǎn)換：您可能需要在RGB、BGR、HSV和灰度等色彩空間之間進行轉(zhuǎn)換。這可以使用OpenCV或Pillow完成。例如，要在OpenCV中將BGR轉(zhuǎn)換為灰度，可以使用：

gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

或者要在Pillow中將RGB轉(zhuǎn)換為HSV，可以使用：

image = image.convert('HSV')

有了這些基礎(chǔ)技能，您就可以轉(zhuǎn)向更高級的技術(shù)，如調(diào)整大小、濾波、邊緣檢測等等。可能性是無限的！您將建立什么樣的圖像處理項目呢？

調(diào)整大小和裁剪圖像至標(biāo)準(zhǔn)尺寸

調(diào)整大小和裁剪圖像是圖像預(yù)處理的重要第一步。圖像大小各異，但機器學(xué)習(xí)算法通常需要標(biāo)準(zhǔn)大小。您需要將圖像調(diào)整大小和裁剪為方形尺寸，通常是224x224或256x256像素。在Python中，您可以使用OpenCV或Pillow庫進行調(diào)整大小和裁剪。使用OpenCV，可以使用resize()函數(shù)。例如：

import cv2
img = cv2.imread('original.jpg')
resized = cv2.resize(img, (224, 224))

這將將圖像調(diào)整為224x224像素。要將圖像裁剪為正方形，可以計算中心正方形裁剪大小并使用OpenCV的crop()與中心坐標(biāo)。例如：

height, width, _ = img.shape
size = min(height, width)
x = (width size) // 2
y = (height size) // 2
cropped = img[y:y+size, x:x+size]

使用Pillow，您可以使用Image.open()和resize()函數(shù)。例如：

from PIL import Image
img = Image.open('original.jpg')
resized = img.resize((224, 224))

裁剪圖像時，使用img.crop()。例如：

width, height = img.size
size = min(width, height)
left = (width size) / 2
top = (height size) / 2
right = (width + size) / 2
bottom = (height + size) / 2
cropped = img.crop((left, top, right, bottom))

調(diào)整大小和裁剪圖像至標(biāo)準(zhǔn)尺寸是一個至關(guān)重要的第一步。這將使您的機器學(xué)習(xí)模型能夠有效地處理圖像，并提高結(jié)果的準(zhǔn)確性?；〞r間仔細(xì)調(diào)整大小和裁剪圖像，您的模型將感激不盡！

對像素值進行歸一化以保持一致的亮度

在處理圖像數(shù)據(jù)時，將像素值歸一化以保持一致的亮度并提高對比度是很重要的。這使圖像更適合進行分析，并使機器學(xué)習(xí)模型能夠獨立于光照條件學(xué)習(xí)模式。

(1) 像素值重新縮放：最常見的歸一化技術(shù)是將像素值重新縮放到0到1的范圍內(nèi)。這是通過將所有像素除以最大像素值（RGB圖像通常為255）來實現(xiàn)的。例如：

import cv2
img = cv2.imread('image.jpg')
normalized = img / 255.0

這將使所有像素在0到1之間縮放，其中0為黑色，1為白色。

(2) 直方圖均衡化：另一種有用的技術(shù)是直方圖均衡化。這將像素強度均勻分布到整個范圍以提高對比度?？梢允褂肙penCV的equalizeHist()方法應(yīng)用它：

eq_img = cv2.equalizeHist(img)

這對于像素值集中在一個狹窄范圍內(nèi)的低對比度圖像效果很好。對于一些算法，將像素值歸一化為零均值和單位方差是有用的。這可以通過減去均值并縮放到單位方差來實現(xiàn)：

mean, std = cv2.meanStdDev(img)
std_img = (img mean) / std

這將使圖像以零為中心，標(biāo)準(zhǔn)差為1。還有一些其他更復(fù)雜的歸一化技術(shù)，但這三種方法——重新縮放為0-1范圍、直方圖均衡化和標(biāo)準(zhǔn)化——涵蓋了基礎(chǔ)知識，將為大多數(shù)機器學(xué)習(xí)應(yīng)用準(zhǔn)備好圖像數(shù)據(jù)。確保對訓(xùn)練和測試數(shù)據(jù)都應(yīng)用相同的歸一化以獲得最佳結(jié)果。

應(yīng)用濾鏡以減少噪聲并銳化圖像

一旦您在Python中加載了圖像，就是時候開始增強它們了。圖像濾鏡用于減少噪聲、增強細(xì)節(jié)，總體提高圖像在分析之前的質(zhì)量。以下是您需要了解的一些主要濾鏡：

高斯模糊：高斯模糊濾鏡用于減少圖像中的細(xì)節(jié)和噪聲。它通過對每個像素及其周圍像素應(yīng)用高斯函數(shù)來“模糊”圖像。這有助于在進行邊緣檢測或其他處理技術(shù)之前平滑邊緣和細(xì)節(jié)。
中值模糊：中值模糊濾鏡用于從圖像中去除椒鹽噪聲。它通過用其鄰近像素的中值替換每個像素來工作。這有助于平滑孤立的嘈雜像素同時保留邊緣。
拉普拉斯濾波器：拉普拉斯濾波器用于檢測圖像中的邊緣。它通過檢測強度變化較快的區(qū)域來工作。輸出將是突出顯示邊緣的圖像，可用于邊緣檢測。這有助于識別和提取圖像中的特征。
反向掩蔽：反向掩蔽是一種用于增強圖像中細(xì)節(jié)和邊緣的技術(shù)。它通過從原始圖像中減去模糊版本來實現(xiàn)。這會放大邊緣和細(xì)節(jié)，使圖像看起來更清晰。反向掩蔽可用于在特征提取或?qū)ο髾z測之前增強細(xì)節(jié)。
雙邊濾波器：雙邊濾波器在平滑圖像的同時保留邊緣。它通過考慮像素的空間接近度和顏色相似度來實現(xiàn)。空間上接近且顏色相似的像素被一起平滑，而在顏色上不同的像素則不被平滑。這導(dǎo)致一個平滑的圖像，其邊緣保持清晰。雙邊濾波器對于在邊緣檢測之前進行噪聲降低很有用。

通過應(yīng)用這些濾鏡，您將獲得高質(zhì)量的增強圖像，準(zhǔn)備進行深入分析和計算機視覺任務(wù)。嘗試一下，看看它們?nèi)绾胃倪M您的圖像處理結(jié)果！

使用分割檢測和去除背景

在許多計算機視覺任務(wù)中，檢測和去除圖像背景是一個重要的預(yù)處理步驟。分割將前景主體與背景分離，使您得到一個只包含主體的清晰圖像。在Python中使用OpenCV和scikit-image執(zhí)行圖像分割的幾種常見方法有：

閾值化：閾值化將灰度圖像轉(zhuǎn)換為二進制圖像（黑白），通過選擇閾值值。比閾值值暗的像素變?yōu)楹谏?，比閾值值亮的像素變?yōu)榘咨?。這對于對比度高、光照均勻的圖像效果很好。您可以使用OpenCV的threshold()方法應(yīng)用閾值化。
邊緣檢測：邊緣檢測找到圖像中對象的邊緣。通過連接邊緣，您可以孤立前景主體。Canny邊緣檢測器是scikit-image的canny()方法中實現(xiàn)的一種流行的算法。調(diào)整low_threshold和high_threshold參數(shù)以檢測邊緣。
區(qū)域生長：區(qū)域生長從一組種子點開始，向外擴展以檢測圖像中的連續(xù)區(qū)域。您提供種子點，算法檢查相鄰像素以確定是否將其添加到區(qū)域。這將繼續(xù)，直到無法再添加更多像素。skimage.segmentation.region_growing()方法實現(xiàn)了這種技術(shù)。
分水嶺：分水嶺算法將圖像視為地形圖，高強度像素表示山峰，而谷底表示區(qū)域之間的邊界。它從峰頂開始洪水般地流下，當(dāng)不同區(qū)域相遇時創(chuàng)建隔離障礙。skimage.segmentation.watershed()方法執(zhí)行分水嶺分割。

通過嘗試這些技術(shù)，您可以在圖像中隔離出主體。分割是一個關(guān)鍵的第一步，使您能夠?qū)⒂嬎銠C視覺模型集中在圖像的最重要部分——前景主體上。

使用數(shù)據(jù)增強擴展您的數(shù)據(jù)集

數(shù)據(jù)增強是一種通過從現(xiàn)有圖像生成新圖像來人為地擴展數(shù)據(jù)集大小的技術(shù)。這有助于減少過擬合并提高模型的泛化性能。圖像數(shù)據(jù)的一些常見增強技術(shù)包括：

翻轉(zhuǎn)和旋轉(zhuǎn)：簡單地翻轉(zhuǎn)（水平或垂直）或旋轉(zhuǎn)（90、180、270度）圖像可以生成新的數(shù)據(jù)點。例如，如果您有1,000張貓的圖像，對其進行水平翻轉(zhuǎn)和垂直翻轉(zhuǎn)，再旋轉(zhuǎn)90度，可以得到4,000張總圖像（1,000原始+1,000水平翻轉(zhuǎn)+1,000垂直翻轉(zhuǎn)+1,000旋轉(zhuǎn)90度）。
裁剪：將圖像裁剪到不同的大小和比例可從相同的原始圖像創(chuàng)建新圖像。這使您的模型能夠看到相同內(nèi)容的不同構(gòu)圖和組合。您可以創(chuàng)建不同尺寸的隨機裁剪，或者針對更具體的裁剪比例，如正方形。
顏色操作：調(diào)整亮度、對比度、色調(diào)和飽和度是創(chuàng)建新的增強圖像的簡單方法。例如，您可以隨機調(diào)整圖像的亮度和對比度，最多可達(dá)30%，以生成新的數(shù)據(jù)點。請注意不要過度扭曲圖像，否則可能會混淆您的模型。
圖像疊加：將透明圖像、紋理或噪聲覆蓋到現(xiàn)有圖像上是另一種簡單的增強技術(shù)。添加水印、標(biāo)志、污垢/劃痕或高斯噪聲等內(nèi)容可以創(chuàng)建原始數(shù)據(jù)的現(xiàn)實變化。從微妙的疊加開始，看看您的模型的反應(yīng)如何。
結(jié)合技術(shù)：為了在數(shù)據(jù)上取得最大的增加，您可以在相同的圖像上組合多種增強技術(shù)。例如，您可以翻轉(zhuǎn)、旋轉(zhuǎn)、裁剪和調(diào)整圖像的顏色，從單個原始圖像生成許多新的數(shù)據(jù)點。但要注意不要過度增強，否則可能使圖像變得無法識別！

使用數(shù)據(jù)增強，您可以輕松地將圖像數(shù)據(jù)集的大小增加4倍、10倍或更多，而無需收集任何新圖像。這有助于抵制過擬合，并提高模型的準(zhǔn)確性，同時保持訓(xùn)練時間和成本不變。

選擇適合您應(yīng)用的預(yù)處理步驟

選擇適合您圖像分析項目的預(yù)處理技術(shù)取決于您的數(shù)據(jù)和目標(biāo)。一些常見的步驟包括：

調(diào)整大?。簩D像調(diào)整為一致的大小對于機器學(xué)習(xí)算法的正常運行很重要。通常希望所有圖像具有相同的高度和寬度，通常是較小的尺寸，如28x28或64x64像素。OpenCV或Pillow庫中的resize()方法可以輕松地以編程方式執(zhí)行此操作。
顏色轉(zhuǎn)換：將圖像轉(zhuǎn)換為灰度或黑白可以簡化您的分析并減少噪音。OpenCV的cvtColor()方法將圖像從RGB轉(zhuǎn)換為灰度。對于黑白圖像，使用閾值化。
降噪：諸如高斯模糊、中值模糊和雙邊濾波等技術(shù)可以減少噪音并平滑圖像。OpenCV的GaussianBlur()、medianBlur()和bilateralFilter()方法應(yīng)用這些濾鏡。
歸一化：將像素值歸一化到0到1或-1到1的標(biāo)準(zhǔn)范圍有助于算法更好地工作。您可以使用scikit-image中的normalize()方法對圖像進行歸一化。
對比度增強：對于低對比度圖像，直方圖均衡化可以提高對比度。OpenCV的equalizeHist()方法執(zhí)行此任務(wù)。
邊緣檢測：找到圖像中的邊緣或輪廓對于許多計算機視覺任務(wù)都很有用。OpenCV的Canny()方法中的Canny邊緣檢測器是一個受歡迎的選擇。

關(guān)鍵是選擇適合您特定需求的技術(shù)。從基本步驟如調(diào)整大小開始，然后嘗試不同的方法以改進質(zhì)量，并查看哪些方法優(yōu)化了您的結(jié)果。通過一些實驗，您將找到理想的預(yù)處理工作流程。

圖像預(yù)處理技術(shù)FAQ

現(xiàn)在您已經(jīng)對Python中的各種圖像預(yù)處理技術(shù)有了很好的了解，可能還有一些懸而未決的問題。以下是關(guān)于圖像預(yù)處理最常見的問題及其答案：

(1) Python支持哪些圖像格式？

Python通過OpenCV和Pillow等庫支持各種圖像格式。一些主要的格式包括：

JPEG — 常見的有損圖像格式
PNG — 無損圖像格式，適用于帶有透明度的圖像
TIFF — 無損圖像格式，適用于高顏色深度圖像
BMP — 無壓縮的光柵圖像格式

(2) 何時應(yīng)該調(diào)整圖像大?。?/p>

應(yīng)調(diào)整圖像大小的情況包括：

圖像太大，以至于無法有效處理。減小尺寸可以加快處理速度。
圖像需要匹配機器學(xué)習(xí)模型的輸入大小。
圖像需要在屏幕或網(wǎng)頁上以特定大小顯示。

(3) 有哪些常見的降噪技術(shù)？

一些流行的降噪技術(shù)包括：

高斯模糊 — 使用高斯濾波器對圖像進行模糊，減少高頻噪聲。
中值模糊 — 用鄰近像素的中值替換每個像素。對于去除椒鹽噪聲非常有效。
雙邊濾波器 — 在平滑圖像的同時保留邊緣。它可以去除噪聲同時保持清晰的邊緣。

(4) OpenCV支持哪些顏色空間，如何在它們之間進行轉(zhuǎn)換？

OpenCV支持RGB、HSV、LAB和灰度顏色空間。您可以使用cvtColor函數(shù)在這些顏色空間之間進行轉(zhuǎn)換。例如：

將RGB轉(zhuǎn)換為灰度：

gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

將RGB轉(zhuǎn)換為HSV：

hsv = cv2.cvtColor(img, cv2.COLOR_RGB2HSV)

將RGB轉(zhuǎn)換為LAB：

lab = cv2.cvtColor(img, cv2.COLOR_RGB2LAB)

將圖像轉(zhuǎn)換為不同的顏色空間對于某些計算機視覺任務(wù)（如閾值處理、邊緣檢測和目標(biāo)跟蹤）非常有用。

結(jié)論

這就是您所需要的，一個在Python中準(zhǔn)備圖像進行分析的完整指南。借助OpenCV和其他庫的強大功能，您現(xiàn)在擁有調(diào)整大小、增強、過濾和轉(zhuǎn)換圖像的所有工具。隨意嘗試不同的技術(shù)，調(diào)整參數(shù)，找到最適合您特定數(shù)據(jù)集和計算機視覺任務(wù)的方法。圖像預(yù)處理可能不是構(gòu)建AI系統(tǒng)中最引人注目的部分，但它絕對是至關(guān)重要的。

責(zé)任編輯：趙寧寧來源：小白玩轉(zhuǎn)Python

Python 圖像預(yù)處理 AI

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營