基于Python查找圖像中很常見(jiàn)的顏色
如果我們能夠得知道一幅圖像中最多的顏色是什么的話,可以幫助我們解決很多實(shí)際問(wèn)題。例如在農(nóng)業(yè)領(lǐng)域中想確定水果的成熟度,我們可以通過(guò)檢查水果的顏色是否落在特定范圍內(nèi),來(lái)判斷它們是否已經(jīng)成熟。
接下來(lái)我們將使用Python和一些常用庫(kù)(例如Numpy,Matplotlib和OpenCV)來(lái)解決這個(gè)問(wèn)題。
01. 準(zhǔn)備工作
第一步:添加程序包
我們將在此處加載基本軟件包。另外,由于我們要使用Jupyter進(jìn)行編程,因此小伙伴們不要忘記添加%matplotlib inline命令。
第二步:加載并顯示示例圖像
我們將并排顯示兩個(gè)圖像,因此我們需要做一個(gè)輔助函數(shù)。接下來(lái)我們將加載一些在本教程中將要使用的示例圖像,并使用上述功能對(duì)其進(jìn)行顯示。
02. 常用方法
方法一:平均值
第一種方法是最簡(jiǎn)單(但無(wú)效)的方法-只需找到平均像素值即可。使用numpy的average功能,我們可以輕松獲得行和寬度上的平均像素值-axis=(0,1)
- img_temp = img.copy()
- img_temp[:,:,0], img_temp[:,:,1], img_temp[:,:,2] = np.average(img, axis=(0,1))
- img_temp_2 = img_2.copy()
- img_temp_2[:,:,0], img_temp_2[:,:,1], img_temp_2[:,:,2] = np.average(img_2, axis=(0,1))
- show_img_compar(img, img_temp)
- show_img_compar(img_2, img_temp_2)
從上面圖像中可以看出,平均方法可能會(huì)產(chǎn)生錯(cuò)誤結(jié)果,它給出的最常見(jiàn)的顏色可能并不是我們想要的顏色,這是因?yàn)槠骄悼紤]了所有像素值。當(dāng)我們具有高對(duì)比度的圖像(一張圖像中同時(shí)包含“淺色”和“深色”)時(shí)這個(gè)問(wèn)題會(huì)很?chē)?yán)重。在第二張圖片中,這一點(diǎn)更加清晰。它為我們提供了一種新的顏色,該顏色在圖像中根本看不到。
方法二:最高像素頻率
第二種方法將比第一種更加準(zhǔn)確。我們的工作就是計(jì)算每個(gè)像素值出現(xiàn)的次數(shù)。numpy給我們提供了一個(gè)函數(shù)可以完成這個(gè)任務(wù)。但是首先,我們必須調(diào)整圖像數(shù)據(jù)結(jié)構(gòu)的形狀,以?xún)H提供3個(gè)值的列表(每個(gè)R,G和B通道強(qiáng)度一個(gè))。
我們可以使用numpy的reshape函數(shù)來(lái)獲取像素值列表。
現(xiàn)在我們已經(jīng)有了正確結(jié)構(gòu)的數(shù)據(jù),可以開(kāi)始計(jì)算像素值的頻率了,使用numpy中的unique函數(shù)即可。
- img_temp = img.copy()
- unique, counts = np.unique(img_temp.reshape(-1, 3), axis=0, return_counts=True)
- img_temp[:,:,0], img_temp[:,:,1], img_temp[:,:,2] = unique[np.argmax(counts)]
- img_temp_2 = img_2.copy()
- unique, counts = np.unique(img_temp_2.reshape(-1, 3), axis=0, return_counts=True)
- img_temp_2[:,:,0], img_temp_2[:,:,1], img_temp_2[:,:,2] = unique[np.argmax(counts)]
- show_img_compar(img, img_temp)
- show_img_compar(img_2, img_temp_2)
比第一個(gè)更有意義嗎?最常見(jiàn)的顏色是黑色區(qū)域。但是如果我們不僅采用一種最常見(jiàn)的顏色,還要采用更多的顏色怎么辦?使用相同的概念,我們可以采用N種最常見(jiàn)的顏色。換句話說(shuō),我們要采用最常見(jiàn)的不同顏色群集該怎么辦。
方法三:使用K均值聚類(lèi)
我們可以使用著名的K均值聚類(lèi)將顏色組聚類(lèi)在一起。
- def palette(clusters):
- width=300
- palette = np.zeros((50, width, 3), np.uint8)
- steps = width/clusters.cluster_centers_.shape[0]
- for idx, centers in enumerate(clusters.cluster_centers_):
- palette[:, int(idx*steps):(int((idx+1)*steps)), :] = centers
- return palette
- clt_1 = clt.fit(img.reshape(-1, 3))
- show_img_compar(img, palette(clt_1))
- clt_2 = clt.fit(img_2.reshape(-1, 3))
- show_img_compar(img_2, palette(clt_2))
容易吧!現(xiàn)在,我們需要的是一個(gè)顯示上面的顏色簇并立即顯示的功能。我們只需要?jiǎng)?chuàng)建一個(gè)高度為50,寬度為300像素的圖像來(lái)顯示顏色組/調(diào)色板。對(duì)于每個(gè)顏色簇,我們將其分配給我們的調(diào)色板。
是不是很漂亮?就圖像中最常見(jiàn)的顏色而言,K均值聚類(lèi)給出了出色的結(jié)果。在第二張圖像中,我們可以看到調(diào)色板中有太多的棕色陰影。這很可能是因?yàn)槲覀冞x擇了太多的群集。讓我們看看是否可以通過(guò)選擇較小的k值來(lái)對(duì)其進(jìn)行修復(fù)。
- def palette(clusters):
- width=300
- palette = np.zeros((50, width, 3), np.uint8)
- steps = width/clusters.cluster_centers_.shape[0]
- for idx, centers in enumerate(clusters.cluster_centers_):
- palette[:, int(idx*steps):(int((idx+1)*steps)), :] = centers
- return palette
- clt_3 = KMeans(n_clusters=3)
- clt_3.fit(img_2.reshape(-1, 3))
- show_img_compar(img_2, palette(clt_3))
由于我們使用K均值聚類(lèi),因此我們?nèi)匀槐仨氉约捍_定適當(dāng)數(shù)量的聚類(lèi)。三個(gè)集群似乎是一個(gè)不錯(cuò)的選擇。但是我們?nèi)匀豢梢愿纳七@些結(jié)果,并且仍然可以解決集群?jiǎn)栴}。我們還如何顯示群集在整個(gè)圖像中所占的比例?
方法四:K均值+比例顯示
我們需要做的就是修改我們的palette功能。代替使用固定步驟,我們將每個(gè)群集的寬度更改為與該群集中的像素?cái)?shù)成比例。
- from collections import Counter
- def palette_perc(k_cluster):
- width = 300
- palette = np.zeros((50, width, 3), np.uint8)
- n_pixels = len(k_cluster.labels_)
- counter = Counter(k_cluster.labels_) # count how many pixels per cluster
- perc = {}
- for i in counter:
- perc[i] = np.round(counter[i]/n_pixels, 2)
- perc = dict(sorted(perc.items()))
- #for logging purposes
- print(perc)
- print(k_cluster.cluster_centers_)
- step = 0
- for idx, centers in enumerate(k_cluster.cluster_centers_):
- palette[:, step:int(step + perc[idx]*width+1), :] = centers
- step += int(perc[idx]*width+1)
- return palette
- clt_1 = clt.fit(img.reshape(-1, 3))
- show_img_compar(img, palette_perc(clt_1))
- clt_2 = clt.fit(img_2.reshape(-1, 3))
- show_img_compar(img_2, palette_perc(clt_2))
它不僅為我們提供了圖像中最常見(jiàn)的顏色。這也給了我們每個(gè)像素出現(xiàn)的比例。
03. 結(jié)論
我們介紹了幾種使用Python以及最知名的庫(kù)來(lái)獲取圖像中最常見(jiàn)顏色的技術(shù)。另外,我們還看到了這些技術(shù)的優(yōu)缺點(diǎn)。到目前為止,使用k> 1的K均值找到最常見(jiàn)的顏色是找到圖像中最頻繁的顏色的最佳解決方案之一。