Python 插值算法完全解讀
本文轉(zhuǎn)載自微信公眾號「Python中文社區(qū)」,作者wedo實(shí)驗(yàn)君。轉(zhuǎn)載本文請聯(lián)系Python中文社區(qū)公眾號。
1. 什么是插值
最近在做時間序列預(yù)測時,在突增或者突降的變化劇烈的情況下,擬合參數(shù)的效果不好,有用到插值的算法補(bǔ)全一些數(shù)據(jù)來平滑劇烈變化過程。還有在圖像處理中,也經(jīng)常有用到插值算法來改變圖像的大小,在圖像超分(Image Super-Resolution)中上采樣也有插值的身影。
插值(interpolation),顧名思義就是插入一些新的數(shù)據(jù),當(dāng)然這些值是根據(jù)已有數(shù)據(jù)生成。插值算法有很多經(jīng)典算法, 本文分享如下:
- 線性插值
- 雙線性插值
- 雙三次插值bicubic interpolation
2. 插值算法原理和實(shí)現(xiàn)
2.1 線性插值
線性插值是最簡單的插值算法。如下圖已知(x0, y0) (x1, y1),在x處插值一點(diǎn)(x, y)。
可以通過簡單幾何知識來推出公式
實(shí)現(xiàn)上直接套公式,如果想插值多個點(diǎn),可以利用線性回歸的方式。
- import os
- import numpy as np
- from sklearn.linear_model import LinearRegression
- def linear_interpolation(data, inter_num=4):
- clf = LinearRegression()
- X = np.array([[1], [inter_num+2]])
- y = data
- clf.fit(X, y)
- inter_values = clf.predict(np.array([ [i+2] for i in range(inter_num)]))
- return inter_values
- data = [[10], [20]]
- linear_interpolation(data, 1)
- # array([[15.]])
- def manual_linear_interpolation(x0, y0, x1, y1, x):
- return y0+(x-x0)*(y1-y0)/(x1-x0)
- manual_linear_interpolation(1, 10, 3, 20, 2)
- # 15.0
線性插值算法經(jīng)常用在平滑數(shù)據(jù)上,也用在缺失值預(yù)處理中。
2.2 雙線性插值
雙線性插值是在兩個方向上同時進(jìn)行線性插值,經(jīng)常用在圖像處理中。雙線性插值是已知2*2個點(diǎn),插值生成一個點(diǎn)的過程。
如下圖所示,雙線性插值已知(x0, y1)(x0, y0)(x1, y1)(x1, y0)4個點(diǎn),插值計算(x, y)。
- 先插值生成(x, y1)(x, y0)
- 在插值生成(x, y)
- import cv2
- lean_img = cv2.imread('./lena.jpg')
- lena_x2 = cv2.resize(lean_img, (0, 0), fx=2, fy=2, interpolation=cv2.INTER_LINEAR)
2.3 雙三次插值
雙線性插值利用22個點(diǎn)插值生成一個新的點(diǎn),而雙三次插值利用44個點(diǎn)來插值一個新的點(diǎn)。插值的過程就是如何估計aij, aij可以認(rèn)為是16個點(diǎn)對插值點(diǎn)的影響因子。
影響因子設(shè)計來自于Cubic Convolution Interpolation For Digital Image Processing,
以下為Bicubic函數(shù)
- import cv2
- lean_img = cv2.imread('./lena.jpg')
- lena_x2_cubic = cv2.resize(lean_img, (0, 0), fx=2, fy=2, interpolation=cv2.INTER_CUBIC)
左邊為雙線性插值,右邊有雙三次插值,可以看出雙三次插值效果好,雙線性插值更平滑一點(diǎn),清晰度不足。
3. 總結(jié)
本文介紹了三種常見的插值算法以及在數(shù)字圖像處理中的應(yīng)用??偨Y(jié)如下:
- 線性插值:通過2點(diǎn)插值新的點(diǎn),可以利用線性回歸計算插值點(diǎn)
- 雙線性插值:通過4個點(diǎn)插值新的點(diǎn)
- 雙三次插值:通過16個點(diǎn)插值新的點(diǎn),插值權(quán)重利用bicubic函數(shù)
作者簡介:wedo實(shí)驗(yàn)君, 數(shù)據(jù)分析師;熱愛生活,熱愛寫作