自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Get了!用Python制作數(shù)據(jù)預(yù)測(cè)集成工具

開(kāi)發(fā) 后端
大數(shù)據(jù)預(yù)測(cè)是大數(shù)據(jù)最核心的應(yīng)用,是它將傳統(tǒng)意義的預(yù)測(cè)拓展到“現(xiàn)測(cè)”。大數(shù)據(jù)預(yù)測(cè)的優(yōu)勢(shì)體現(xiàn)在,它把一個(gè)非常困難的預(yù)測(cè)問(wèn)題,轉(zhuǎn)化為一個(gè)相對(duì)簡(jiǎn)單的描述問(wèn)題,而這是傳統(tǒng)小數(shù)據(jù)集根本無(wú)法企及的。

 大數(shù)據(jù)預(yù)測(cè)是大數(shù)據(jù)最核心的應(yīng)用,是它將傳統(tǒng)意義的預(yù)測(cè)拓展到“現(xiàn)測(cè)”。大數(shù)據(jù)預(yù)測(cè)的優(yōu)勢(shì)體現(xiàn)在,它把一個(gè)非常困難的預(yù)測(cè)問(wèn)題,轉(zhuǎn)化為一個(gè)相對(duì)簡(jiǎn)單的描述問(wèn)題,而這是傳統(tǒng)小數(shù)據(jù)集根本無(wú)法企及的。從預(yù)測(cè)的角度看,大數(shù)據(jù)預(yù)測(cè)所得出的結(jié)果不僅僅是用于處理現(xiàn)實(shí)業(yè)務(wù)的簡(jiǎn)單、客觀(guān)的結(jié)論,更是能用于幫助企業(yè)經(jīng)營(yíng)的決策。

[[338755]]

在過(guò)去,人們的決策主要是依賴(lài) 20% 的結(jié)構(gòu)化數(shù)據(jù),而大數(shù)據(jù)預(yù)測(cè)則可以利用另外 80% 的非結(jié)構(gòu)化數(shù)據(jù)來(lái)做決策。大數(shù)據(jù)預(yù)測(cè)具有更多的數(shù)據(jù)維度,更快的數(shù)據(jù)頻度和更廣的數(shù)據(jù)寬度。與小數(shù)據(jù)時(shí)代相比,大數(shù)據(jù)預(yù)測(cè)的思維具有 3 大改變:實(shí)樣而非抽樣;預(yù)測(cè)效率而非精確;相關(guān)關(guān)系而非因果關(guān)系。

而今天我們就將利用python制作可視化的大數(shù)據(jù)預(yù)測(cè)部分集成工具,其中數(shù)據(jù)在這里使用一個(gè)實(shí)驗(yàn)中的數(shù)據(jù)。普遍性的應(yīng)用則直接從文件讀取即可。其中的效果圖如下:

 

實(shí)驗(yàn)前的準(zhǔn)備

首先我們使用的python版本是3.6.5所用到的模塊如下:

  • sklearn模塊用來(lái)創(chuàng)建整個(gè)模型訓(xùn)練和保存調(diào)用以及算法的搭建框架等等。
  • numpy模塊用來(lái)處理數(shù)據(jù)矩陣運(yùn)算。
  • matplotlib模塊用來(lái)可視化擬合模型效果。
  • Pillow庫(kù)用來(lái)加載圖片至GUI界面。
  • Pandas模塊用來(lái)讀取csv數(shù)據(jù)文件。
  • Tkinter用來(lái)創(chuàng)建GUI窗口程序。

 

數(shù)據(jù)的訓(xùn)練和訓(xùn)練的GUI窗口

經(jīng)過(guò)算法比較,發(fā)現(xiàn)這里我們選擇使用sklearn簡(jiǎn)單的多元回歸進(jìn)行擬合數(shù)據(jù)可以達(dá)到比較好的效果。

(1)首先是是數(shù)據(jù)的讀取,通過(guò)設(shè)定選定文件夾函數(shù)來(lái)讀取文件,加載數(shù)據(jù)的效果:

 

  1. '''選擇文件功能''' 
  2. def selectPath(): 
  3.     # 選擇文件path_接收文件地址 
  4.     path_ =tkinter.filedialog.askopenfilename() 
  5.     # 通過(guò)replace函數(shù)替換絕對(duì)文件地址中的/來(lái)使文件可被程序讀取 
  6.     # 注意:\\轉(zhuǎn)義后為\,所以\\\\轉(zhuǎn)義后為\\ 
  7.     path_ =path_.replace("/""\\\\"
  8.     # path設(shè)置path_的值 
  9.     path.set(path_) 
  10.     return path 
  11.  
  12. # 得到的DataFrame讀入所有數(shù)據(jù) 
  13. data = pd.read_excel(FILENAME, header=0, usecols="A,B,C,D,E,F,G,H,I"
  14. # DataFrame轉(zhuǎn)化為array 
  15. DataArray = data.values 
  16. # 讀取已使用年限作為標(biāo)簽 
  17. Y = DataArray[:, 8] 
  18. # 讀取其他參數(shù)作為自變量,影響因素 
  19. X = DataArray[:, 0:8] 
  20. # 字符串轉(zhuǎn)變?yōu)檎麛?shù) 
  21. for i in range(len(Y)): 
  22.     Y[i] = int(Y[i].replace("年""")) 
  23. X = np.array(X)  # 轉(zhuǎn)化為array 
  24. Y = np.array(Y)  # 轉(zhuǎn)化為array 
  25.  
  26. root = Tk() 
  27. root.geometry("+500+260"
  28. # 背景圖設(shè)置 
  29. canvas = tk.Canvas(root, width=600, height=200, bd=0, highlightthickness=0) 
  30. imgpath = '1.jpg' 
  31. img = Image.open(imgpath) 
  32. photo = ImageTk.PhotoImage(img) 
  33. #背景圖大小設(shè)置 
  34. canvas.create_image(700, 400, image=photo) 
  35. canvas.pack() 
  36. path = StringVar() 
  37. #標(biāo)簽名稱(chēng)位置 
  38. label1=tk.Label(text = "目標(biāo)路徑:"
  39. label1.pack() 
  40. e1=tk.Entry( textvariable = path) 
  41. e1.pack() 
  42. bn1=tk.Button(text = "路徑選擇", command = selectPath) 
  43. bn1.pack() 
  44. bn2=tk.Button(text = "模型訓(xùn)練", command = train) 
  45. bn2.pack() 
  46. bn3=tk.Button(text = "模型預(yù)測(cè)", command = test) 
  47. bn3.pack() 
  48. #標(biāo)簽按鈕等放在背景圖上 
  49. canvas.create_window(50, 50, width=150, height=30, 
  50.                      window=label1) 
  51. canvas.create_window(280, 50, width=300, height=30, 
  52.                      window=e1) 
  53. canvas.create_window(510, 50, width=150, height=30, 
  54.                      window=bn1) 
  55. canvas.create_window(50, 100, width=150, height=30, 
  56.                      window=bn2) 
  57. canvas.create_window(510, 100, width=150, height=30, 
  58.                      window=bn3) 
  59.  
  60. root.mainloop() 

效果如下可見(jiàn):

 

(2)然后是數(shù)據(jù)的擬合和可視化模型效果:

 

  1. # 模型擬合 
  2. reg = LinearRegression() 
  3. reg.fit(X, Y) 
  4. # 預(yù)測(cè)效果 
  5. predict = reg.predict(np.array([X[0]])) 
  6. Y_predict = reg.predict(X) 
  7. print(Y_predict) 
  8. # 橫坐標(biāo) 
  9. x_label = [] 
  10. for i in range(len(Y)): 
  11.     x_label.append(i) 
  12. # 繪圖 
  13. fig, ax = plt.subplots() 
  14. # 真實(shí)值分布散點(diǎn)圖 
  15. plt.scatter(x_label, Y) 
  16. # 預(yù)測(cè)值分布散點(diǎn)圖 
  17. plt.scatter(x_label, Y_predict) 
  18. # 預(yù)測(cè)值擬合直線(xiàn)圖 
  19. plt.plot(x_label, Y_predict) 
  20. # 橫縱坐標(biāo) 
  21. ax.set_xlabel('預(yù)測(cè)值與真實(shí)值模型擬合效果圖'
  22. ax.set_ylabel('藍(lán)色為真實(shí)值,黃色為預(yù)測(cè)值'
  23. # 將繪制的圖形顯示到tkinter:創(chuàng)建屬于root的canvas畫(huà)布,并將圖f置于畫(huà)布上 
  24. canvas = FigureCanvasTkAgg(fig, master=root) 
  25. canvas.draw()  # 注意show方法已經(jīng)過(guò)時(shí)了,這里改用draw 
  26. canvas.get_tk_widget().pack() 
  27. # matplotlib的導(dǎo)航工具欄顯示上來(lái)(默認(rèn)是不會(huì)顯示它的) 
  28. toolbar = NavigationToolbar2Tk(canvas, root) 
  29. toolbar.update() 
  30. canvas._tkcanvas.pack() 
  31. #彈窗顯示 
  32. messagebox.showinfo(title='模型情況', message="模型訓(xùn)練完成!"
  33. 其中的效果如下可見(jiàn): 

其中的效果如下可見(jiàn):

 

模型的預(yù)測(cè)和使用

其中模型的預(yù)測(cè)主要通過(guò)兩種方式進(jìn)行預(yù)測(cè),分別是:手動(dòng)輸入單個(gè)數(shù)據(jù)進(jìn)行預(yù)測(cè)和讀取文件進(jìn)行預(yù)測(cè)。

其中手動(dòng)輸入數(shù)據(jù)進(jìn)行預(yù)測(cè)需要設(shè)置更多的GUI按鈕,其中代碼如下:

 

  1. #子窗口 
  2. LOVE = Toplevel(root) 
  3. LOVE.geometry("+100+260"
  4. LOVE.title = "模型測(cè)試" 
  5. #子窗口各標(biāo)簽名 
  6. label = ["上升沿斜率(v/us)""下降沿斜率(v/us)""脈寬(ns)""低狀態(tài)電平(mv)""低電平方差(mv2)x10-3""高狀態(tài)電平(v)""高電平方差(v2)""信號(hào)質(zhì)量因子"
  7. Label(LOVE, text="1、輸入?yún)?shù)預(yù)測(cè)", font=("微軟雅黑", 20)).grid(row=0, column=0) 
  8. #標(biāo)簽名稱(chēng),字體位置 
  9. Label(LOVE, text=label[0], font=("微軟雅黑",10)).grid(row=1, column=0) 
  10. Label(LOVE, text=label[1], font=("微軟雅黑", 10)).grid(row=1, column=1) 
  11. Label(LOVE, text=label[2], font=("微軟雅黑", 10)).grid(row=1, column=2) 
  12. Label(LOVE, text=label[3], font=("微軟雅黑", 10)).grid(row=1, column=3) 
  13. Label(LOVE, text=label[4], font=("微軟雅黑", 10)).grid(row=1, column=4) 
  14. Label(LOVE, text=label[5], font=("微軟雅黑", 10)).grid(row=1, column=5) 
  15. Label(LOVE, text=label[6], font=("微軟雅黑", 10)).grid(row=1, column=6) 
  16. Label(LOVE, text=label[7], font=("微軟雅黑", 10)).grid(row=1, column=7) 
  17. #編輯框位置和字體 
  18. en1=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  19. en1.grid(row=2, column=0) 
  20. en2=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  21. en2.grid(row=2, column=1) 
  22. en3=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  23. en3.grid(row=2, column=2) 
  24. en4=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  25. en4.grid(row=2, column=3) 
  26. en5=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  27. en5.grid(row=2, column=4) 
  28. en6=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  29. en6.grid(row=2, column=5) 
  30. en7=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  31. en7.grid(row=2, column=6) 
  32. en8=tk.Entry(LOVE, font=("微軟雅黑", 8)) 
  33. en8.grid(row=2, column=7) 
  34. Label(LOVE, text="", font=("微軟雅黑", 10)).grid(row=3, column=0) 
  35. #測(cè)試輸入框預(yù)測(cè) 
  36. def pp(): 
  37.     x=np.array([int(en1.get()),int(en2.get()),int(en3.get()),int(en4.get()),int(en5.get()),int(en6.get()),int(en7.get()),int(en8.get())]) 
  38.     # 預(yù)測(cè)效果 
  39.     predict = reg.predict(np.array([x])) 
  40.     Label(LOVE, text="預(yù)測(cè)結(jié)果已使用年數(shù)為:"+str(predict[0])+"年", font=("微軟雅黑", 10)).grid(row=4, column=3) 
  41.     print(predict) 
  42. Button(LOVE, text="預(yù)測(cè):", font=("微軟雅黑", 15),command=pp).grid(row=4, column=0) 
  43. Label(LOVE, text="2、選擇文件預(yù)測(cè)", font=("微軟雅黑", 20)).grid(row=5, column=0) 
  44. path1 = StringVar() 
  45. label1 = tk.Label(LOVE,text="目標(biāo)路徑:", font=("微軟雅黑", 10)) 
  46. label1.grid(row=6, column=0) 
  47. e1 = tk.Entry(LOVE,textvariable=path1, font=("微軟雅黑", 10)) 
  48. e1.grid(row=6, column=2) 
  49. label = ["上升沿斜率(v/us)""下降沿斜率(v/us)""脈寬(ns)""低狀態(tài)電平(mv)""低電平方差(mv2)x10-3""高狀態(tài)電平(v)""高電平方差(v2)"
  50.              "信號(hào)質(zhì)量因子"
  51.     n = 0 
  52.     for i in predict_value: 
  53.         print(str(label) + "分別為" + str(X[n]) + "預(yù)測(cè)出來(lái)的結(jié)果為:" + str(i) + "年" + "\n"
  54.         f = open("預(yù)測(cè)結(jié)果.txt""a"
  55.         f.write(str(label) + "分別為" + str(X[n]) + "預(yù)測(cè)出來(lái)的結(jié)果為:" + str(i) + "年" + "\n"
  56.         f.close() 
  57.         f = open("result.txt""a"
  58.         f.write(str(i) + "\n"
  59.         f.close() 
  60.         n += 1 
  61.     messagebox.showinfo(title='模型情況', message="預(yù)測(cè)結(jié)果保存在當(dāng)前文件夾下的TXT文件中!"
  62.     os.system("result.txt"
  63.     os.system("預(yù)測(cè)結(jié)果.txt"
  64. Button(LOVE, text="預(yù)測(cè):", font=("微軟雅黑", 15), command=ppt).grid(row=7, column=0) 

效果如下可見(jiàn):

選擇文件進(jìn)行讀取預(yù)測(cè)和模型訓(xùn)練數(shù)據(jù)的讀取類(lèi)似,代碼如下:

 

 

  1. #選擇文件預(yù)測(cè) 
  2. def selectPath1(): 
  3.     # 選擇文件path_接收文件地址 
  4.     path_ =tkinter.filedialog.askopenfilename() 
  5.     # 通過(guò)replace函數(shù)替換絕對(duì)文件地址中的/來(lái)使文件可被程序讀取 
  6.     # 注意:\\轉(zhuǎn)義后為\,所以\\\\轉(zhuǎn)義后為\\ 
  7.     path_ =path_.replace("/""\\\\"
  8.     # path設(shè)置path_的值 
  9.     path1.set(path_) 
  10.     return path 
  11. bn1 = tk.Button(LOVE,text="路徑選擇", font=("微軟雅黑", 10), command=selectPath1) 
  12. bn1.grid(row=6, column=6) 
  13. def ppt(): 
  14.     try: 
  15.         os.remove("預(yù)測(cè)結(jié)果.txt"
  16.         os.remove("result.txt"
  17.     except
  18.         pass 
  19.     # 文件的名字 
  20.     FILENAME =path1.get() 
  21.     # 禁用科學(xué)計(jì)數(shù)法 
  22.     pd.set_option('float_format', lambda x: '%.3f' % x) 
  23.     np.set_printoptions(threshold=np.inf) 
  24.     # 得到的DataFrame讀入所有數(shù)據(jù) 
  25.     data =pd.read_excel(FILENAME, header=0, usecols="A,B,C,D,E,F,G,H"
  26.     # DataFrame轉(zhuǎn)化為array 
  27.     DataArray =data.values 
  28.     # 讀取其他參數(shù)作為自變量,影響因素 
  29.     X = DataArray[:,0:8] 
  30.     predict_value = reg.predict(X) 
  31.     print(predict_value) 

效果如下:

 

由于讀取文件進(jìn)行預(yù)測(cè)的話(huà),數(shù)據(jù)較多故直接存儲(chǔ)在TXT中方便查看:

 

責(zé)任編輯:華軒 來(lái)源: AI科技大本營(yíng)
相關(guān)推薦

2020-12-11 12:49:03

大數(shù)據(jù)信息數(shù)據(jù)分析

2013-11-08 17:57:01

SAP

2015-08-06 09:15:22

2018-02-01 16:25:55

2018-03-16 11:50:33

大數(shù)據(jù)數(shù)據(jù)科學(xué)安全

2020-02-04 11:06:42

大數(shù)據(jù)技術(shù)存儲(chǔ)

2022-07-14 10:06:19

代碼交叉表

2023-12-26 15:53:40

2022-06-17 09:21:53

Pandas代碼透視表

2020-01-20 14:02:07

大數(shù)據(jù)IT物聯(lián)網(wǎng)

2016-10-25 09:25:36

大數(shù)據(jù)樓市走勢(shì)

2013-02-26 10:44:50

奧斯卡大數(shù)據(jù)微軟

2017-01-17 09:55:56

2024-05-27 07:54:02

2017-07-17 15:02:51

大數(shù)據(jù)銀行用戶(hù)流失

2020-01-07 15:56:38

大數(shù)據(jù)數(shù)據(jù)IT

2014-06-16 16:08:55

大數(shù)據(jù)

2020-06-10 09:24:56

大數(shù)據(jù)疫情技術(shù)

2022-03-30 15:11:26

Python房?jī)r(jià)工具

2013-12-19 10:23:03

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)