自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

手把手教你用Python替代Mapinfo更快查找兩張表中距離最近的點

開發(fā) 后端
本文介紹了如何利用Python計算兩個經(jīng)緯度點間的距離,并在兩張表間進(jìn)行最近點計算,這本來是Mapinfo的分內(nèi)之事,但數(shù)據(jù)量大時就處理不動了,Python處理速度快,還能對數(shù)據(jù)進(jìn)行預(yù)處理,正是由于可以自己優(yōu)化代碼,可以無限提高運行速度,比如數(shù)據(jù)切塊處理。

[[387827]]

 一、前言

大家好,我是崔艷飛。工作中有時需要把A表中的經(jīng)緯度點,從B表中匹配一個最近的點出來,用Mapinfo也可以實現(xiàn),但處理速度慢,特別是數(shù)據(jù)量大時根本處理不動,此時用Python就能輕松實現(xiàn),還能顯示處理進(jìn)度,詳細(xì)如下。

二、項目目標(biāo)

用Python實現(xiàn)兩張表間最近點的計算。

三、項目準(zhǔn)備

軟件:PyCharm

需要的庫:pandas, xlrd,os

四、項目分析

1)如何選擇并讀取要處理的Excel文件?

利用os、xlrd,選擇要讀取處理的Excel文件。

2)如何計算兩個經(jīng)緯度點的距離?

利用pandas庫讀取兩張表的內(nèi)容,再定義函數(shù)計算兩個經(jīng)緯度點的距離。

3)如何循環(huán)計算并保存最近一個點的數(shù)據(jù)?

利用For循環(huán),對兩張表的內(nèi)容進(jìn)行循環(huán)讀取,通過If判斷保留最近的距離點數(shù)據(jù)。

4)如何保存結(jié)果?

利用to_excel保存,得到最近點的數(shù)據(jù)。

五、項目實現(xiàn)

1、第一步導(dǎo)入需要的庫

  1. import pandas as pd 
  2. import xlrd 
  3. import os 

2、第二步選擇并讀取要處理的Excel文件

  1. path="D:/a/" 
  2.    #獲取文件夾下所有EXCEL名 
  3.    bb = path + 'result.xlsx' 
  4.    writer = pd.ExcelWriter(bb,engine='openpyxl'
  5.    xlsx_names = [x for x in os.listdir(path) if x.endswith(".xlsx")] 
  6.    # 獲取第一個EXCEL名 
  7.    xlsx_names1 = xlsx_names[0] 
  8.    aa = path + xlsx_names1 
  9.    #打開第一個EXCEL 
  10.    first_file_fh=xlrd.open_workbook(aa) 
  11.    # 獲取SHEET名 
  12.    first_file_sheet=first_file_fh.sheets() 

3、第三步循環(huán)計算并保存最近一個點的數(shù)據(jù)

  1. for i in range(h1): 
  2.      w1=df1.loc[i,'緯度'
  3.      j1 = df1.loc[i,'經(jīng)度'
  4.      d1 = df1.loc[i, :] 
  5.      d0=10000000000000000000000000.0000 
  6.      print("原小區(qū)第%d個。" %(i+1)) 
  7.      test_dict = {'距離': [d0]} 
  8.      d3 = pd.DataFrame(test_dict) 
  9.  
  10.      for l in range(h2): 
  11.          w2=df2.loc[l, '緯度'
  12.          j2=df2.loc[l,'經(jīng)度'
  13.          d=haversine(j1, w1, j2, w2) 
  14.          if d<d0: 
  15.              d0=d 
  16.              d2 = df2.loc[l, :] 
  17.              test_dict = {'距離': [d0]} 
  18.              d3 = pd.DataFrame(test_dict) 
  19.          else:continue 

4、第四步保存計算后的文件

  1. resultdata1.to_excel(excel_writer=writer, sheet_name='原小區(qū)', encoding="utf-8"index=False
  2. resultdata2.to_excel(excel_writer=writer, sheet_name='最近小區(qū)', encoding="utf-8"index=False
  3. resultdata3.to_excel(excel_writer=writer, sheet_name='距離', encoding="utf-8"index=False
  4. writer.save() 
  5. writer.close() 

六、效果展示

1、處理前數(shù)據(jù):

2、處理進(jìn)度顯示:

3、處理結(jié)果:

七、總結(jié)

本文介紹了如何利用Python計算兩個經(jīng)緯度點間的距離,并在兩張表間進(jìn)行最近點計算,這本來是Mapinfo的分內(nèi)之事,但數(shù)據(jù)量大時就處理不動了,Python處理速度快,還能對數(shù)據(jù)進(jìn)行預(yù)處理,正是由于可以自己優(yōu)化代碼,可以無限提高運行速度,比如數(shù)據(jù)切塊處理,有興趣的同學(xué)可以進(jìn)一步研究下。

 

責(zé)任編輯:姜華 來源: Python爬蟲與數(shù)據(jù)挖掘
相關(guān)推薦

2021-12-11 20:20:19

Python算法線性

2021-08-09 13:31:25

PythonExcel代碼

2022-10-19 14:30:59

2021-05-10 06:48:11

Python騰訊招聘

2021-02-02 13:31:35

Pycharm系統(tǒng)技巧Python

2021-05-08 08:04:05

Python爬取素材

2011-03-28 16:14:38

jQuery

2021-02-04 09:00:57

SQLDjango原生

2021-02-06 14:55:05

大數(shù)據(jù)pandas數(shù)據(jù)分析

2022-08-04 10:39:23

Jenkins集成CD

2021-03-23 09:05:52

PythonExcelVlookup

2021-05-17 21:30:06

Python求均值中值

2009-04-22 09:17:19

LINQSQL基礎(chǔ)

2021-02-10 09:34:40

Python文件的壓縮PyCharm

2021-01-21 09:10:29

ECharts柱狀圖大數(shù)據(jù)

2021-01-08 10:32:24

Charts折線圖數(shù)據(jù)可視化

2020-10-23 06:42:16

機器學(xué)習(xí)開發(fā)人工智能

2020-10-23 17:23:50

機器學(xué)習(xí)技術(shù)模型

2020-03-08 22:06:16

Python數(shù)據(jù)IP

2012-01-11 13:40:35

移動應(yīng)用云服務(wù)
點贊
收藏

51CTO技術(shù)棧公眾號