自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

穩(wěn)了!用Redis實(shí)現(xiàn)“附近的人”功能

存儲(chǔ) 存儲(chǔ)軟件 Redis
針對(duì)“附近的人”這一位置服務(wù)領(lǐng)域的應(yīng)用場(chǎng)景,常見(jiàn)的可使用 PG、MySQL 和 MongoDB 等多種 DB 的空間索引進(jìn)行實(shí)現(xiàn)。

 針對(duì)“附近的人”這一位置服務(wù)領(lǐng)域的應(yīng)用場(chǎng)景,常見(jiàn)的可使用 PG、MySQL 和 MongoDB 等多種 DB 的空間索引進(jìn)行實(shí)現(xiàn)。

[[279964]]
圖片來(lái)自 Pexels 

而 Redis 另辟蹊徑,結(jié)合其有序隊(duì)列 ZSET 以及 GEOHASH 編碼,實(shí)現(xiàn)了空間搜索功能,且擁有極高的運(yùn)行效率。

本文將從源碼角度對(duì)其算法原理進(jìn)行解析,并推算查詢時(shí)間復(fù)雜度。要提供完整的“附近的人”服務(wù),最基本的是要實(shí)現(xiàn)“增”、“刪”、“查”的功能。

以下將分別進(jìn)行介紹,其中會(huì)重點(diǎn)對(duì)查詢功能進(jìn)行解析。

操作命令

自 Redis 3.2 開始,Redis 基于 GEOHASH 和有序集合提供了地理位置相關(guān)功能。

Redis Geo 模塊包含了以下 6 個(gè)命令:

  • GEOADD:將給定的位置對(duì)象(緯度、經(jīng)度、名字)添加到指定的 Key。
  • GEOPOS:從 Key 里面返回所有給定位置對(duì)象的位置(經(jīng)度和緯度)。
  • GEODIST:返回兩個(gè)給定位置之間的距離。
  • GEOHASH:返回一個(gè)或多個(gè)位置對(duì)象的 GeoHASH 表示。
  • GEORADIUS:以給定的經(jīng)緯度為中心,返回目標(biāo)集合中與中心的距離不超過(guò)給定最大距離的所有位置對(duì)象。
  • GEORADIUSBYMEMBER:以給定的位置對(duì)象為中心,返回與其距離不超過(guò)給定最大距離的所有位置對(duì)象。

其中,組合使用 GEOADD 和 GEORADIUS 可實(shí)現(xiàn)“附近的人”中“增”和“查”的基本功能。

要實(shí)現(xiàn)微信中“附近的人”功能,可直接使用 GEORADIUSBYMEMBER 命令。其中“給定的位置對(duì)象”即為用戶本人,搜索的對(duì)象為其他用戶。

不過(guò)本質(zhì)上,GEORADIUSBYMEMBER=GEOPOS+GEORADIUS,即先查找用戶位置再通過(guò)該位置搜索附近滿足位置相互距離條件的其他用戶對(duì)象。

以下會(huì)從源碼角度入手對(duì) GEOADD 和 GEORADIUS 命令進(jìn)行分析,剖析其算法原理。

Redis Geo 操作中只包含了“增”和“查”的操作,并沒(méi)有專門的“刪除”命令。主要是因?yàn)?Redis 內(nèi)部使用有序集合(ZSET)保存位置對(duì)象,可用 ZREM 進(jìn)行刪除。

在 Redis 源碼 geo.c 的文件注釋中,只說(shuō)明了該文件為 GEOADD、GEORADIUS 和 GEORADIUSBYMEMBER 的實(shí)現(xiàn)文件(其實(shí)也實(shí)現(xiàn)了另三個(gè)命令)。從側(cè)面看出其他三個(gè)命令為輔助命令。

GEOADD

使用方式

  1. GEOADD key longitude latitude member [longitude latitude member ...] 

將給定的位置對(duì)象(緯度、經(jīng)度、名字)添加到指定的 Key。其中,Key 為集合名稱,Member 為該經(jīng)緯度所對(duì)應(yīng)的對(duì)象。

在實(shí)際運(yùn)用中,當(dāng)所需存儲(chǔ)的對(duì)象數(shù)量過(guò)多時(shí),可通過(guò)設(shè)置多 Key(如一個(gè)省一個(gè) Key)的方式對(duì)對(duì)象集合變相做 Sharding,避免單集合數(shù)量過(guò)多。

成功插入后的返回值:

  1. (integer) N 

其中 N 為成功插入的個(gè)數(shù)。

源碼分析

  1. /* GEOADD key long lat name [long2 lat2 name2 ... longN latN nameN] */ 
  2. void geoaddCommand(client *c) { 
  3.  
  4. //參數(shù)校驗(yàn) 
  5.     /* Check arguments number for sanity. */ 
  6.     if ((c->argc - 2) % 3 != 0) { 
  7.         /* Need an odd number of arguments if we got this far... */ 
  8.         addReplyError(c, "syntax error. Try GEOADD key [x1] [y1] [name1] " 
  9.                          "[x2] [y2] [name2] ... "); 
  10.         return
  11.     } 
  12.  
  13. //參數(shù)提取Redis 
  14.     int elements = (c->argc - 2) / 3; 
  15.     int argc = 2+elements*2; /* ZADD key score ele ... */ 
  16.     robj **argv = zcalloc(argc*sizeof(robj*)); 
  17.     argv[0] = createRawStringObject("zadd",4); 
  18.     argv[1] = c->argv[1]; /* key */ 
  19.     incrRefCount(argv[1]); 
  20.  
  21. //參數(shù)遍歷+轉(zhuǎn)換 
  22.     /* Create the argument vector to call ZADD in order to add all 
  23.      * the score,value pairs to the requested zset, where score is actually 
  24.      * an encoded version of lat,long. */ 
  25.     int i; 
  26.     for (i = 0; i < elements; i++) { 
  27.         double xy[2]; 
  28.  
  29.     //提取經(jīng)緯度 
  30.         if (extractLongLatOrReply(c, (c->argv+2)+(i*3),xy) == C_ERR) { 
  31.             for (i = 0; i < argc; i++) 
  32.                 if (argv[i]) decrRefCount(argv[i]); 
  33.             zfree(argv); 
  34.             return
  35.         } 
  36.  
  37.     //將經(jīng)緯度轉(zhuǎn)換為52位的geohash作為分值 & 提取對(duì)象名稱 
  38.         /* Turn the coordinates into the score of the element. */ 
  39.         GeoHashBits hash; 
  40.         geohashEncodeWGS84(xy[0], xy[1], GEO_STEP_MAX, &hash); 
  41.         GeoHashFix52Bits bits = geohashAlign52Bits(hash); 
  42.         robj *score = createObject(OBJ_STRING, sdsfromlonglong(bits)); 
  43.         robj *val = c->argv[2 + i * 3 + 2]; 
  44.  
  45.     //設(shè)置有序集合的對(duì)象元素名稱和分值 
  46.         argv[2+i*2] = score; 
  47.         argv[3+i*2] = val; 
  48.         incrRefCount(val); 
  49.     } 
  50.  
  51. //調(diào)用zadd命令,存儲(chǔ)轉(zhuǎn)化好的對(duì)象 
  52.     /* Finally call ZADD that will do the work for us. */ 
  53.     replaceClientCommandVector(c,argc,argv); 
  54.     zaddCommand(c); 

通過(guò)源碼分析可以看出 Redis 內(nèi)部使用有序集合(ZSET)保存位置對(duì)象,有序集合中每個(gè)元素都是一個(gè)帶位置的對(duì)象,元素的 Score 值為其經(jīng)緯度對(duì)應(yīng)的 52 位的 GEOHASH 值。

Double 類型精度為 52 位;GEOHASH 是以 base32 的方式編碼,52bits 最高可存儲(chǔ) 10 位 GEOHASH 值,對(duì)應(yīng)地理區(qū)域大小為 0.6*0.6 米的格子。

換句話說(shuō)經(jīng) Redis Geo 轉(zhuǎn)換過(guò)的位置理論上會(huì)有約 0.3*1.414=0.424 米的誤差。

算法小結(jié)

簡(jiǎn)單總結(jié)下 GEOADD 命令都干了啥:

  • 參數(shù)提取和校驗(yàn)
  • 將入?yún)⒔?jīng)緯度轉(zhuǎn)換為 52 位的 GEOHASH 值(Score)
  • 調(diào)用 ZADD 命令將 Member 及其對(duì)應(yīng)的 Score 存入集合 Key 中。

GEORADIUS

使用方式

  1. GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [ASC|DESC] [COUNT count] [STORE key] [STORedisT key

以給定的經(jīng)緯度為中心,返回目標(biāo)集合中與中心的距離不超過(guò)給定最大距離的所有位置對(duì)象。

范圍單位:m | km | ft | mi --> 米 | 千米 | 英尺 | 英里

額外參數(shù):

  • WITHDIST:在返回位置對(duì)象的同時(shí),將位置對(duì)象與中心之間的距離也一并返回。距離的單位和用戶給定的范圍單位保持一致。
  • WITHCOORD:將位置對(duì)象的經(jīng)度和維度也一并返回。
  • WITHHASH:以 52 位有符號(hào)整數(shù)的形式,返回位置對(duì)象經(jīng)過(guò)原始 GEOHASH 編碼的有序集合分值。這個(gè)選項(xiàng)主要用于底層應(yīng)用或者調(diào)試,實(shí)際中的作用并不大。
  • ASC|DESC:從近到遠(yuǎn)返回位置對(duì)象元素 | 從遠(yuǎn)到近返回位置對(duì)象元素。
  • COUNT count:選取前 N 個(gè)匹配位置對(duì)象元素。(不設(shè)置則返回所有元素)
  • STORE key:將返回結(jié)果的地理位置信息保存到指定 key。
  • STORedisT key:將返回結(jié)果離中心點(diǎn)的距離保存到指定 Key。

由于 STORE 和 STORedisT 兩個(gè)選項(xiàng)的存在,GEORADIUS 和 GEORADIUSBYMEMBER 命令在技術(shù)上會(huì)被標(biāo)記為寫入命令,從而只會(huì)查詢(寫入)主實(shí)例,QPS 過(guò)高時(shí)容易造成主實(shí)例讀寫壓力過(guò)大。

為解決這個(gè)問(wèn)題,在 Redis 3.2.10 和 Redis 4.0.0 中,分別新增了 GEORADIUS_RO 和 GEORADIUSBYMEMBER_RO 兩個(gè)只讀命令。

不過(guò),在實(shí)際開發(fā)中筆者發(fā)現(xiàn) 在 java package Redis.clients.jedis.params.geo 的 GeoRadiusParam 參數(shù)類中并不包含 STORE 和 STORedisT 兩個(gè)參數(shù)選項(xiàng)。

在調(diào)用 GEORADIUS 時(shí)是否真的只查詢了主實(shí)例,還是進(jìn)行了只讀封裝。感興趣的朋友可以自己研究下。

成功查詢后的返回值,不帶 WITH 限定,返回一個(gè) member list,如:

  1. ["member1","member2","member3"

帶 WITH 限定,Member List 中每個(gè) Member 也是一個(gè)嵌套 List,如:

  1.     ["member1", distance1, [longitude1, latitude1]] 
  2.     ["member2", distance2, [longitude2, latitude2]] 

源碼分析

PS:此段源碼較長(zhǎng),看不下去的可直接看中文注釋,或直接跳到小結(jié)部分。

  1. /* GEORADIUS key x y radius unit [WITHDIST] [WITHHASH] [WITHCOORD] [ASC|DESC
  2.  *                               [COUNT count] [STORE key] [STORedisT key
  3.  * GEORADIUSBYMEMBER key member radius unit ... options ... */ 
  4. void georadiusGeneric(client *c, int flags) { 
  5.     robj *key = c->argv[1]; 
  6.     robj *storekey = NULL
  7.     int stoRedist = 0; /* 0 for STORE, 1 for STORedisT. */ 
  8.  
  9. //根據(jù)key獲取有序集合 
  10.     robj *zobj = NULL
  11.     if ((zobj = lookupKeyReadOrReply(c, key, shared.null[c->resp])) == NULL || 
  12.         checkType(c, zobj, OBJ_ZSET)) { 
  13.         return
  14.     } 
  15.  
  16. //根據(jù)用戶輸入(經(jīng)緯度/member)確認(rèn)中心點(diǎn)經(jīng)緯度 
  17.     int base_args; 
  18.     double xy[2] = { 0 }; 
  19.     if (flags & RADIUS_COORDS) { 
  20.         …… 
  21.     } 
  22.  
  23. //獲取查詢范圍距離 
  24.     double radius_meters = 0, conversion = 1; 
  25.     if ((radius_meters = extractDistanceOrReply(c, c->argv + base_args - 2, 
  26.                                                 &conversion)) < 0) { 
  27.         return
  28.     } 
  29.  
  30. //獲取可選參數(shù) (withdist、withhash、withcoords、sort、count) 
  31.     int withdist = 0, withhash = 0, withcoords = 0; 
  32.     int sort = SORT_NONE; 
  33.     long long count = 0; 
  34.     if (c->argc > base_args) { 
  35.         ... ... 
  36.     } 
  37.  
  38. //獲取 STORE 和 STORedisT 參數(shù) 
  39.     if (storekey && (withdist || withhash || withcoords)) { 
  40.         addReplyError(c, 
  41.             "STORE option in GEORADIUS is not compatible with " 
  42.             "WITHDIST, WITHHASH and WITHCOORDS options"); 
  43.         return
  44.     } 
  45.  
  46. //設(shè)定排序 
  47.     if (count != 0 && sort == SORT_NONE) sort = SORT_ASC; 
  48.  
  49. //利用中心點(diǎn)和半徑計(jì)算目標(biāo)區(qū)域范圍 
  50.     GeoHashRadius georadius = 
  51.         geohashGetAreasByRadiusWGS84(xy[0], xy[1], radius_meters); 
  52.  
  53. //對(duì)中心點(diǎn)及其周圍8個(gè)geohash網(wǎng)格區(qū)域進(jìn)行查找,找出范圍內(nèi)元素對(duì)象 
  54.     geoArray *ga = geoArrayCreate(); 
  55.     membersOfAllNeighbors(zobj, georadius, xy[0], xy[1], radius_meters, ga); 
  56.  
  57. //未匹配返空 
  58.     /* If no matching results, the user gets an empty reply. */ 
  59.     if (ga->used == 0 && storekey == NULL) { 
  60.         addReplyNull(c); 
  61.         geoArrayFree(ga); 
  62.         return
  63.     } 
  64.  
  65. //一些返回值的設(shè)定和返回 
  66.     …… 
  67.     geoArrayFree(ga); 

上文代碼中最核心的步驟有兩個(gè),一是“計(jì)算中心點(diǎn)范圍”,二是“對(duì)中心點(diǎn)及其周圍 8 個(gè) GEOHASH 網(wǎng)格區(qū)域進(jìn)行查找”。

對(duì)應(yīng)的是如下兩個(gè)函數(shù):

  • geohashGetAreasByRadiusWGS84
  • membersOfAllNeighbors

我們依次來(lái)看:

①計(jì)算中心點(diǎn)范圍

// geohash_helper.c

  1. /* GEORADIUS key x y radius unit [WITHDIST] [WITHHASH] [WITHCOORD] [ASC|DESC
  2.  *                               [COUNT count] [STORE key] [STORedisT key
  3.  * GEORADIUSBYMEMBER key member radius unit ... options ... */ 
  4. void georadiusGeneric(client *c, int flags) { 
  5.     robj *key = c->argv[1]; 
  6.     robj *storekey = NULL
  7.     int stoRedist = 0; /* 0 for STORE, 1 for STORedisT. */ 
  8.  
  9. //根據(jù)key獲取有序集合 
  10.     robj *zobj = NULL
  11.     if ((zobj = lookupKeyReadOrReply(c, key, shared.null[c->resp])) == NULL || 
  12.         checkType(c, zobj, OBJ_ZSET)) { 
  13.         return
  14.     } 
  15.  
  16. //根據(jù)用戶輸入(經(jīng)緯度/member)確認(rèn)中心點(diǎn)經(jīng)緯度 
  17.     int base_args; 
  18.     double xy[2] = { 0 }; 
  19.     if (flags & RADIUS_COORDS) { 
  20.         …… 
  21.     } 
  22.  
  23. //獲取查詢范圍距離 
  24.     double radius_meters = 0, conversion = 1; 
  25.     if ((radius_meters = extractDistanceOrReply(c, c->argv + base_args - 2, 
  26.                                                 &conversion)) < 0) { 
  27.         return
  28.     } 
  29.  
  30. //獲取可選參數(shù) (withdist、withhash、withcoords、sort、count) 
  31.     int withdist = 0, withhash = 0, withcoords = 0; 
  32.     int sort = SORT_NONE; 
  33.     long long count = 0; 
  34.     if (c->argc > base_args) { 
  35.         ... ... 
  36.     } 
  37.  
  38. //獲取 STORE 和 STORedisT 參數(shù) 
  39.     if (storekey && (withdist || withhash || withcoords)) { 
  40.         addReplyError(c, 
  41.             "STORE option in GEORADIUS is not compatible with " 
  42.             "WITHDIST, WITHHASH and WITHCOORDS options"); 
  43.         return
  44.     } 
  45.  
  46. //設(shè)定排序 
  47.     if (count != 0 && sort == SORT_NONE) sort = SORT_ASC; 
  48.  
  49. //利用中心點(diǎn)和半徑計(jì)算目標(biāo)區(qū)域范圍 
  50.     GeoHashRadius georadius = 
  51.         geohashGetAreasByRadiusWGS84(xy[0], xy[1], radius_meters); 
  52.  
  53. //對(duì)中心點(diǎn)及其周圍8個(gè)geohash網(wǎng)格區(qū)域進(jìn)行查找,找出范圍內(nèi)元素對(duì)象 
  54.     geoArray *ga = geoArrayCreate(); 
  55.     membersOfAllNeighbors(zobj, georadius, xy[0], xy[1], radius_meters, ga); 
  56.  
  57. //未匹配返空 
  58.     /* If no matching results, the user gets an empty reply. */ 
  59.     if (ga->used == 0 && storekey == NULL) { 
  60.         addReplyNull(c); 
  61.         geoArrayFree(ga); 
  62.         return
  63.     } 
  64.  
  65. //一些返回值的設(shè)定和返回 
  66.     …… 
  67.     geoArrayFree(ga); 

②對(duì)中心點(diǎn)及其周圍 8 個(gè) GEOHASH 網(wǎng)格區(qū)域進(jìn)行查找

// geo.c

  1. //在9個(gè)hashBox中獲取想要的元素 
  2. int membersOfAllNeighbors(robj *zobj, GeoHashRadius n, double lon, double lat, double radius, geoArray *ga) { 
  3.     GeoHashBits neighbors[9]; 
  4.     unsigned int i, count = 0, last_processed = 0; 
  5.     int debugmsg = 0; 
  6.  
  7. //獲取9個(gè)搜索hashBox 
  8.     neighbors[0] = n.hash; 
  9.     …… 
  10.     neighbors[8] = n.neighbors.south_west; 
  11.  
  12. //在每個(gè)hashBox中搜索目標(biāo)點(diǎn) 
  13.     for (i = 0; i < sizeof(neighbors) / sizeof(*neighbors); i++) { 
  14.         if (HASHISZERO(neighbors[i])) { 
  15.             if (debugmsg) D("neighbors[%d] is zero",i); 
  16.             continue
  17.         } 
  18.  
  19.     //剔除可能的重復(fù)hashBox (搜索半徑>5000KM時(shí)可能出現(xiàn)) 
  20.         if (last_processed && 
  21.             neighbors[i].bits == neighbors[last_processed].bits && 
  22.             neighbors[i].step == neighbors[last_processed].step) 
  23.         { 
  24.             continue
  25.         } 
  26.  
  27.     //搜索hashBox中滿足條件的對(duì)象     
  28.         count += membersOfGeoHashBox(zobj, neighbors[i], ga, lon, lat, radius); 
  29.         last_processed = i; 
  30.     } 
  31.     return count
  32.  
  33.  
  34. int membersOfGeoHashBox(robj *zobj, GeoHashBits hash, geoArray *ga, double lon, double lat, double radius) { 
  35. //獲取hashBox內(nèi)的最大、最小geohash值(52位) 
  36.     GeoHashFix52Bits minmax
  37.     scoresOfGeoHashBox(hash,&min,&max); 
  38.  
  39. //根據(jù)最大、最小geohash值篩選zobj集合中滿足條件的點(diǎn) 
  40.     return geoGetPointsInRange(zobj, minmax, lon, lat, radius, ga); 
  41.  
  42.  
  43. int geoGetPointsInRange(robj *zobj, double mindouble maxdouble lon, double lat, double radius, geoArray *ga) { 
  44.  
  45. //搜索Range的參數(shù)邊界設(shè)置(即9個(gè)hashBox其中一個(gè)的邊界范圍) 
  46.     zrangespec range = { .min = min, .max = max, .minex = 0, .maxex = 1 }; 
  47.     size_t origincount = ga->used; 
  48.     sds member; 
  49.  
  50. //搜索集合zobj可能有ZIPLIST和SKIPLIST兩種編碼方式,這里以SKIPLIST為例,邏輯是一樣的 
  51.     if (zobj->encoding == OBJ_ENCODING_ZIPLIST) { 
  52.         …… 
  53.     } else if (zobj->encoding == OBJ_ENCODING_SKIPLIST) { 
  54.         zset *zs = zobj->ptr; 
  55.         zskiplist *zsl = zs->zsl; 
  56.         zskiplistNode *ln; 
  57.  
  58.     //獲取在hashBox范圍內(nèi)的首個(gè)元素(跳表數(shù)據(jù)結(jié)構(gòu),效率可比擬于二叉查找樹),沒(méi)有則返0 
  59.         if ((ln = zslFirstInRange(zsl, &range)) == NULL) { 
  60.             /* Nothing exists starting at our min.  No results. */ 
  61.             return 0; 
  62.         } 
  63.  
  64.     //從首個(gè)元素開始遍歷集合 
  65.         while (ln) { 
  66.             sds ele = ln->ele; 
  67.         //遍歷元素超出range范圍則break 
  68.             /* Abort when the node is no longer in range. */ 
  69.             if (!zslValueLteMax(ln->score, &range)) 
  70.                 break; 
  71.         //元素校驗(yàn)(計(jì)算元素與中心點(diǎn)的距離) 
  72.             ele = sdsdup(ele); 
  73.             if (geoAppendIfWithinRadius(ga,lon,lat,radius,ln->score,ele) 
  74.                 == C_ERR) sdsfree(ele); 
  75.             ln = ln->level[0].forward
  76.         } 
  77.     } 
  78.     return ga->used - origincount; 
  79.  
  80. int geoAppendIfWithinRadius(geoArray *ga, double lon, double lat, double radius, double score, sds member) { 
  81.     double distance, xy[2]; 
  82.  
  83. //解碼錯(cuò)誤, 返回error 
  84.     if (!decodeGeohash(score,xy)) return C_ERR; /* Can't decode. */ 
  85.  
  86. //最終距離校驗(yàn)(計(jì)算球面距離distance看是否小于radius) 
  87.     if (!geohashGetDistanceIfInRadiusWGS84(lon,lat, xy[0], xy[1], 
  88.                                            radius, &distance)) 
  89.     { 
  90.         return C_ERR; 
  91.     } 
  92.  
  93. //構(gòu)建并返回滿足條件的元素 
  94.     geoPoint *gp = geoArrayAppend(ga); 
  95.     gp->longitude = xy[0]; 
  96.     gp->latitude = xy[1]; 
  97.     gp->dist = distance; 
  98.     gp->member = member; 
  99.     gp->score = score; 
  100.     return C_OK; 

算法小結(jié)

拋開眾多可選參數(shù)不談,簡(jiǎn)單總結(jié)下 GEORADIUS 命令是怎么利用 GEOHASH 獲取目標(biāo)位置對(duì)象的:

  • 參數(shù)提取和校驗(yàn)。
  • 利用中心點(diǎn)和輸入半徑計(jì)算待查區(qū)域范圍。這個(gè)范圍參數(shù)包括滿足條件的最高的 GEOHASH 網(wǎng)格等級(jí)(精度)以及對(duì)應(yīng)的能夠覆蓋目標(biāo)區(qū)域的九宮格位置(后續(xù)會(huì)有詳細(xì)說(shuō)明)。
  • 對(duì)九宮格進(jìn)行遍歷,根據(jù)每個(gè) GEOHASH 網(wǎng)格的范圍框選出位置對(duì)象。進(jìn)一步找出與中心點(diǎn)距離小于輸入半徑的對(duì)象,進(jìn)行返回。

直接描述不太好理解,我們通過(guò)如下兩張圖再對(duì)算法進(jìn)行簡(jiǎn)單的演示:

 

令左圖的中心為搜索中心,綠色圓形區(qū)域?yàn)槟繕?biāo)區(qū)域,所有點(diǎn)為待搜索的位置對(duì)象,紅色點(diǎn)則為滿足條件的位置對(duì)象。

在實(shí)際搜索時(shí),首先會(huì)根據(jù)搜索半徑計(jì)算 GEOHASH 網(wǎng)格等級(jí)(即右圖中網(wǎng)格大小等級(jí)),并確定九宮格位置(即紅色九宮格位置信息)。

再依次查找計(jì)算九宮格中的點(diǎn)(藍(lán)點(diǎn)和紅點(diǎn))與中心點(diǎn)的距離,最終篩選出距離范圍內(nèi)的點(diǎn)(紅點(diǎn))。

算法分析

為什么要用這種算法策略進(jìn)行查詢,或者說(shuō)這種策略的優(yōu)勢(shì)在哪,讓我們以問(wèn)答的方式進(jìn)行分析說(shuō)明。

①為什么要找到滿足條件的最高的 GEOHASH 網(wǎng)格等級(jí)?為什么用九宮格?

這其實(shí)是一個(gè)問(wèn)題,本質(zhì)上是對(duì)所有的元素對(duì)象進(jìn)行了一次初步篩選。在多層 GEOHASH 網(wǎng)格中,每個(gè)低等級(jí)的 GEOHASH 網(wǎng)格都是由 4 個(gè)高一級(jí)的網(wǎng)格拼接而成(如圖)。

 

換句話說(shuō),GEOHASH 網(wǎng)格等級(jí)越高,所覆蓋的地理位置范圍就越小。當(dāng)我們根據(jù)輸入半徑和中心點(diǎn)位置計(jì)算出的能夠覆蓋目標(biāo)區(qū)域的最高等級(jí)的九宮格(網(wǎng)格)時(shí),就已經(jīng)對(duì)九宮格外的元素進(jìn)行了篩除。

這里之所以使用九宮格,而不用單個(gè)網(wǎng)格,主要原因還是為了避免邊界情況,盡可能縮小查詢區(qū)域范圍。

試想以 0 經(jīng)緯度為中心,就算查 1 米范圍,單個(gè)網(wǎng)格覆蓋的話也得查整個(gè)地球區(qū)域。而向四周八個(gè)方向擴(kuò)展一圈可有效避免這個(gè)問(wèn)題。

②如何通過(guò) GEOHASH 網(wǎng)格的范圍框選出元素對(duì)象?效率如何?

首先在每個(gè) GEOHASH 網(wǎng)格中的 GEOHASH 值都是連續(xù)的,有固定范圍。所以只要找出有序集合中,處在該范圍的位置對(duì)象即可。

以下是有序集合的跳表數(shù)據(jù)結(jié)構(gòu):

 

其擁有類似二叉查找樹的查詢效率,操作平均時(shí)間復(fù)雜性為 O(log(N))。且最底層的所有元素都以鏈表的形式按序排列。

所以在查詢時(shí),只要找到集合中處在目標(biāo) GEOHASH 網(wǎng)格中的第一個(gè)值,后續(xù)依次對(duì)比即可,不用多次查找。

九宮格不能一起查,要一個(gè)個(gè)遍歷的原因也在于九宮格各網(wǎng)格對(duì)應(yīng)的 GEOHASH 值不具有連續(xù)性。只有連續(xù)了,查詢效率才會(huì)高,不然要多做許多距離運(yùn)算。

綜上,我們從源碼角度解析了 Redis Geo 模塊中 “增(GEOADD)” 和 “查(GEORADIUS)” 的詳細(xì)過(guò)程。

并可推算出 Redis 中 GEORADIUS 查找附近的人功能,時(shí)間復(fù)雜度為:O(N+log(M))。

其中 N 為指定半徑范圍內(nèi)的位置元素?cái)?shù)量,而 M 則是被九宮格圈住計(jì)算距離的元素的數(shù)量。

結(jié)合 Redis 本身基于內(nèi)存的存儲(chǔ)特性,在實(shí)際使用過(guò)程中有非常高的運(yùn)行效率。

作者:萬(wàn)汨

簡(jiǎn)介:餓了么資深開發(fā)工程師。iOS,Go,Java 均有涉獵。目前主攻大數(shù)據(jù)開發(fā)。喜歡騎行、爬山。

 

責(zé)任編輯:武曉燕 來(lái)源: 餓了么物流技術(shù)團(tuán)隊(duì)
相關(guān)推薦

2021-07-06 08:41:54

RedisGeo 類型數(shù)據(jù)類型

2015-07-15 13:18:27

附近的人開發(fā)

2024-05-17 16:04:45

iOS 18蘋果

2022-10-30 10:18:09

Geohash算法Haversine

2023-11-20 08:13:01

2021-07-22 10:25:07

JS驗(yàn)證碼前端

2010-07-16 16:28:46

實(shí)穩(wěn)

2015-05-04 16:22:39

2022-05-11 07:41:31

Python驗(yàn)證碼

2021-04-27 16:04:26

人工智能Python 語(yǔ)音識(shí)別

2020-05-11 17:00:30

點(diǎn)贊MySQLRedis

2021-12-14 15:20:37

Python微信代碼

2020-04-16 12:42:42

附近的人共享單車App

2020-08-12 09:55:07

附近的人數(shù)據(jù)庫(kù)MySQL

2009-07-03 09:44:39

實(shí)現(xiàn)RSS功能JSP技術(shù)

2020-07-02 16:40:40

MySQLRedis數(shù)據(jù)庫(kù)

2021-02-01 16:55:13

iPhoneTouch ID蘋果

2023-03-02 06:00:00

2021-07-05 08:41:49

RedisGEO系統(tǒng)

2018-10-19 11:55:36

數(shù)據(jù)庫(kù)Redis命令
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)