Foursquare的野心:大數(shù)據(jù)時(shí)代“活點(diǎn)地圖”
這還不止,F(xiàn)oursquare 還想要根據(jù)過(guò)去的“行動(dòng)歷史”以及朋友的喜好提供未來(lái)行動(dòng)的指引,F(xiàn)oursquare Explore 服務(wù),可以發(fā)現(xiàn)身處的城市周邊都有什么值得一去的地方。他們還有怎樣的“地圖”美夢(mèng)?處理這些數(shù)據(jù)的工具又是什么?
大野心:精細(xì)的“多邊形區(qū)域”框架
Foursquare 正在和多個(gè)公司合作,為他們提供地理位置信息以及周邊商家評(píng)價(jià)反饋。同時(shí),他們也通過(guò)這些合作伙伴收集更多的地理位置信息——人們對(duì)什么地方感興趣,對(duì)什么地方不喜歡。Instagram, Bing, Flickr, Quora, Path, Soundtracking, Evernote……都是他們的合作伙伴,導(dǎo)入數(shù)據(jù)的量級(jí)可想而知。
Foursquare 的工程師 David Blackman 日前接受采訪時(shí)透露,F(xiàn)oursquare 正在為完善“活點(diǎn)地圖”的框架,讓更多應(yīng)用和公司能夠在此基礎(chǔ)上反戰(zhàn)自己的“殺手級(jí)”服務(wù)。而這種框架,就是城市區(qū)域中的“多邊形”(polygon shape)——根據(jù)“簽到”信息的大數(shù)據(jù)和地理信息編碼匯總而成的城市區(qū)域邊界。舉個(gè)例子,不是“廣州”或者“北京”的邊界,而是廣州的“上下九”區(qū)域,或者北京的“五道口”區(qū)域,他們不僅僅是一路名,一商圈,一行政區(qū)域,而是大部分用戶所認(rèn)為的區(qū)域邊界。他用紐約的“布魯克林”作為例子,F(xiàn)oursquare 所呈現(xiàn)的區(qū)域,并不是一般的網(wǎng)格狀,而是,通過(guò)收集用戶的簽到信息整合的“多邊形邊界”。
本來(lái),他們需要到世界上的每個(gè)城市深入每個(gè)區(qū)域來(lái)了解這些細(xì)節(jié)的邊界。不過(guò)通過(guò)收集“簽到”(需要輸入地址)信息,或者是用戶查找某地址所用的區(qū)域名字信息,他們可以足不出戶地把這個(gè)工作交給世界。只要與現(xiàn)有的商家點(diǎn)評(píng)服務(wù)糟糕的區(qū)域識(shí)別稍作對(duì)比,就能想象到多邊形框架的可怕之處——精準(zhǔn),而且“懂你”。
解密地圖背后的“繪圖工具”
Foursquare 目前有 100 多名員工,而負(fù)責(zé)地理信息數(shù)據(jù)的團(tuán)隊(duì)只有 3 人。這個(gè)小團(tuán)隊(duì)正在使用什么樣的工具來(lái)構(gòu)建地圖的框架?
其中之一是 Google S2 ,提供地表地理信息數(shù)據(jù)索引的開(kāi)源服務(wù)。Foursquare 目前的發(fā)現(xiàn)周邊商家和去處的服務(wù) Explore 就是基于S2 的開(kāi)源數(shù)據(jù)。而用戶的簽到信息,也是會(huì)覆蓋在 S2 的地理信息上,方便 Foursquare 進(jìn)行整合和地理分類。 而為了建立地理編碼信息的數(shù)據(jù)庫(kù),F(xiàn)oursquare 還在使用 MapReduce 這種大規(guī)模數(shù)據(jù)集的運(yùn)算模型。David Blackman 稱,他們將 MapReduce 和 S2 結(jié)合起來(lái),將世界分成數(shù)個(gè)模塊,將簽到的地理位置信息與 S2 結(jié)合一起,然后分成區(qū)域,這樣就有了之前我們提及的“多邊形區(qū)域”的模型了。
另外,為了獲取豐富地圖數(shù)據(jù)——商家、郵政編碼等,F(xiàn)oursquare 還與 TIGER Project 和 Natural Earth 等美國(guó)政府官方的地理編碼項(xiàng)目合作。
盡管如此,F(xiàn)oursquare 還是以來(lái)用戶提供的大量地理位置數(shù)據(jù)來(lái)完善自己的推薦和地圖內(nèi)容,早前,F(xiàn)oursquare 曾經(jīng)把這些數(shù)據(jù)整合成一個(gè)動(dòng)態(tài)的“簽到”地圖:
【編輯推薦】