AI看照片,幾秒就能地理定位!因太危險(xiǎn)被公司主動(dòng)關(guān)閉,正向警方推銷
在看刑偵片的時(shí)候,每當(dāng)破案遇阻,你是否想象過,一種能夠僅基于一張嫌疑人出現(xiàn)的場(chǎng)景照片,就即刻定位到場(chǎng)景所在地的具體經(jīng)緯度的技術(shù)呢?
現(xiàn)在,這種想象,已然成為現(xiàn)實(shí)!
初創(chuàng)AI公司graylark發(fā)布了一項(xiàng)名為「GeoSpy」的系列產(chǎn)品,因其是一個(gè)革命性的照片地理定位系統(tǒng),近來引發(fā)熱議。
照片地理定位是什么?
照片地理定位是指僅根據(jù)圖像的視覺內(nèi)容確定圖像拍攝地點(diǎn)的過程。它已成為計(jì)算機(jī)視覺中的一個(gè)關(guān)鍵領(lǐng)域,其應(yīng)用范圍涵蓋安全、導(dǎo)航、社交媒體等多個(gè)方面。
早期照片地理定位方法主要關(guān)注簡(jiǎn)單任務(wù),例如識(shí)別著名地標(biāo)或使用嵌入圖像中的元數(shù)據(jù),如GPS坐標(biāo)。
然而,研究人員很快意識(shí)到更廣泛應(yīng)用的潛力——從不含標(biāo)志性地標(biāo)的普通場(chǎng)景中確定位置。隨著技術(shù)的進(jìn)步,研究人員超越了元數(shù)據(jù),開始分析圖像的視覺內(nèi)容,包括建筑風(fēng)格、植被和道路標(biāo)記。
照片地理定位背后的原理包括分析圖像特征,如紋理、顏色以及植被、建筑和標(biāo)牌等上下文元素。隨著時(shí)間的推移,人工智能的進(jìn)步和更大數(shù)據(jù)集的獲取顯著提高了這些系統(tǒng)的準(zhǔn)確性和速度。
GeoSpy支持在參考數(shù)據(jù)集中沒有匹配的圖像時(shí)也能提供近似位置,非常適合千米范圍內(nèi)的更廣泛地理定位任務(wù)。
而基于Superbolt的GeoSpy Pro則支持上傳一張不帶有任何標(biāo)簽數(shù)據(jù)(如地理位置、拍攝時(shí)間)的照片,就能定位到照片中的拍攝所在地,并結(jié)合地圖給出3D實(shí)景。
體驗(yàn)鏈接:https://superbolt.geospy.ai/
如下圖,用戶上傳了一張車內(nèi)視角的照片后,它就可以直接定位到對(duì)應(yīng)的地理位置,報(bào)告出所在城市和經(jīng)緯度,甚至能直接給出對(duì)應(yīng)建筑的3D實(shí)景地圖。
而且還支持給出所查圖片的相似圖,以形成遷移連接。
看起來這么神奇的效果,是怎么做到的呢?
核心思想其實(shí)很簡(jiǎn)單:如果你用足夠多的與真實(shí)地點(diǎn)相關(guān)的照片來訓(xùn)練一個(gè)AI系統(tǒng),AI就可以學(xué)會(huì)識(shí)別需要人類花費(fèi)數(shù)年才能掌握的微妙線索。
例如一些城市消防栓上使用的獨(dú)特油漆顏色。雖然這個(gè)細(xì)節(jié)本身并不特別有用,但將其與照片中的可見街道名稱或咖啡店招牌結(jié)合起來,可能就會(huì)讓人更肯定地猜測(cè)出位置。而將這個(gè)過程重復(fù)應(yīng)用于圖像中的數(shù)千個(gè)元素。隨著時(shí)間的推移,AI比人更有效地識(shí)別這些模式。GeoSpy就是利用這一能力,成為了地理定位的強(qiáng)大工具。
進(jìn)階版的GeoSpy:Superbolt
Superbolt是GeoSpy的高端產(chǎn)品GeoSpy Pro的關(guān)鍵組件。GeoSpy Pro融合了Superbolt視覺位置識(shí)別(VPR)的高精度與GeoSpy的照片估算技術(shù),打造出的地理定位系統(tǒng)具備以下能力:
- 精準(zhǔn)定位:利用Superbolt的參考數(shù)據(jù)庫(kù),能將圖像匹配精度控制在數(shù)米之內(nèi)。
- 廣泛位置推斷:在缺乏匹配參考數(shù)據(jù)時(shí),也可將位置估算范圍縮小至數(shù)公里以內(nèi)。
Superbolt并非普通的升級(jí),而是地理定位領(lǐng)域的一次范式變革。憑借無可比擬的數(shù)據(jù)集、前沿的嵌入技術(shù)以及精準(zhǔn)的性能,Superbolt助力GeoSpy成為視覺位置識(shí)別與地理定位技術(shù)領(lǐng)域的領(lǐng)軍者。
Superbolt首先是用4600萬張全球分布的街景圖像大規(guī)模數(shù)據(jù)集,訓(xùn)練出一個(gè)SOTA嵌入模型。接著與覆蓋全球城市的大規(guī)模參考數(shù)據(jù)庫(kù)相結(jié)合,最終使得Superbolt成為地理定位技術(shù)的一次突破性進(jìn)步。
Superbolt在視覺地點(diǎn)識(shí)別領(lǐng)域取得突破,原因如下:
- 穩(wěn)健性:它對(duì)相機(jī)角度變化、光照條件,甚至因翻新、新涂漆或老化導(dǎo)致的建筑物外觀改變都具有很強(qiáng)的抗性。
- 可擴(kuò)展性:該嵌入模型能夠在保持準(zhǔn)確性的同時(shí)擴(kuò)展到數(shù)十億個(gè)向量,非常適合實(shí)際應(yīng)用場(chǎng)景。
- 高效性:與以往依賴大量向量的頂尖模型不同,Superbolt采用緊湊的嵌入方式。這些較小的向量不僅更節(jié)省內(nèi)存,處理速度也更快,從而能夠?qū)崿F(xiàn)大規(guī)模的實(shí)時(shí)性能。
同時(shí),其私有參考數(shù)據(jù)集也具有以下優(yōu)勢(shì):
- 全球規(guī)模:覆蓋世界上幾乎所有主要城市以及無數(shù)較小的地區(qū),提供廣泛的地理覆蓋范圍。
- 高精度:從街角到地標(biāo),數(shù)據(jù)庫(kù)提供詳細(xì)的嵌入,使精度達(dá)到幾米。
- 動(dòng)態(tài)更新:數(shù)據(jù)庫(kù)持續(xù)更新新鮮圖像,確保其反映現(xiàn)實(shí)世界的變更,如新建筑或更新的標(biāo)志。
這個(gè)豐富的參考數(shù)據(jù)集,與Superbolt的高效嵌入模型相結(jié)合,實(shí)現(xiàn)了無與倫比的地理定位精度和可擴(kuò)展性。
Superbolt的先進(jìn)功能也為眾多應(yīng)用領(lǐng)域開辟了道路,如新聞追蹤、案件破獲等。
隱私還能保得住嗎?
GeoSpy在之前的幾個(gè)月是面向公眾開放的,任何人都能免費(fèi)使用照片定位服務(wù)。
但在發(fā)生了一些隱私安全問題后(非法尾隨跟蹤),GeoSpy暫時(shí)停止開放對(duì)公眾的訪問,轉(zhuǎn)為只面向政府、公安等專業(yè)業(yè)務(wù)平臺(tái)提供定位服務(wù),以助力情報(bào)調(diào)查與案件破獲。
總的來說,GeoSpy在處理地理位置的方式上帶來了一次范式轉(zhuǎn)變。憑借其無與倫比的數(shù)據(jù)庫(kù)、前沿的嵌入技術(shù)和精確的性能,GeoSpy已是視覺地點(diǎn)識(shí)別和地理位置技術(shù)的領(lǐng)導(dǎo)者。
但對(duì)于公眾來講,更為關(guān)鍵的是,企業(yè)需要對(duì)于技術(shù)進(jìn)行負(fù)責(zé)任的發(fā)展,而道德考量也將始終是確保這些強(qiáng)大工具造福社會(huì)又不會(huì)侵害隱私的關(guān)鍵。