自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

QCon2014姜小凡:物理世界的數(shù)據(jù)越來越有價(jià)值

移動開發(fā)
在QCon北京2014大會上,姜小凡將就《PM2.5的大數(shù)據(jù)分析》為題分享,詳解如何將廉價(jià)的傳感器與云端數(shù)據(jù)結(jié)合實(shí)現(xiàn)PM2.5分析的。

二月下旬,北京迎來一輪漫長的霧霾天氣,京東上許多空氣凈化器脫銷,淘寶上3M口罩漲價(jià)不少,微博、微信上也流傳著各種應(yīng)對PM2.5的偏方。在未 來的日子,我們不得不繼續(xù)PM2.5問題。2013年,姜小凡和他的團(tuán)隊(duì)開發(fā)了一款成本200多元的PM2.5檢測設(shè)備——PAM(便攜式個人空氣質(zhì)量監(jiān) 測儀)。PAM***的特點(diǎn)是成本低。同時(shí),PAM考慮了地理信息、氣候因素,并且通過機(jī)器學(xué)習(xí)的方式處理這些數(shù)據(jù),建立模型,模型進(jìn)一步修正數(shù)據(jù),保證數(shù) 據(jù)精確性。

QCon北京2014大會上,姜小凡將就《PM2.5的大數(shù)據(jù)分析》為題分享,詳解如何將廉價(jià)的傳感器與云端數(shù)據(jù)結(jié)合實(shí)現(xiàn)PM2.5分析的。日前,InfoQ對姜小凡進(jìn)行了專訪,以下為采訪內(nèi)容:

InfoQ:姜小凡你好,向InfoQ的讀者和QCon的參會者介紹下自己吧。

姜小凡:我是Intel物聯(lián)技術(shù)研究院的***構(gòu)架師,也是Intel研究院的主任研究員。最早我在伯克利讀本科 和博士,期間開始接觸物聯(lián)網(wǎng)這個方向,做了一些無線傳感器網(wǎng)絡(luò)和樓宇能源監(jiān)測及管理的項(xiàng)目。在博士期間我也做了一些能源控制的startup,并也在美國 的Google做了一些MIMO通信的研究。畢業(yè)之后我加入了微軟亞洲研究院,那時(shí)候我主要研究移動互聯(lián)網(wǎng)、室內(nèi)定位等。2012年底我再次加入了 Intel,為什么說我再次加入呢,是因?yàn)槲冶究飘厴I(yè)的時(shí)候,在加州那邊的英特爾也工作過一段時(shí)間。自2012年底到現(xiàn)在,我們對很多領(lǐng)域的技術(shù)進(jìn)行了探 討,并對其中一些進(jìn)行了深入研究。其中一個項(xiàng)目是利用物聯(lián)網(wǎng)和大數(shù)據(jù)手段做空氣質(zhì)量檢測,如PM2.5和霧霾。

InfoQ:目前你關(guān)注的重點(diǎn)是什么?

姜小凡:把物聯(lián)網(wǎng)技術(shù)真正應(yīng)用到生活中,把技術(shù)真正推向市場并解決一些問題,是我們研究院所有人共同的目標(biāo),也 是我們關(guān)注的重點(diǎn)。對于我個人來說,剛剛說的PM2.5和霧霾問題是我目前一個很重要的關(guān)注點(diǎn)?,F(xiàn)在有各種手段做PM2.5監(jiān)測,但是這些方式要么非常昂 貴,要么很不精確。而我們利用比較廉價(jià)的傳感器網(wǎng)絡(luò)能實(shí)時(shí)的把顆粒物的數(shù)據(jù)傳到云端,同時(shí)收集了不同維度的其他數(shù)據(jù),包括氣象數(shù)據(jù),人的位置數(shù)據(jù)等,將這 些數(shù)據(jù)融合在一起。***用機(jī)器學(xué)習(xí)的方式處理這些數(shù)據(jù),找到他們之間的關(guān)系,學(xué)習(xí)出不同維度數(shù)據(jù)互相的影響。通過這種方式,在云端做了空氣模型,再通過這 個模型增加數(shù)據(jù)的精確性。我認(rèn)為這是一個非常經(jīng)典的物聯(lián)網(wǎng)和大數(shù)據(jù)的結(jié)合的項(xiàng)目,也希望能夠向QCon的聽眾介紹這個項(xiàng)目。

當(dāng)然我們不僅僅有空氣質(zhì)量方向的研究,我們也做一些可以快速應(yīng)用的項(xiàng)目,我可以列舉幾個。如手機(jī)驗(yàn)真?,F(xiàn)在國內(nèi)的手機(jī)是有很多是仿品,怎么用數(shù)據(jù)和 眾包的方式自動檢測到手機(jī)的真?zhèn)??這就涉及到手機(jī)硬軟件的“指紋”收集,我們在云端建立了一個比較大的數(shù)據(jù)庫,能收集到很多款A(yù)ndroid手機(jī)的指紋。 不同的操作系統(tǒng),不同的軟件版本會生成不同的指紋,通過指紋的方式非常簡單的告訴消費(fèi)者,你買的手機(jī)是正品還是仿品。

在室內(nèi)定位方面,我們和海龍大廈合作,通過無線信號指紋的手段定位。這樣,我們知道某個消費(fèi)者時(shí)時(shí)的精確位置?;谖恢眯畔?,可以給消費(fèi)者提供一些幫助,比如說室內(nèi)導(dǎo)航,廣告的推送。

此外還有一些其他的項(xiàng)目,包括我們在公交車做了人流的監(jiān)測和預(yù)測,希望解決交通擁堵的問題?;旧衔覀儸F(xiàn)在都是比較實(shí)際的問題,希望用大數(shù)據(jù)、云計(jì)算的手段去解決這些問題,而不是花更多的錢去買一個更精確的傳感器。我認(rèn)為這是一個正確的方向。

InfoQ:海龍大廈室內(nèi)定位是通過WiFi信號實(shí)現(xiàn)的嗎?

姜小凡:是通過WiFi,這個技術(shù)在學(xué)術(shù)界已經(jīng)有不少論文,但我們還沒有看到很多真正的商業(yè)應(yīng)用。我們這里要做 的,不是去發(fā)論文討論如何實(shí)現(xiàn),或是如何添加一個什么創(chuàng)意來改進(jìn),而是真正將WiFi室內(nèi)定位推進(jìn)到應(yīng)用的層面,我們知道任何一個實(shí)驗(yàn)室技術(shù)和真正實(shí)用化 相比還有很大差距的,面對的問題也有很大區(qū)別。實(shí)驗(yàn)室關(guān)注的是可行性,可以對很多條件進(jìn)行限定;但實(shí)際上很多條件是不可預(yù)知的,實(shí)際應(yīng)用有太多的細(xì)節(jié)和技 術(shù)難關(guān)需要解決。

InfoQ:在過去一年當(dāng)中,你觀察到數(shù)據(jù)行業(yè)有哪些變化?

姜小凡:開始的時(shí)候,大家都覺得大數(shù)據(jù)要像亞馬遜、沃爾瑪、Google這些公司那樣收集了很多信息,然后通過 模型或分析找到可利用的信息。很多人把大數(shù)據(jù)和Hadoop之類的技術(shù)劃上等號,拿數(shù)據(jù)量來標(biāo)榜大數(shù)據(jù)。而我的看法卻不同,我認(rèn)為大家越來越關(guān)注小數(shù)據(jù)的 集合,為什么呢?之前一般直接從互聯(lián)網(wǎng)提取數(shù)據(jù),但是近一兩年,看到的是很多物理世界的數(shù)據(jù),比如手機(jī)里的加速度傳感器的數(shù)據(jù),GPS數(shù)據(jù),PM2.5數(shù) 據(jù)。這些和物理世界相關(guān)的數(shù)據(jù)越來越多,而且越來越有價(jià)值。我認(rèn)為我們會漸漸把大數(shù)據(jù)的概念擴(kuò)展,把空間信息、地理位置信息等meta data都加入進(jìn)去。而我們更關(guān)注的不是數(shù)據(jù)本身,而是數(shù)據(jù)之間的關(guān)系和它們的相互作用。建立數(shù)據(jù)之間的關(guān)系是有難度的,處理起來也更加復(fù)雜。如在實(shí)時(shí)系 統(tǒng)中,留給數(shù)據(jù)分析和反饋至前端的時(shí)間也許只有10毫秒,如何利用流處理和系統(tǒng)優(yōu)化來達(dá)到,這是我們需要深入研究的。

InfoQ:你怎么理解大數(shù)據(jù)處理與大數(shù)據(jù)應(yīng)用?

姜小凡:大數(shù)據(jù)處理方面,大家都認(rèn)為大數(shù)據(jù)應(yīng)該在云端做,但我覺得數(shù)據(jù)的處理應(yīng)該是分布式的,我指的不僅是數(shù)據(jù) 中心分散計(jì)算能力,而是數(shù)據(jù)應(yīng)該在最利于處理的地方處理。比如,如果需要把所有數(shù)據(jù)以原始的狀態(tài)發(fā)送到云端處理,對網(wǎng)絡(luò)的壓力是非常大的。所以我認(rèn)為大數(shù) 據(jù)處理,可以在例如手表之類的地方處理再發(fā)送到云端,比如視頻數(shù)據(jù)會在攝像頭內(nèi)做一些特征提取,然后再把特征發(fā)送到云端。

大數(shù)據(jù)應(yīng)用有一些經(jīng)典的例子,比如通過數(shù)據(jù)分析知道用戶在某一時(shí)間點(diǎn)喜歡購買的商品,超市可以通過預(yù)測來提前訂貨。在移動應(yīng)用方面,剛才提到了在海龍大廈的室內(nèi)定位就是其中之一。

InfoQ:您曾經(jīng)說過,希望把PAM傳感器的價(jià)格降到兩三百元人民幣,這個目標(biāo)還需要多久才能實(shí)現(xiàn)?

姜小凡:這個目標(biāo)在有一定生產(chǎn)量的前提下已經(jīng)實(shí)現(xiàn)了。具體生產(chǎn)量是多少,我們還在進(jìn)行核算,不過這個量應(yīng)該不是很大。

InfoQ:通過大量廉價(jià)的傳感器搜集數(shù)據(jù)是未來實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的有效手段嗎?這其中的難點(diǎn)在哪兒?

姜小凡:這里的挑戰(zhàn)包括數(shù)據(jù)的可用性,精確性,以及把數(shù)據(jù)提取到云端的過程耗費(fèi)的系統(tǒng)資源。以WiFi定位為 例,原理上大家都理解,通過收集某一點(diǎn)的3個AP的信號強(qiáng)度,用三角定位實(shí)現(xiàn)。但在真實(shí)環(huán)境,無線信號波動非常大,遮擋物會改變信號強(qiáng)度,信號可能被反射 和散射 ,造成信號強(qiáng)度衰減或者增遞。物理世界的傳感器數(shù)據(jù),并沒有互聯(lián)網(wǎng)數(shù)據(jù)那么干凈,需要大量的處理把傳感器數(shù)據(jù)變成可用的數(shù)據(jù)。

責(zé)任編輯:閆佳明 來源: infoq
相關(guān)推薦

2012-05-04 11:13:57

社交應(yīng)用

2014-04-16 14:05:39

QCon2014

2014-04-16 14:07:20

QCon2014

2014-04-16 14:13:18

2014-04-16 13:55:20

2014-04-16 14:21:58

2014-04-16 14:26:08

QCon2014

2014-08-06 14:09:43

2014-04-16 14:29:52

QCon2014

2014-04-16 14:03:06

QCon2014

2021-03-03 14:23:06

微信小程序互聯(lián)網(wǎng)

2022-05-09 17:09:03

云計(jì)算品高云

2014-04-16 14:15:01

QCon2014

2022-10-19 09:49:15

數(shù)字化轉(zhuǎn)型數(shù)據(jù)中心

2017-05-10 20:57:32

2017-02-14 14:07:08

2012-08-20 10:49:13

編程

2022-12-13 11:13:34

數(shù)據(jù)傳感器

2021-03-22 16:02:47

程序員大數(shù)據(jù)軟件

2017-12-26 15:34:55

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號