自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

為何大數(shù)據(jù)讓人開始懷疑人生

大數(shù)據(jù)
一年多前聽說了“大數(shù)據(jù)”這個(gè)詞,以為就是“數(shù)據(jù)大”的意思,隨著媒體不斷地曝光,以及今年阿爾法狗升級(jí)版橫掃當(dāng)今圍棋第一人年輕的柯潔之后,對(duì)“大數(shù)據(jù)”的好奇油然而生。

[[202582]]

《 大數(shù)據(jù)時(shí)代》,維克托·邁爾·舍恩伯格、肯尼思·庫克耶著,盛楊燕、周濤譯,浙江人民出版社

一年多前聽說了“大數(shù)據(jù)”這個(gè)詞,以為就是“數(shù)據(jù)大”的意思,隨著媒體不斷地曝光,以及今年阿爾法狗升級(jí)版橫掃當(dāng)今圍棋第一人年輕的柯潔之后,對(duì)“大數(shù)據(jù)”的好奇油然而生。

于是從書櫥里翻出來這本由舍恩伯格寫的“大數(shù)據(jù)時(shí)代”,不指望自己能夠讀懂讀通,但是讀總比不讀要強(qiáng),遵循“開卷有益”的傳統(tǒng)吧。

 

 

 

 

今天讀的是引言部分。這本書號(hào)稱“一場(chǎng)生活、工作與思維的大變革”。本書開門見山地說明,大數(shù)據(jù)在變革公共衛(wèi)生,變革商業(yè)以及變革思維方面,已經(jīng)出現(xiàn)在我們的生活當(dāng)中了。大數(shù)據(jù)開啟時(shí)代轉(zhuǎn)型。

“大數(shù)據(jù)時(shí)代”舉了一個(gè)在流行疾病防控的例子。說谷歌公司通過5000萬條最頻繁檢索的詞條,與流行病流行傳播時(shí)期的數(shù)據(jù)進(jìn)行了比較,通過分析人們搜索的記錄來判斷這些人是否患上了流感。

谷歌的研究人員去找到這些特定的檢索詞條,至于這些詞條是否必須是“咳嗽”“發(fā)熱藥物”不是關(guān)注重點(diǎn),這同我們尋找事發(fā)原因的常用手法不同,他們關(guān)心的是這些特定檢索詞條的被使用頻率與流感在時(shí)間與空間上的傳播之間的聯(lián)系。

谷歌公司正好是一個(gè)其他公司都無法具備擁有的龐大數(shù)據(jù)源以及處理能力和統(tǒng)計(jì)技術(shù)的公司,他們找到了這45個(gè)檢索詞條組合,他們的預(yù)測(cè)結(jié)果的相關(guān)性高達(dá)97%,同疾控中心一樣也能判斷它從哪里傳播出來,關(guān)鍵是相當(dāng)及時(shí),可比疾控中心早一兩周,這一兩周時(shí)間的金貴可想而知。

另一個(gè)是在商業(yè)運(yùn)用的例子。一位計(jì)算機(jī)工程師在網(wǎng)上預(yù)訂機(jī)票,坐上飛機(jī)后,他發(fā)現(xiàn)他的左鄰右舍機(jī)票都比他訂的晚,卻比他便宜。

顛覆了他的“機(jī)票訂的愈早愈便宜”的概念。下了飛機(jī)后,他開發(fā)了一個(gè)預(yù)測(cè)機(jī)票價(jià)格的系統(tǒng)。這個(gè)系統(tǒng)不需要知道哪些因素導(dǎo)致了機(jī)票價(jià)格的波動(dòng)。

比如“周六晚上不出門”之類的原因,比如季節(jié)性原因,比如還有很多座位沒賣掉的原因。這個(gè)系統(tǒng)只是通過其他航班的數(shù)據(jù)來預(yù)測(cè)未來機(jī)票價(jià)格的趨勢(shì)。

幫助消費(fèi)者抓住最佳購買時(shí)機(jī)。它擁有每一條航線每一架飛機(jī)內(nèi)的每一個(gè)座位一年內(nèi)的綜合票價(jià)的記錄的數(shù)據(jù),海量的數(shù)據(jù)支持,為消費(fèi)者節(jié)省了一大筆錢。

這些例子告訴我們都需要海量的數(shù)據(jù)支持以及存儲(chǔ)與處理能力,在五年前或十年前“這都是不可能的”,從這個(gè)角度講,我的理解大數(shù)據(jù)就是數(shù)據(jù)大。

大數(shù)據(jù)的意義并不僅在于此,它是有生命力的。通常數(shù)據(jù)使用之后就結(jié)束了他的使命,比如,飛機(jī)降落后,票價(jià)數(shù)據(jù)就沒有用了。

但它被收集起來,用于機(jī)票預(yù)測(cè)系統(tǒng)。死了的,沒用的數(shù)據(jù),可以被巧妙地用來激發(fā)新產(chǎn)品和新型服務(wù)。

可見只要你改變思維,了解數(shù)據(jù)的奧秘,而數(shù)據(jù)只為那些愿意聆聽的人所掌握。所以,大數(shù)據(jù)真正的含義,就是從那些從“靜止的,陳舊的”數(shù)據(jù)中獲得新的認(rèn)知,并創(chuàng)造出新價(jià)值。

從信息爆炸的二十世紀(jì)以來,隨著數(shù)據(jù)處理能力的爆發(fā)式增長,大數(shù)據(jù)時(shí)代的到來已經(jīng)無可回避。

大數(shù)據(jù)的核心是什么?作者告訴我們是預(yù)測(cè)。它有點(diǎn)類似人工智能(機(jī)器學(xué)習(xí)),在書中,預(yù)測(cè)被定義為把算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)測(cè)事情發(fā)生的可能性。

好吧,在之后的章節(jié)或許會(huì)解釋得更清楚。但從人機(jī)大戰(zhàn)的情況來看,阿爾法狗每一步棋的海量運(yùn)算后都會(huì)給出一個(gè)勝率,自動(dòng)找出一個(gè)最好的下法。

沒讀這本書前,我會(huì)把大數(shù)據(jù)與人工智能當(dāng)做兩個(gè)事情,現(xiàn)在看來人工智能只是大數(shù)據(jù)這頂王冠上的一顆明珠,二而一。

引言的最后一部分講的是“大數(shù)據(jù)是大挑戰(zhàn)”。大挑戰(zhàn),挑戰(zhàn)的是什么?我看就是挑戰(zhàn)我們過去的傳統(tǒng)思維,固有思維,只有變革思維才能適應(yīng)大數(shù)據(jù)時(shí)代的到來。

書中說到三個(gè)轉(zhuǎn)變,第一個(gè)轉(zhuǎn)變隨機(jī)采樣趨于死亡;第二個(gè)轉(zhuǎn)變數(shù)據(jù)之大追求精確度失去意義;第三個(gè)轉(zhuǎn)變不再熱衷尋找因果關(guān)系。

前兩個(gè)轉(zhuǎn)變依賴于高度發(fā)展的數(shù)據(jù)儲(chǔ)存能力與處理能力,我們尚能理解并主動(dòng)地去適應(yīng),但第三個(gè)轉(zhuǎn)變卻想當(dāng)頭棒喝,我腦海里只有一個(gè)詞“第三只眼看世界”,已經(jīng)不是換角度看世界那么簡單了。

書中舉了兩個(gè)例子來說明,大數(shù)據(jù)只告訴我們“是什么”而不是“為什么”。比如機(jī)票的例子,你只要知道什么時(shí)候買最便宜,無須知道價(jià)格漲跌背后的原因;比如有幾百萬條醫(yī)療記錄顯示“橙汁+阿司匹林”的組合能治療癌癥,找出具體的藥理機(jī)制就沒有這種治療方法本身來得重要。

可怕就在于不必知道現(xiàn)象背后的原因,只要讓數(shù)據(jù)發(fā)聲。讓數(shù)據(jù)發(fā)聲,意味著數(shù)據(jù)成了主導(dǎo),然而我們不一定了解自己的數(shù)據(jù),即便有了數(shù)據(jù),有了數(shù)據(jù)商業(yè)資本,它還會(huì)讓我們陷入一種尋寶的游戲。 

責(zé)任編輯:龐桂玉 來源: 36大數(shù)據(jù)
相關(guān)推薦

2020-11-01 17:00:04

重載重寫java

2018-01-10 14:30:40

2017-11-20 08:13:26

大數(shù)據(jù)大數(shù)據(jù)技術(shù)數(shù)據(jù)

2012-11-08 09:32:24

2022-07-27 11:26:56

Linux

2022-07-27 14:26:27

算法服務(wù)器

2017-09-28 09:46:56

5G通信互聯(lián)

2013-04-01 09:03:50

IT大數(shù)據(jù)IBM

2020-12-04 08:34:08

數(shù)據(jù)分析 數(shù)據(jù)處理 效率

2016-03-14 13:53:52

華為/大數(shù)據(jù)

2013-03-11 09:55:52

大數(shù)據(jù)中數(shù)據(jù)

2025-01-03 11:42:36

2014-06-19 09:49:26

大數(shù)據(jù)

2009-07-21 14:47:30

it失業(yè)

2013-03-05 13:46:46

IDC歐洲企業(yè)大數(shù)據(jù)

2017-04-20 13:35:53

大數(shù)據(jù)信息化私有云

2014-09-30 16:24:47

大數(shù)據(jù)華為

2013-03-07 09:38:53

歐洲大數(shù)據(jù)IDC

2013-03-20 11:03:05

大數(shù)據(jù)

2019-06-21 15:23:08

Python面試題代碼
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)