自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

怎樣才能更好地利用大數(shù)據(jù)?

系統(tǒng)
大數(shù)據(jù)正在日漸成為主流,但我們?nèi)匀挥斜匾獜墓韫葦?shù)據(jù)科學(xué)家們那里學(xué)習(xí)一些經(jīng)驗教訓(xùn),畢竟他們的業(yè)務(wù)是依賴于業(yè)務(wù)數(shù)據(jù)而生存的。如何更好地利用大數(shù)據(jù)?本文給出了幾點建議。

  【編者按】大數(shù)據(jù)正在日漸成為主流,但我們?nèi)匀挥斜匾獜墓韫葦?shù)據(jù)科學(xué)家們那里學(xué)習(xí)一些經(jīng)驗教訓(xùn),畢竟他們的業(yè)務(wù)是依賴于業(yè)務(wù)數(shù)據(jù)而生存的。雖然它們的使用的案例并不總是符合傳統(tǒng)行業(yè),但他們?nèi)匀徽莆樟舜罅康目茖W(xué)和技術(shù)可以幫助大數(shù)據(jù)領(lǐng)域的新人免受許多挫折。如何更好地利用大數(shù)據(jù)?以下有幾點建議:

  1、Hadoop不是萬能的。現(xiàn)在,這應(yīng)該是一條常識了,但他還是值得反復(fù)的強調(diào)。ChoozOn公司的CTO烏薩馬?法耶德在強調(diào)這一點時表示,甚至連雅虎——法耶德的前雇主(他曾擔(dān)任雅虎的首席數(shù)據(jù)官)也經(jīng)歷了慘痛的教訓(xùn)。他說,雅虎曾試圖利用Hadoop對客戶進(jìn)行一些先進(jìn)的細(xì)分,但卻發(fā)現(xiàn)利用一種比較傳統(tǒng)的數(shù)據(jù)庫架構(gòu)來處理這一特別的工作量的成本要少50倍。在他們意識到這一問題后,該項目最終被停止了。然后他們重新啟動了nPario分析項目。目前,雅虎是一位付費的nPario客戶。

2、大數(shù)據(jù)使得數(shù)據(jù)科學(xué)更容易。我發(fā)現(xiàn)這一個更富有啟發(fā)性的見解,這在很大程度上要歸功于丹尼爾?維森塔爾,sparked.com網(wǎng)站的首席科學(xué)家,該網(wǎng)站如此清楚地界定了大數(shù)據(jù)和數(shù)據(jù)科學(xué)概念之間有時重疊的狀況。他解釋說,基本上,諸如支持向量機和神經(jīng)網(wǎng)絡(luò)技術(shù)是經(jīng)過了時間的考驗的,證明方法便是“從你的數(shù)據(jù)集中摘取每一盎司的信息,即使這些數(shù)據(jù)集很小,但技術(shù)是非常復(fù)雜的,他們難以解釋,往往超出規(guī)模。”

  然而,大數(shù)據(jù)讓數(shù)據(jù)科學(xué)家可以使用簡單的建模技術(shù),如決策樹和回歸分析,得以確保了大量的數(shù)據(jù)的準(zhǔn)確性(統(tǒng)計意義上的準(zhǔn)確性)而不是采用一個超復(fù)數(shù)算法。而且,維森塔爾指出,使用Hadoop等通用的大數(shù)據(jù)技術(shù)手段,數(shù)據(jù)科學(xué)家可以更快的開發(fā)和測試模型,因為他們的基礎(chǔ)設(shè)施不用調(diào)整到一個特定的算法或問題類型,其設(shè)計可以很好的執(zhí)行大數(shù)據(jù)集。

  3、“有時候了解哪些需要被干掉更為重要。”軟件即服務(wù)的先驅(qū)Salesforce.com使用大數(shù)據(jù)平臺以監(jiān)測吸收,使用各種特性的產(chǎn)品。其產(chǎn)品主管納拉揚?巴拉德瓦說,我們的目標(biāo)不僅僅是只能預(yù)測下一代產(chǎn)品的新的功能。相反,他解釋說,使用數(shù)據(jù),他們可以確定什么功能沒有價值,無法幫助Salesforce.com這樣的公司把資源轉(zhuǎn)化為更有價值的功能。“有時候,了解哪些需要被干掉更為重要。”他說。

  巴拉德瓦沒有針對這一點進(jìn)一步解釋,但下一個步驟是分析特點、功能、執(zhí)行效果似乎是合乎邏輯的,而不是從設(shè)計的角度來看。

4、相關(guān)內(nèi)容增加價值。換句話說,如果用戶知道了他們?yōu)槭裁幢煌扑]了一個特定的內(nèi)容、要約或建議,他們會更容易覺察出來。作為StumbleUpon的一名高級數(shù)據(jù)科學(xué)家,他解釋說,他所在的公司投入了巨資在大數(shù)據(jù)技術(shù)方面,就是為了將大多數(shù)的相關(guān)網(wǎng)頁內(nèi)容展示在每個用戶面前,但他們知道期望這些用戶只信任服務(wù)的判斷是不夠的。Sparked.com的維森塔爾在談話中提出了類似的觀點,并指出諸如Pandora和Netflix的服務(wù)之所以流行,部分原因就在于他們實際上在建議類似的內(nèi)容的同時,也告訴了用戶關(guān)于自己的東西。

  5、交易數(shù)據(jù)勝過搜索數(shù)據(jù)。PayPal的首席科學(xué)家MokOh,討論了從開始購買的產(chǎn)品搜索到結(jié)束的一連串的事件,以及它是如何變得越來越困難。當(dāng)你確定信號鏈從一端開始,并要在其他端口工作。PayPal正試圖抹掉這一差距,但是,通過從交易過程和使用其出售的其他數(shù)據(jù)(包括內(nèi)部和從外部來源,如Facebook和GNIP),試圖找出其真正的客戶和客戶真正想要的。他認(rèn)為這要比谷歌試圖通過搜索來跟蹤用戶購買行為要容易。當(dāng)然,除非他們使用諸如谷歌錢包來實際購買的東西。

責(zé)任編輯:黃丹 來源: 機房360
相關(guān)推薦

2023-01-09 08:39:38

因果推斷機器學(xué)習(xí)

2021-05-18 17:55:29

SaaS軟件

2012-12-27 14:11:21

簡歷應(yīng)屆畢業(yè)生

2010-09-02 09:44:16

室外WLAN

2009-07-06 18:24:51

IT資產(chǎn)運維管理廣通信達(dá)科技

2011-07-15 16:57:43

AJAX

2015-07-01 16:11:30

數(shù)據(jù)人才數(shù)據(jù)

2015-12-03 10:14:04

2014-12-11 10:09:59

Java 8

2020-04-10 09:07:09

BEC商業(yè)郵件欺詐網(wǎng)絡(luò)釣魚

2022-04-27 10:07:02

Linux文檔命令

2024-10-14 14:47:58

2015-01-08 10:20:13

私有云公有云云管理

2010-03-15 11:47:11

網(wǎng)絡(luò)安全

2017-04-05 06:40:32

科技新聞早報

2018-07-16 12:36:48

編程語言PythonJava

2022-03-25 08:34:57

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT

2023-12-26 09:58:37

數(shù)據(jù)存儲非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)管理

2013-11-22 09:35:07

電信企業(yè)大數(shù)據(jù)

2020-02-28 15:37:58

架構(gòu)運維技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號