自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

數(shù)據(jù)科學(xué)項(xiàng)目失敗的八個(gè)原因

大數(shù)據(jù) 數(shù)據(jù)分析
事實(shí)上,利用科學(xué)方法、流程、算法和技術(shù)系統(tǒng)從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲取各種見解的數(shù)據(jù)科學(xué)項(xiàng)目可能會(huì)以多種方式失敗,從而導(dǎo)致時(shí)間、金錢和其他資源的浪費(fèi)。

 [[408026]]

如今,數(shù)據(jù)科學(xué)幾乎都會(huì)引起IT和業(yè)務(wù)主管們的興趣。但數(shù)據(jù)科學(xué)確實(shí)會(huì)出問題。

事實(shí)上,利用科學(xué)方法、流程、算法和技術(shù)系統(tǒng)從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中獲取各種見解的數(shù)據(jù)科學(xué)項(xiàng)目可能會(huì)以多種方式失敗,從而導(dǎo)致時(shí)間、金錢和其他資源的浪費(fèi)。存在缺陷的項(xiàng)目可能會(huì)導(dǎo)致決策者誤入歧途,從而導(dǎo)致企業(yè)遭受的損害大于收益。

以下是數(shù)據(jù)科學(xué)項(xiàng)目未能如預(yù)期那樣成功的一些最常見原因。

數(shù)據(jù)質(zhì)量差

不良數(shù)據(jù)會(huì)導(dǎo)致數(shù)據(jù)科學(xué)工作變得很糟糕,因此花時(shí)間來確保數(shù)據(jù)的質(zhì)量,這是至關(guān)重要的。任何分析工作都是如此,數(shù)據(jù)科學(xué)當(dāng)然也是如此。

“不良數(shù)據(jù)或廢數(shù)據(jù)會(huì)使數(shù)據(jù)科學(xué)項(xiàng)目無法完成,”數(shù)字化轉(zhuǎn)型咨詢公司 Adaptavist的首席信息官尼爾•萊利(Neal Riley)說。“您必須確保自己的數(shù)據(jù)是干凈的,并適合于數(shù)據(jù)分析師使用。如果并非如此,那就完全是浪費(fèi)時(shí)間。”

當(dāng)企業(yè)在數(shù)據(jù)科學(xué)項(xiàng)目中使用不干凈的數(shù)據(jù)時(shí),他們最終將“看到會(huì)產(chǎn)生奇怪輸出的模型,(并且)會(huì)看到該輸出并沒有代表實(shí)際情況或沒有表現(xiàn)出使事情變得更好的一個(gè)過程,”萊利說。

有時(shí),由于數(shù)據(jù)集中存在偏差或差異,所以數(shù)據(jù)質(zhì)量很差。

“對(duì)于某些組織來說,他們會(huì)使用多個(gè)系統(tǒng)來運(yùn)營業(yè)務(wù),”全球公共機(jī)構(gòu)雇員保險(xiǎn)(WAEPA)公司的首席信息官布蘭登•瓊斯(Brandon Jones)說。“對(duì)于經(jīng)驗(yàn)豐富的企業(yè)來說,您甚至可能仍會(huì)使用一些遺留系統(tǒng),以供參考或驗(yàn)證。在許多情況下,業(yè)務(wù)會(huì)隨著每個(gè)系統(tǒng)的不同而發(fā)生變化,因此導(dǎo)致在業(yè)務(wù)中計(jì)算某一指標(biāo)的流程和/或方法存在差異。”

瓊斯表示,這可能是導(dǎo)致數(shù)據(jù)科學(xué)出現(xiàn)問題的主要原因。由于基于更改后的業(yè)務(wù)流程進(jìn)行了重復(fù)計(jì)算,從而其結(jié)果可能會(huì)被夸大。“為了解決這個(gè)問題,各個(gè)組織必須統(tǒng)一設(shè)置他們的數(shù)據(jù)分析程序,”他說。“這意味著要列出一個(gè)可以驗(yàn)證數(shù)據(jù)的具體日期,并且每個(gè)人都清楚和認(rèn)同這是他們組織進(jìn)行工作的通用標(biāo)準(zhǔn)。”

對(duì)要解決的問題沒有明確定義

如果團(tuán)隊(duì)成員不了解他們?cè)噲D解決的業(yè)務(wù)問題,那么數(shù)據(jù)科學(xué)項(xiàng)目如何能成功完成?然而,當(dāng)數(shù)據(jù)科學(xué)團(tuán)隊(duì)在開展某些項(xiàng)目時(shí),他們有時(shí)就會(huì)遇到這一問題。

網(wǎng)絡(luò)安全公司Kenna Security的首席數(shù)據(jù)科學(xué)家邁克爾•羅伊特曼(Michael Roytman)表示:“定義某一問題的過程通常是數(shù)據(jù)科學(xué)家的工作,而實(shí)際上,定義某一問題(包括)多種業(yè)務(wù)情況,既涉及確定工作范圍,又涉及界定潛在的投資回報(bào)。”

醫(yī)療咨詢公司Impact Advisors的高級(jí)顧問兼虛擬首席信息官馬克•約翰遜(Marc Johnson)表示,希望利用數(shù)據(jù)科學(xué)的業(yè)務(wù)用戶需要就他們想要解決的問題提出一些探索性問題。

“就像任何項(xiàng)目一樣,花時(shí)間來鎖定問題的范圍以找到數(shù)據(jù)的正確來源,”約翰遜說。“幾年前,有人讓我為一家擁有20年歷史的公司設(shè)計(jì)一款分析產(chǎn)品。沒有對(duì)客戶群進(jìn)行研究,以了解該產(chǎn)品是否有市場(chǎng)。沒有明確客戶想要查看該分析結(jié)果的一些指標(biāo)。這一切都是基于競(jìng)爭(zhēng)對(duì)手聲稱其擁有某一分析產(chǎn)品,以及客戶想要該產(chǎn)品的傳聞。”

約翰遜表示,這個(gè)項(xiàng)目在毫無方向的情況下消磨了兩年,“因?yàn)閷?duì)于我們?cè)噲D解決的問題定義太模糊。”

缺乏相關(guān)數(shù)據(jù)

數(shù)據(jù)科學(xué)工作必然出問題的另一方式是不提供解決某一特定問題所需的特定類型數(shù)據(jù)。

對(duì)某一問題提供大量數(shù)據(jù)并不能解決問題。“有一種想法是,大數(shù)據(jù)會(huì)帶來洞察力,但實(shí)際上很少有這種情況,”羅伊特曼說。“適合的、定制的且通常較小的數(shù)據(jù)集常常會(huì)帶來完善的和可歸納的模型。”

約翰遜表示,為了從數(shù)據(jù)科學(xué)中獲得價(jià)值,您應(yīng)該不斷努力從最相關(guān)的來源收集數(shù)據(jù)。“創(chuàng)造不是一次性活動(dòng),”他說。

約翰遜表示,由于數(shù)據(jù)是從不同來源收集或購買的,因此團(tuán)隊(duì)需要確保在數(shù)據(jù)中的任何修改不會(huì)歪曲其結(jié)果,以及犧牲整個(gè)數(shù)據(jù)集的質(zhì)量。他們還必須確保數(shù)據(jù)集不存在任何隱私、法律或倫理問題。

缺乏數(shù)據(jù)透明度

團(tuán)隊(duì)需要對(duì)他們用于構(gòu)建任何給定模型的數(shù)據(jù)保持透明度。“當(dāng)人們不信任該模型或不理解該解決方案時(shí),數(shù)據(jù)科學(xué)項(xiàng)目就會(huì)失敗,”新澤西州司法機(jī)構(gòu)的首席信息官杰克·麥卡錫(Jack McCarthy)說。“解決這一問題的方法是,您必須能夠‘說明其數(shù)學(xué)原理’,并將其傳達(dá)給可能不具備技術(shù)或統(tǒng)計(jì)技能的利益相關(guān)者。”

數(shù)據(jù)科學(xué)家需要解釋數(shù)據(jù)的來源,他們?yōu)橛?jì)算模型做了什么,并要提供對(duì)所有相關(guān)數(shù)據(jù)的訪問權(quán)。“透明度是項(xiàng)目成功的關(guān)鍵,”麥卡錫說。

這方面的一個(gè)例子是新澤西州所使用的風(fēng)險(xiǎn)評(píng)估算法。“我們會(huì)向所有利益相關(guān)者提供一份報(bào)告,該報(bào)告包含某一被告歷史上的哪些案件屬于哪個(gè)類別,以及每個(gè)案件的評(píng)分方式,”麥卡錫說。“這些內(nèi)容會(huì)提供給所有對(duì)手,因此他們有機(jī)會(huì)查看每個(gè)案件,并可以質(zhì)疑其中包含的內(nèi)容。這一切都是透明的。”

不愿意承認(rèn)研究結(jié)果的不確定性

羅伊特曼表示,有時(shí)需要獲得洞察力的業(yè)務(wù)團(tuán)隊(duì)或數(shù)據(jù)科學(xué)團(tuán)隊(duì)本身根本不愿意承認(rèn)其研究結(jié)果不確定、不清楚或不夠完善,或者甚至無法進(jìn)行業(yè)務(wù)應(yīng)用。

羅伊特曼說:“一個(gè)同樣可接受和有價(jià)值的答復(fù)是,‘該模型不夠好,無法為業(yè)務(wù)帶來投資回報(bào)。”

羅伊特曼表示,Kenna Security公司的數(shù)據(jù)科學(xué)團(tuán)隊(duì)花了兩個(gè)月的時(shí)間構(gòu)建了一個(gè)漏洞分類模型,該模型會(huì)自動(dòng)為某一漏洞生成一個(gè)通用缺陷列表。“該模型很有效;這是對(duì)研究生水平課程問題的一個(gè)很好的答案,”他說。“但對(duì)于我們的客戶而言,它的效果還不夠好,無法帶來價(jià)值。(其)精度太低。所以我們放棄了該項(xiàng)目,盡管我們投入了時(shí)間并取得了成果。”

缺乏執(zhí)行負(fù)責(zé)人

數(shù)據(jù)科學(xué)工作需要一位來自高管層的負(fù)責(zé)人,以確保項(xiàng)目獲得足夠的資源和支持。

“如果他是首席信息官,那么這會(huì)有所幫助,”萊利說。“我們將數(shù)據(jù)科學(xué)視為我們運(yùn)營工作不可或缺的一部分,我已保證要做這方面工作的負(fù)責(zé)人。”他表示,即使首席信息官不是數(shù)據(jù)科學(xué)工作的內(nèi)部負(fù)責(zé)人,他也應(yīng)該負(fù)責(zé)確保所有相關(guān)數(shù)據(jù)的安全。但其參與的工作應(yīng)該遠(yuǎn)遠(yuǎn)超出安全性的范圍。

“充分利用您收集的信息,我認(rèn)為這是現(xiàn)代首席信息官的職責(zé),”萊利說。“憑借手頭上擁有的所有數(shù)據(jù),您就有辦法從中獲得一些東西,并可以合理地使用這些數(shù)據(jù),而首席信息官就可以利用這些東西來幫助其組織內(nèi)各個(gè)職能部門。”

萊利表示,在對(duì)銷售流程制定新策略和做調(diào)整方面,Adaptavist公司從其數(shù)據(jù)科學(xué)工作中獲得了最大收益。“這與我們的產(chǎn)品或IT基礎(chǔ)設(shè)施、營銷都沒有任何關(guān)系。”他說。“從業(yè)務(wù)流程優(yōu)化的角度來看,數(shù)據(jù)科學(xué)對(duì)我們幫助最大,可有助于內(nèi)部銷售人員更好地處理和管理潛在客戶。”

人才短缺

技能缺口困擾著IT工作的諸多方面,數(shù)據(jù)科學(xué)也不例外。許多組織機(jī)構(gòu)根本不具備開展項(xiàng)目或獲取最大價(jià)值的相關(guān)技能。

Beanworks是一家基于云計(jì)算的應(yīng)付賬系統(tǒng)自動(dòng)化提供商,其工程和數(shù)據(jù)業(yè)務(wù)首席信息官Tracy Huitika說:“真正的數(shù)據(jù)科學(xué)家需求量很大,很難找到,而且薪資很高。”“該職位通常需要是物理學(xué)或科學(xué)博士學(xué)位,并且能夠使用R和 Python語言編寫代碼。”

約翰遜表示,數(shù)據(jù)科學(xué)項(xiàng)目失敗(即使項(xiàng)目已經(jīng)開始部署)的最大原因之一是缺乏持續(xù)管理項(xiàng)目的運(yùn)營人才。“讓一位優(yōu)秀的數(shù)據(jù)科學(xué)家創(chuàng)建一個(gè)模型,而沒有持續(xù)改進(jìn)的運(yùn)營計(jì)劃,以及沒有根據(jù)市場(chǎng)和數(shù)據(jù)變化進(jìn)行調(diào)整,這就像設(shè)計(jì)一輛汽車,然后將鑰匙交給一個(gè)10歲的孩子一樣,”他說。

在某一模型投入使用后,企業(yè)需要通過雇傭或利用外部專家(例如精通數(shù)據(jù)科學(xué)的顧問)來獲得適當(dāng)?shù)南嚓P(guān)技能,以對(duì)該模型進(jìn)行維護(hù)。

數(shù)據(jù)科學(xué)不是正確的解決方案

如果某個(gè)特殊問題起初不需要數(shù)據(jù)科學(xué)作為其解決方案,那該怎么辦?這種對(duì)數(shù)據(jù)科學(xué)的錯(cuò)誤使用可能會(huì)導(dǎo)致項(xiàng)目的失敗,因此應(yīng)仔細(xì)考慮何時(shí)該使用以及何時(shí)不該使用數(shù)據(jù)科學(xué)方法、流程和工具。

“導(dǎo)致數(shù)據(jù)科學(xué)項(xiàng)目失敗的最大因素之一是數(shù)據(jù)科學(xué)、算法和機(jī)器學(xué)習(xí)技術(shù)甚至都不是適合的解決方案,”萊利說。

“您可能根本不需要機(jī)器學(xué)習(xí)模型;您可能只是需要回歸分析,然后您可能需要花費(fèi)大量時(shí)間和精力來研究所有不同的排列,而無需使用數(shù)據(jù)科學(xué),”萊利說。 “我們陷入了這樣一種情況,即我們?cè)谘芯拷鹑跀?shù)據(jù)科學(xué)建模,以可視化預(yù)測(cè)我們主要業(yè)務(wù)在未來取得盈利的因素。而事實(shí)證明,其最好的方法就是統(tǒng)計(jì)回歸。”

 

責(zé)任編輯:姜華 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2022-11-17 10:49:52

數(shù)字化轉(zhuǎn)型數(shù)字企業(yè)

2016-12-13 19:40:00

大數(shù)據(jù)

2018-04-09 11:20:40

數(shù)據(jù)科學(xué)項(xiàng)目數(shù)據(jù)

2021-09-15 14:45:57

數(shù)字化轉(zhuǎn)型IT技術(shù)

2022-08-26 14:41:47

Python數(shù)據(jù)科學(xué)開源

2024-12-30 07:47:15

Python科學(xué)計(jì)算

2011-06-29 09:34:59

網(wǎng)站被K

2018-07-23 14:53:44

Python數(shù)據(jù)科學(xué)函數(shù)

2022-08-16 10:32:08

Python數(shù)據(jù)科學(xué)

2022-06-15 14:33:27

大數(shù)據(jù)數(shù)據(jù)宕機(jī)云遷移

2015-09-02 13:15:31

Python

2022-11-23 11:06:43

數(shù)字化轉(zhuǎn)型技術(shù)專家

2022-06-13 09:00:33

React 項(xiàng)目前端

2023-05-03 21:42:02

Github開源項(xiàng)目

2023-11-13 10:11:49

開源前端

2020-07-09 10:26:28

軟件項(xiàng)目軟件開發(fā)CIO

2022-04-29 14:49:27

數(shù)據(jù)質(zhì)量數(shù)據(jù)

2010-09-26 15:37:34

制定數(shù)據(jù)加密項(xiàng)目

2025-01-08 10:17:11

2013-11-01 11:06:33

數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)