數(shù)據(jù)素養(yǎng)的7大判斷標準:看你骨骼清奇,來當數(shù)據(jù)科學家吧!
本文轉(zhuǎn)載自公眾號“讀芯術”(ID:AI_Discovery)。
對于數(shù)據(jù)科學家來講,能否理解數(shù)據(jù)是必須通過的篩選條件,任何先進的算法或復雜的機器學習模型都無法取代人類分析數(shù)據(jù)的優(yōu)勢,一個優(yōu)秀的數(shù)據(jù)科學家必須具備數(shù)據(jù)素養(yǎng)。
企業(yè)每天都要通過分析來處理變化和由此產(chǎn)生的不確定性,這些日常的變化和不確定性使企業(yè)更快地行動,其中發(fā)展迅速卻不冒失的才能成為成功的企業(yè)。數(shù)據(jù)科學家則負責研究場景、分析找出其根本原因、評估替代方案,在最后實施解決方案。企業(yè)越快收集到足夠的數(shù)據(jù)進行調(diào)查,就能越快做出合理的決定,而這就是為什么優(yōu)秀的數(shù)據(jù)科學家必須具備數(shù)據(jù)素養(yǎng)的原因。
數(shù)據(jù)素養(yǎng)在維基百科上的定義是“閱讀、工作、分析和用數(shù)據(jù)說話的能力”。此外,數(shù)據(jù)素養(yǎng)還包括從事與數(shù)據(jù)相關工作的能力。
1. 能夠清晰地表達觀點
你是否能理解所見的事物?是否知道如何將其表述給他人?判斷一個人是否具備數(shù)據(jù)素養(yǎng)的標準是能否清晰表達自己的觀點,不是給出過分復雜化的解釋,而是直擊要害。
阿爾伯特·愛因斯坦曾說:“如果你不能解釋得很淺顯,說明你本身就未完全理解。”“理解”并非指的是明白當下的一切,而是指人們至少可在信息中有所提煉。當人們不是完全明白的時候,他們往往浪費很多篇幅來解釋,只有他們完全理解才能簡述自己的想法。
2. 不會輕易被信息淹沒
圖源:unsplash
數(shù)據(jù)無處不在,人們很容易被它淹沒。
以新冠疫情為例,從疾病的信息、疫情帶來的經(jīng)濟損失到洗手的方法,各個方面信息無處不在。很多人都被這些信息淹沒,甚至難以辨別真假。被信息淹沒的人們會忽視許多重要的事情,也會無法集中注意力。因此,在處理數(shù)據(jù)時,人們需要記住重點問題和信息。
3. 能夠用數(shù)據(jù)說話
當你瀏覽互聯(lián)網(wǎng)上的評論時,會發(fā)現(xiàn)其中很多都是毫無根據(jù)的或是純粹的騙局。這與現(xiàn)實生活沒有太大區(qū)別:許多人只會根據(jù)自己的感受或當下的想法來爭論,但是具備數(shù)據(jù)素養(yǎng)的人則會基于數(shù)據(jù)而不是毫無根據(jù)地爭論。
在商業(yè)領域,數(shù)據(jù)科學家是數(shù)據(jù)驅(qū)動業(yè)務的驅(qū)動者。在數(shù)據(jù)驅(qū)動的企業(yè)中,許多要素需要使人信服,數(shù)據(jù)科學家需要具備數(shù)據(jù)素養(yǎng)來建立合理的論據(jù)。
用數(shù)據(jù)說話比你想象中要困難,它需要理解數(shù)據(jù)并將其清晰表達,信息才能有效傳達。用數(shù)據(jù)說話同樣需要承擔很大的責任,人們需要闡明他們擁有的數(shù)據(jù)符合正確的標準。當數(shù)據(jù)不足時,你最好保留意見。
圖源:unsplash
4. 能夠基于數(shù)據(jù)采取行動
具備數(shù)據(jù)素養(yǎng)的重要性,在于人們可以理解數(shù)據(jù)并基于此采取行動。具備數(shù)據(jù)素養(yǎng)的人即便面對諸多信息,也可以在腦海里處理好這些數(shù)據(jù),并在此基礎上采取行動。
舉一個很常見的例子——在網(wǎng)上購買電腦。因為選擇繁多,所以我們的第一步是判斷所需要的電腦類型。如果是為了游戲,那么你需要通過瀏覽其他人的評論來決定預算范圍內(nèi)最適合游戲的電腦。這一過程就像定義問題(游戲)和范圍(預算)→收集數(shù)據(jù)(評論)→采取行動。別不以為然地認為下單前看看買家秀是基操,很多人甚至懶得收集數(shù)據(jù)!
合理的行動需要專業(yè)知識和業(yè)務洞察力,如果能加上“結(jié)合數(shù)據(jù)”這一步驟,成功率大大上升。
5. 行動迅速而不莽撞
企業(yè)發(fā)展迅速,決策的速度更快,猶豫何時采取行動會讓事情變得不確定。在數(shù)據(jù)較少的情況下過早采取行動無疑是莽撞的,但等待足夠多的數(shù)據(jù)又或許太遲了。擁有數(shù)據(jù)素養(yǎng)意味著能夠決定合適的行動時間,對變化做出快速的反應是數(shù)據(jù)科學家的基本意識。
以約會為例,向一個認識不久的人求婚是魯莽的,但是等待太久才采取行動很可能錯過愛情。人們通過收集關于對方足夠多的信息來是否可以更進一步。“足夠多的信息”可以是任何東西:它可能是對方的價值觀,也可能只是身體特征。如果把它和企業(yè)類比,收集關于企業(yè)“足夠多的信息”是采取行動前必須完成的步驟。
圖源:unsplash
6. 對數(shù)據(jù)感興趣
有些人被數(shù)據(jù)淹沒,但有些人卻直接忽略了數(shù)據(jù)。他們不在乎世界上發(fā)生了什么,也不想去了解最新的信息。在隔離期間,筆者很驚訝地發(fā)現(xiàn)自己的朋友甚至不知道需要通過拭子PCR檢測才能確認是否感染新冠肺炎。
具備數(shù)據(jù)素養(yǎng)的人會對數(shù)據(jù)感興趣。這并不是說他們需要在任何地方挖掘數(shù)據(jù),但最起碼他們想隨時了解最新情況。筆者認識的具備數(shù)據(jù)素養(yǎng)的人總是對數(shù)據(jù)可視化感興趣。他們對數(shù)據(jù)感興趣,并不斷追求如何以最完美的形式呈現(xiàn)數(shù)據(jù),他們希望通過展示恰當?shù)臄?shù)據(jù)來獲取有價值的信息。
7. 能夠提出質(zhì)疑
在這個充滿信息的世界里,人們每天都會被新的數(shù)據(jù)轟炸,其中不乏正確信息,但更多的是錯誤的或是無關緊要的。具備信息素養(yǎng)的人會不斷質(zhì)疑自己獲取到的信息,例如詢問自己這條信息是否正確、是否有用、是否必需。
具備數(shù)據(jù)素養(yǎng)的人也會是渴望信息的人,因此他們會不斷地提出質(zhì)疑以獲取新知。如果在商業(yè)環(huán)境中考慮,你可能已經(jīng)完成了分析并得出了答案,但是這個答案是對的嗎?或者你已經(jīng)建立了最精確的機器學習模型,但是這個模型真的可以在現(xiàn)實世界中實現(xiàn)嗎?數(shù)據(jù)科學家工作時經(jīng)常會遇到這種情況,而這也是作為數(shù)據(jù)科學家應該提的問題。
圖源:unsplash
但請注意,你仍然需要找到妥協(xié)點,因為問題終究是無窮無盡的。
判斷一個人是否具備數(shù)據(jù)素養(yǎng)有以上七種標準,你滿足這些條件了嗎?