跨職能合作,優(yōu)秀的數(shù)據(jù)產(chǎn)品如何三步煉成
大數(shù)據(jù)文摘出品
編譯:韋夢(mèng)夙、張秋玥、蔣寶尚
結(jié)合了數(shù)據(jù)與機(jī)器學(xué)習(xí)的產(chǎn)品可成為解決用戶需求的利器。它們能夠創(chuàng)造一條可以幫你避免激烈競(jìng)爭(zhēng)的“數(shù)據(jù)護(hù)城河”。
當(dāng)前已經(jīng)有了一些非常經(jīng)典的案例,例如谷歌搜索引擎以及亞馬遜產(chǎn)品推薦系統(tǒng),兩者利用數(shù)據(jù)與機(jī)器學(xué)習(xí)做出的改進(jìn)都吸引了更多用戶使用它們的產(chǎn)品。
但是機(jī)會(huì)并不會(huì)只青睞技術(shù)巨頭:各個(gè)領(lǐng)域各種規(guī)模的公司都在投資它們自己的數(shù)據(jù)產(chǎn)品。在Coursera,我們使用機(jī)器學(xué)習(xí)幫助學(xué)習(xí)者尋找最佳的內(nèi)容去達(dá)成他們的學(xué)習(xí)目標(biāo),保證他們獲得成功所需要的支持——無論是機(jī)器支持,亦或人工支持。
所謂“數(shù)據(jù)產(chǎn)品”的生命周期反映了當(dāng)前基本的產(chǎn)品開發(fā)現(xiàn)狀:找到解決用戶核心需求的機(jī)會(huì),建立一個(gè)初始版本,然后評(píng)估其影響并進(jìn)行迭代。
但是數(shù)據(jù)的引入增加了一層額外的復(fù)雜度。為了應(yīng)對(duì)此挑戰(zhàn),公司應(yīng)該加強(qiáng)跨職能合作,用長期眼光去評(píng)估并優(yōu)先考慮數(shù)據(jù)產(chǎn)品機(jī)會(huì),然后從簡單之處開始做起。
階段1:辨識(shí)機(jī)會(huì)
1. 數(shù)據(jù)產(chǎn)品是一項(xiàng)團(tuán)體運(yùn)動(dòng)
找到最佳的數(shù)據(jù)產(chǎn)品機(jī)會(huì)需要把產(chǎn)品業(yè)務(wù)的洞察和技術(shù)數(shù)據(jù)的洞察結(jié)合起來。產(chǎn)品經(jīng)理、用戶研究員以及商務(wù)領(lǐng)袖們通常有很強(qiáng)的直覺和領(lǐng)域?qū)iL去辨識(shí)關(guān)鍵且尚未解決的用戶與業(yè)務(wù)需求。與此同時(shí),數(shù)據(jù)科學(xué)家和工程師們擁有敏銳的眼光去辨識(shí)可行的數(shù)據(jù)驅(qū)動(dòng)解決方法;他們還在什么能夠拓展和如何拓展等問題上有很強(qiáng)的直覺。
為了辨識(shí)并優(yōu)先考慮正確的數(shù)據(jù)產(chǎn)品機(jī)會(huì),我們需要讓討論桌上的各方聚到一起。如下的幾條規(guī)范就能夠很有幫助:
讓數(shù)據(jù)科學(xué)家認(rèn)識(shí)用戶和業(yè)務(wù)需求。保持?jǐn)?shù)據(jù)科學(xué)家與產(chǎn)品經(jīng)理、用戶研究員、商業(yè)領(lǐng)袖的緊密聯(lián)系,以保證他們能夠直接深入挖掘數(shù)據(jù)來理解用戶以及他們的需求。
讓數(shù)據(jù)科學(xué)家承擔(dān)數(shù)據(jù)傳播者的角色,與整個(gè)公司交流數(shù)據(jù)能夠帶來的機(jī)會(huì)。這包括從為公司提供更易于使用的原始數(shù)據(jù)、在早期構(gòu)想階段即提供模型輸出樣本,到在后期搭建全功能產(chǎn)品樣本。
培養(yǎng)具有良好數(shù)據(jù)意識(shí)的產(chǎn)品與業(yè)務(wù)小組。不同職能與行業(yè)的人們都在提高自己的數(shù)據(jù)相關(guān)能力,而雇主們則能夠通過投資培訓(xùn)項(xiàng)目來加速這個(gè)趨勢(shì)。產(chǎn)品與業(yè)務(wù)部門的數(shù)據(jù)相關(guān)能力越強(qiáng),他們就能夠更好地和數(shù)據(jù)科學(xué)以及技術(shù)小組合作。
討論桌上為數(shù)據(jù)科學(xué)保留一席之地。數(shù)據(jù)科學(xué)能在組織不同的地方存在(無論是集中或去中心化的管理模式),但是無論是什么樣的組織形式,參與產(chǎn)品與商業(yè)策略討論的數(shù)據(jù)科學(xué)領(lǐng)袖們都能夠幫助加速數(shù)據(jù)產(chǎn)品的開發(fā)。
2. 優(yōu)先考慮未來
最好的數(shù)據(jù)產(chǎn)品像美酒一樣,隨著時(shí)間流逝會(huì)變得越來越好。有如下兩個(gè)原因:
- 首先,數(shù)據(jù)產(chǎn)品應(yīng)用通常能夠加速數(shù)據(jù)的收集,反之又有助于提高應(yīng)用本身。設(shè)想一個(gè)基于用戶自反饋資料數(shù)據(jù)的推薦系統(tǒng)產(chǎn)品吧:目前使用有限的個(gè)人資料數(shù)據(jù),初始推薦系統(tǒng)可能效果并不明顯。但如果用戶在個(gè)性化自己的偏好時(shí)擁有有非常強(qiáng)的意愿去補(bǔ)充資料,這將推動(dòng)推薦系統(tǒng)去加速收集資料數(shù)據(jù),逐漸提高推薦系統(tǒng)的效果。
- 其次,許多數(shù)據(jù)產(chǎn)品能夠支持多種應(yīng)用。這不僅是為了在各件應(yīng)用上均攤昂貴的研發(fā)成本,還是通過共享數(shù)據(jù)加強(qiáng)網(wǎng)絡(luò)效應(yīng)。各種應(yīng)用產(chǎn)生的數(shù)據(jù)反饋給底層數(shù)據(jù)架構(gòu),有助于提升應(yīng)用的利用率和數(shù)據(jù)收集——這樣的良性循環(huán)將持續(xù)進(jìn)行。Coursera的技能圖就是其中一個(gè)例子。一系列算法給課程內(nèi)容、職業(yè)生涯以及學(xué)習(xí)者本身匹配了一個(gè)強(qiáng)大的技能庫。該技能圖加強(qiáng)了一系列幫助發(fā)現(xiàn)相關(guān)課程的應(yīng)用表現(xiàn),而其中許多應(yīng)用產(chǎn)生了增強(qiáng)技能圖的訓(xùn)練數(shù)據(jù),反過來提高應(yīng)用的效果。
過度關(guān)注近期表現(xiàn)會(huì)錯(cuò)失中長期的機(jī)會(huì)。普遍來說,高質(zhì)量數(shù)據(jù)的關(guān)鍵性不容小覷。每一個(gè)步驟都應(yīng)該在收集和儲(chǔ)存數(shù)據(jù)上優(yōu)先投資。
階段2:建設(shè)產(chǎn)品
通過分布執(zhí)行來降低風(fēng)險(xiǎn)
數(shù)據(jù)產(chǎn)品通常需要驗(yàn)證算法是否有效和用戶是否喜歡。因此,數(shù)據(jù)產(chǎn)品的建設(shè)者面臨著一個(gè)固有的矛盾——在前期研發(fā)上投資多少,以及盡快發(fā)布應(yīng)用以驗(yàn)證它是否能夠解決某一核心需求的速度。
在驗(yàn)證產(chǎn)品與市場(chǎng)是否匹配之前過度投資于技術(shù)驗(yàn)證,會(huì)加大研發(fā)力量浪費(fèi)在錯(cuò)誤的問題或者解決方案上的風(fēng)險(xiǎn)。反過來,缺乏有效研發(fā)、僅僅過度投資于用戶需求驗(yàn)證會(huì)導(dǎo)致呈現(xiàn)給用戶一個(gè)無力的樣品,會(huì)有被錯(cuò)誤否定的風(fēng)險(xiǎn)。偏向于后者的團(tuán)隊(duì)也許會(huì)產(chǎn)生一個(gè)由并不有力的模型驅(qū)動(dòng)的MVP(Minimum Viable Product,最小可行產(chǎn)品)。如果用戶反饋差強(qiáng)人意,那當(dāng)我們投入更高研發(fā)力度去改善產(chǎn)品時(shí)結(jié)果其實(shí)有可能將有所不同。
當(dāng)沒有合適手段同時(shí)驗(yàn)證技術(shù)并測(cè)評(píng)產(chǎn)品與市場(chǎng)是否匹配時(shí),分布執(zhí)行就能夠幫得上忙了。從簡單部分入手將能夠加速測(cè)試以及收集高價(jià)值數(shù)據(jù)。在建立技能圖的過程中,我們起初推出基于技能的搜索——一項(xiàng)只需要技能圖一個(gè)小子集的應(yīng)用。它隨后產(chǎn)生了豐富的訓(xùn)練數(shù)據(jù)。如下一系列MVP方法同樣能夠減少測(cè)試時(shí)間:
- 輕量級(jí)模型通常搭建并投入市場(chǎng)更快,而且更容易解釋、調(diào)試并逐漸升級(jí)。雖然深度學(xué)習(xí)在大部分案例中非常有用(確實(shí)是一個(gè)趨勢(shì)),但它并不適合被用于數(shù)據(jù)產(chǎn)品啟動(dòng)階段。
- 外部數(shù)據(jù)資源——無論是公開資源、購買資源或合作伙伴的解決方案——都能夠加速數(shù)據(jù)產(chǎn)品的開發(fā)。如果產(chǎn)品產(chǎn)生的數(shù)據(jù)中可以明顯看出(某個(gè)特性)很受歡迎或很有效果,該產(chǎn)品就可以向該有競(jìng)爭(zhēng)力的方向進(jìn)行改進(jìn),或直接將其作為賣點(diǎn)。
- 在起步的時(shí)候縮小適用領(lǐng)域能使算法不那么具有挑戰(zhàn)性。例如,一些應(yīng)用在初始搭建階段時(shí)可以先著眼于一小部分用戶群體或適用范圍。
- 手工處理——要么人工完成你希望最終機(jī)器模型能做的事情,要么至少是人工評(píng)估調(diào)整初始模型的輸出——都能更進(jìn)一步加速開發(fā)。著眼于讓手工綜合處理的步驟能隨時(shí)間推移實(shí)現(xiàn)自動(dòng)化以提高產(chǎn)品的效果,將會(huì)十分理想。
階段3 評(píng)估和迭代
1. 當(dāng)評(píng)估數(shù)據(jù)產(chǎn)品表現(xiàn)時(shí),思考其未來的潛力
在發(fā)布產(chǎn)品后評(píng)估結(jié)果就對(duì)數(shù)據(jù)產(chǎn)品做出有用或者無用的定論不像簡單的UI調(diào)整那么直接。這是因?yàn)?,?dāng)你收集到更多數(shù)據(jù)的時(shí)候,數(shù)據(jù)產(chǎn)品的效果基本都會(huì)提高,而且基礎(chǔ)數(shù)據(jù)產(chǎn)品會(huì)隨著時(shí)間推移實(shí)現(xiàn)更多功能。在封裝一個(gè)沒有明顯優(yōu)于競(jìng)爭(zhēng)對(duì)手的數(shù)據(jù)產(chǎn)品前,請(qǐng)你的數(shù)據(jù)科學(xué)家準(zhǔn)備好一些重要問題的回答。例如,產(chǎn)品和原先比數(shù)據(jù)收集效率提升了多少?提高算法效果上有多少成果?未來將會(huì)解鎖什么樣的應(yīng)用?基于這些問題的回答,一件當(dāng)前指標(biāo)并不耀眼的產(chǎn)品也許其實(shí)值得保存下來。
2. 迭代速度很重要
數(shù)據(jù)產(chǎn)品經(jīng)常需要在算法和UI上進(jìn)行迭代。挑戰(zhàn)在于決定在哪里進(jìn)行迭代的價(jià)值最高。數(shù)據(jù)和用戶反饋將幫助團(tuán)隊(duì)知道什么功能需要改進(jìn)。算法迭代成為核心時(shí)(通常在復(fù)雜的推薦系統(tǒng)或者通信系統(tǒng)中算法迭代會(huì)無比重要,比如Coursera的個(gè)人學(xué)習(xí)干預(yù)項(xiàng)目算一個(gè)),我們將需要考慮到系統(tǒng)設(shè)計(jì)是否方便數(shù)據(jù)科學(xué)家在開發(fā)中獨(dú)立地部署并測(cè)試新模型。
在產(chǎn)品與商業(yè)領(lǐng)袖和數(shù)據(jù)科學(xué)家之間培養(yǎng)合作的默契,優(yōu)先考慮用未來的眼光投資,然后從簡單之處開始起步,任何類型和規(guī)模的公司都能加速開發(fā)出能有效解決用戶核心需求的數(shù)據(jù)產(chǎn)品,以給為企業(yè)添加能量,創(chuàng)造持續(xù)性的競(jìng)爭(zhēng)力。
相關(guān)報(bào)道:https://hbr.org/2018/10/how-to-build-great-data-products
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號(hào)“大數(shù)據(jù)文摘( id: BigDataDigest)”】