AdMaster創(chuàng)始人洪倍:大數據深度應用時代,全流程把控數據實現價值最大化
在2017年中,對于大數據采集、處理、分析、應用全流程都有把控的公司將會越來越受到青睞。數據流之所以稱之為數據流,正是因為數據只有流動起來,才能真正發(fā)揮其價值所在。
作者 | 洪倍
本文長度為2500字,建議閱讀5分鐘
本文為數據猿年關策劃活動《大數據的2016,我的2016》系列稿件,感謝本文作者 AdMaster創(chuàng)始人 洪倍 先生的投稿。
敬請期待2月16日,由數據猿與中歐商學院、騰訊視頻共同舉辦的高端領袖線下演講欄目中歐微論壇之《超聲波》。
2016年對于我來講是十分具有紀念意義的一年,在這一年中,由我和 Vincent(Vincent Yan,閆曌 AdMaster創(chuàng)始人 首席執(zhí)行官) 所創(chuàng)辦的公司 AdMaster 度過了他的第十個生日。在十年前的那個夏天,大數據還僅僅存在于概念中,那時的我們就堅信,在未來的十年中,大數據必定會引領一段波瀾壯闊的潮流。
如今十年如白駒過隙般匆匆而逝,站在第十年的年末回顧這一年的種種,看著在2016年中大數據取得的種種碩果,我也是頗為激動的。
回顧2016,深度應用發(fā)揮數據真正價值:
最近有一位朋友在閑聊時提到,在2016年中,大數據似乎在概念的熱度上已有所下降,其更偏向于實際的應用(如人工智能,深度學習)。對于這種說法,我實際上也有體會的。大數據從概念向應用的轉化是一個必要的過程。任何事物在產生初期肯定只有概念,而其最終目的必定是為人類帶來收益。
經過十余年的時間,大數據已經在技術領域積累了一定的經驗,有了這些基礎,我們可以利用大數據做一些更實際的東西。大數據好比是原始的食材,人工智能、深度學習好比是烹飪好的食物,如何做出美味的食物,從洗菜,切菜到炒菜,這其中的任何一個環(huán)節(jié)都需要仔細琢磨。
而這其中有一個十分重要的環(huán)節(jié),就是一定要做好清洗,食材如此,數據亦然。如果數據源被污染,之后的一系列過程都會被臟數據破壞,離我們最近的一個例子就是微軟小冰滿嘴臟話,導致這一問題的直接原因就是小冰在機器學習的過程中未對學習的語言內容進行有效過濾。
相比微軟小冰滿嘴臟話的尷尬表現,另一位人工智能領域的新星——AlphaGo 在2016年可謂搏足了我們的眼球。相信大家都有關注那條火爆的新聞:AlphaGo化身Master,接連戰(zhàn)勝諸多圍棋名手。
實際上,在2016年3月份4:1戰(zhàn)勝李世石后,AlphaGo就已經儼然成為了人工智能的代名詞。在那之后又經過如此長時間的深度學習后,他再次戰(zhàn)勝諸多圍棋名手,其實也是在我們意料之外,情理之中的事情。與這些圍棋名手的棋局,實際上也化作大數據,成為了AlphaGo深度學習的內容。相信在這幾番激戰(zhàn)后,AlphaGo又會產生了一些新的微妙變化。
人工智能在未來會是一個十分重要的領域,大數據則會是其不可缺少的后盾。目前來看,AlphaGo顯然還不如我們想象的那樣智能,雖然他可以戰(zhàn)勝人類棋手,但更多的是依賴于其強大的計算能力,而非類人的思考方式,有傳言稱AlphaGo下一盤棋消耗的電量就相當于小半個城鎮(zhèn),無論是否屬實,其運算所耗費的資源可見一斑。
未來深度學習的算法能夠做到何種程度的優(yōu)化,如何妥善處理學習數據,都會對AlphaGo的進化之路產生影響,對于這一切的結果,我們拭目以待。
看到如此多的大數據成果,我固然很欣喜,然而凡事都有兩面性,在2016年中,大數據帶來的一些負面的影響也讓我陷入了深深的沉思。而這首當其沖的,依舊是大數據的隱私與安全問題。大數據的隱私與安全問題一直都是一個敏感的話題。一方面,數據的量級越大,對于后期數據的處理分析的效果越好,能帶來的收益越明顯;另一方面,保護數據安全的難度也會越來越大。
據統(tǒng)計,在2016年,全球范圍內被曝光的泄漏事件達到了1818起,而未被曝光的數量則難以估量。數據的泄露對于企業(yè)的品牌會是毀滅性的打擊,也會使大數據的意義受到質疑。為了防止泄露,我們都在盡可能的增加對數據的保護機制與流程,利用身份認證、訪問控制、傳輸加密、文件加密、審計等途徑,多方面多維度的保護數據。我始終堅信,技術是中立,而使用技術的人決定著這項技術最終是造福于人類還是遺害于人類。
同樣數據安全也不僅僅是個單方面概念,更重要的從架構、流程、機制乃至思維層面,和客戶、合作伙伴一起進行梳理和規(guī)范。截止到2016年,AdMaster通過了ISAE3402 和 ISO27000 數據安全審計,安全審計不僅僅是一個認證證書,更讓團隊借助深入訪談、嚴格審計、應急演練,提高綜合的安全意識、多多考慮風險管控,以更加主動的心態(tài)去做好數據安全。魔高一尺,道高一丈,正義的大數據人應有與數據黑客抗爭到底的決心。
另外,在2016年走訪客戶的過程中,我發(fā)現大家仿佛都在說著自己在擁抱大數據,但實際上沒有多少人弄清楚自己掌握了多少數據。既然都不知道擁有多少,就更不用談利用了。如果此時你愿意好好坐下來梳理一下自己手中的數據資產和數據相關的業(yè)務流程,我相信你的公司在2017年會有質的飛躍。
在梳理的過程中,一定要清楚這些數據是如何采集的,如何保存的,應該用何種手段去分析發(fā)掘這些數據,這一部分數據之后會和什么樣的場景去結合,以產生化學反應。這一點對于營銷部門尤為重要,如果可以正確的運用大數據分析建模帶來的成果,與相應的業(yè)務場景結合,帶來的收益將十分可觀。
展望2017,全流程把控最大化數據價值:
說了這么多2016年的回顧,我也不禁對2017年大數據的發(fā)展充滿了憧憬。我相信,在2017年中,對于大數據采集、處理、分析、應用全流程都有把控的公司將會越來越受到青睞。數據流之所以稱之為數據流,正是因為數據只有流動起來,才能真正發(fā)揮其價值所在。
目前更多的公司還只是注重于大數據流程中某一環(huán)的工作。有的公司可能專注于數據的采集,有的公司可能專注于分析。這樣子做未免有些管中窺豹的感覺,而且數據在交接的過程中,必定存在由于溝通不暢導致的信息缺失,影響最終的洞察、發(fā)現乃至影響收效。
對大數據全流程全面把控的公司,對于數據流有著從頭到尾的完全掌控,采集,儲存,提煉,分析,各個過程一氣呵成,內部部門配合效率也必定更高,整個過程可以大大降低成本,減少數據的失配,有問題出現也可以更快的追本溯源解決問題,最終實現收益的提升。
2016年已經過去,2017年仍待我們努力。大數據之路,你我同行。
— 關于作者 —
洪倍,AdMaster(精碩科技)創(chuàng)始人兼首席技術官,他在 2006 年與閆曌共同創(chuàng)立 AdMaster,帶領公司研發(fā)團隊完善產品架構、鉆研核心技術、挖掘數據價值。
洪倍獨創(chuàng)了 AdMaster Dual Cookie 用戶標識技術,專注于高并發(fā)異構數據實時流式計算的研究,擁有豐富的分布式數據挖掘集群的架構設計經驗。他帶領 AdMaster 研發(fā)團隊,架構了中國領先,涵蓋廣告監(jiān)播、社交聆聽、電商渠道及移動應用等多種數據源的營銷大數據采集和處理集群。