企業(yè)如何將非結(jié)構(gòu)化數(shù)據(jù)用于商業(yè)智能?
如今,企業(yè)產(chǎn)生和收集的數(shù)據(jù)80%是非結(jié)構(gòu)化數(shù)據(jù),而且這一比例將繼續(xù)增長。非結(jié)構(gòu)化數(shù)據(jù)的數(shù)量正以每年55%到65%的速度快速攀升。如果沒有合適的工具來分析這些數(shù)據(jù),企業(yè)就會錯過大量為商業(yè)智能提供的信息。但是,重要的是要知道如何利用非結(jié)構(gòu)化數(shù)據(jù)來服務(wù)于企業(yè)更廣泛的目標。
什么是非結(jié)構(gòu)化數(shù)據(jù)?
非結(jié)構(gòu)化數(shù)據(jù)是高度可變且不遵循任何明確模式的信息。因此,非結(jié)構(gòu)化數(shù)據(jù)難以標記、組織、搜索和最終分析。
非結(jié)構(gòu)化數(shù)據(jù)的示例包括:
- 分析師報告
- 音頻文件
- 事件日志
- 地理空間數(shù)據(jù)
- 圖像
- 會議記錄
- 多媒體數(shù)據(jù)
- 社交媒體帖子
- 視頻文件
- 用戶交互數(shù)據(jù)
非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)有什么區(qū)別?
非結(jié)構(gòu)化數(shù)據(jù)在幾個關(guān)鍵方面不同于結(jié)構(gòu)化數(shù)據(jù)。雖然非結(jié)構(gòu)化數(shù)據(jù)是可變的,但結(jié)構(gòu)化數(shù)據(jù)由明確定義、一致且可預(yù)測的數(shù)據(jù)組成,這使得結(jié)構(gòu)化數(shù)據(jù)更易于搜索和獲取信息。
結(jié)構(gòu)化數(shù)據(jù)的示例包括電話號碼、日期或姓名,可用于餐廳、航空公司和其他可預(yù)訂服務(wù)的銷售交易和在線預(yù)訂系統(tǒng)。
此外,非結(jié)構(gòu)化數(shù)據(jù)位于應(yīng)用程序或NoSQL數(shù)據(jù)庫中,而結(jié)構(gòu)化數(shù)據(jù)位于關(guān)系數(shù)據(jù)庫中。例如,會議記錄形式的非結(jié)構(gòu)化數(shù)據(jù)可以在Notes或MicrosoftWord等應(yīng)用程序中找到,或者在Instagram中發(fā)布社交媒體帖子中。例如,客戶姓名和交易日期是存在于客戶關(guān)系管理(CRM)系統(tǒng)的關(guān)系數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù)。
企業(yè)并不是只選擇一種格式而不選另一種格式的數(shù)據(jù),而是通過將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)一起利用以獲得最佳商業(yè)智能來獲得最大收益。
誰從非結(jié)構(gòu)化數(shù)據(jù)中受益?如何受益?
使用非結(jié)構(gòu)化數(shù)據(jù)的好處包括:
- 多種信息來源可供借鑒
- 快速積累豐富的數(shù)據(jù)集
- 數(shù)據(jù)湖中的巨大存儲容量
- 更準確的數(shù)據(jù)可提供更好的商業(yè)智能,因為非結(jié)構(gòu)化數(shù)據(jù)占企業(yè)數(shù)據(jù)的四分之三以上
Crux公司首席執(zhí)行官WillFreiburg表示,“企業(yè)的各個層面都可以從對非結(jié)構(gòu)化數(shù)據(jù)的適當管理中受益,因為它包含豐富的洞察力,可以使各種內(nèi)部消費者受益?!?
例如,F(xiàn)reiburg解釋說,非結(jié)構(gòu)化數(shù)據(jù)可以更好地了解供應(yīng)鏈風險的來源,衡量消費者情緒和購買行為,并改進運營流程。
盡管非結(jié)構(gòu)化數(shù)據(jù)對企業(yè)的各個部分都具有相關(guān)性和優(yōu)勢,但業(yè)務(wù)領(lǐng)導者不需要在企業(yè)中整體或均勻地使用它。與其相反,他們應(yīng)該以符合業(yè)務(wù)戰(zhàn)略目標的有針對性的方式處理非結(jié)構(gòu)化數(shù)據(jù)。
非結(jié)構(gòu)化數(shù)據(jù)的用例
非結(jié)構(gòu)化數(shù)據(jù)用例適用于銷售和營銷、產(chǎn)品開發(fā)和客戶服務(wù)。
(1)銷售和營銷
企業(yè)使用非結(jié)構(gòu)化數(shù)據(jù)來識別客戶購買模式和對品牌的看法。情感分析是非結(jié)構(gòu)化數(shù)據(jù)獨有的主要優(yōu)勢。分析社交媒體帖子、論壇討論和其他媒體可為企業(yè)的銷售和營銷業(yè)績提供背景信息。
非結(jié)構(gòu)化數(shù)據(jù)還為CRM平臺中的算法提供信息。預(yù)測分析產(chǎn)生洞察,告知企業(yè)如何預(yù)測客戶需求。例如,銷售團隊可以根據(jù)洞察力采取行動,為新客戶提供更好的產(chǎn)品或服務(wù)推薦,或者了解向現(xiàn)有客戶追加銷售的合適時間。
(2)產(chǎn)品開發(fā)
通過對客戶論壇、客戶服務(wù)電話和社交媒體的情緒分析,非結(jié)構(gòu)化數(shù)據(jù)可以告知企業(yè)如何改進其產(chǎn)品或服務(wù)。
(3)客戶服務(wù)
自動聊天機器人通過將客戶關(guān)注的問題傳遞給可以解決問題的適當人員來增強客戶服務(wù)代表。反過來,該信息為上述情緒分析提供信息。
然而,更重要的是,投訴和故障排除對話為研發(fā)團隊提供了有關(guān)哪些功能運行良好、哪些功能運行不佳的有用信息。該數(shù)據(jù)為產(chǎn)品開發(fā)提供有關(guān)如何改進產(chǎn)品或服務(wù)的信息。
利用非結(jié)構(gòu)化數(shù)據(jù)實現(xiàn)商業(yè)智能的三個步驟
Crux公司的Freiburg提出了三個步驟,開始利用非結(jié)構(gòu)化數(shù)據(jù)來獲得更好的商業(yè)智能。
(1)確定非結(jié)構(gòu)化數(shù)據(jù)的具體用途
Freiburg建議管理層“清楚企業(yè)試圖用外部數(shù)據(jù)回答什么問題”。
了解企業(yè)希望如何使用非結(jié)構(gòu)化數(shù)據(jù)是確定使用何種數(shù)據(jù)的第一步。
首先要收集的非結(jié)構(gòu)化數(shù)據(jù)。這反過來將告知要實施什么樣的大數(shù)據(jù)業(yè)務(wù)解決方案。
(2)簡化數(shù)據(jù)源
Freiburg建議建立一個“通用數(shù)據(jù)模型”,以便在數(shù)據(jù)中建立一組真實性。
由于非結(jié)構(gòu)化數(shù)據(jù)來自各種來源和多種格式,弗萊堡強調(diào)需要“建立高質(zhì)量的數(shù)據(jù)管道,以確保數(shù)據(jù)交付的一致性和及時性保持不變,無論來源如何?!?
(3)為數(shù)據(jù)程序制定路線圖和解決方案
與專門提供高性能質(zhì)量數(shù)據(jù)集成工具和服務(wù)的供應(yīng)商合作。例如,Crux公司擁有數(shù)千個數(shù)據(jù)集,可以將這些數(shù)據(jù)集集成到其在步驟2中創(chuàng)建的數(shù)據(jù)管道中并發(fā)揮其優(yōu)勢。
一旦業(yè)務(wù)領(lǐng)導者和數(shù)據(jù)分析師確定了后端,也就是他們試圖回答的問題以及他們將如何集成數(shù)據(jù)源,他們就需要在前端工作。這意味著他們需要以一種允許通過日常應(yīng)用程序可視化和查詢數(shù)據(jù)的方式嵌入分析。
非結(jié)構(gòu)化數(shù)據(jù)工具提供商
從非結(jié)構(gòu)化數(shù)據(jù)中產(chǎn)生的洞察力不僅僅是神奇地出現(xiàn)。與其相反,它需要特殊的工具來處理數(shù)據(jù),然后才能產(chǎn)生任何有意義的知識。市場上流行的非結(jié)構(gòu)化數(shù)據(jù)工具提供商包括:
- Accenture
- Azure
- Crux
- DynamoDB
- Hadoop
- MongoDB
為什么非結(jié)構(gòu)化數(shù)據(jù)對商業(yè)智能很重要?
結(jié)構(gòu)化數(shù)據(jù)只講述了企業(yè)試圖理解的問題的一小部分,準確地說只有20%。
另一方面,非結(jié)構(gòu)化數(shù)據(jù)占企業(yè)數(shù)據(jù)的80%,并且來自多種不同格式的各種來源。因此,它為企業(yè)描繪了一幅更全面的圖景,以幫助他們更好地理解和解決他們的挑戰(zhàn)。
非結(jié)構(gòu)化數(shù)據(jù)確實更難分析。然而,企業(yè)通過這樣做獲得的大量信息使得非結(jié)構(gòu)化數(shù)據(jù)分析工具非常值得投資。
因此,企業(yè)必須通過非結(jié)構(gòu)化數(shù)據(jù)來定義他們尋求回答的問題或挑戰(zhàn),集成和簡化各種數(shù)據(jù)源,并使用正確的工具來幫助分析和可視化它以獲得更好的商業(yè)智能。