肯睿中國(guó)Cloudera:數(shù)據(jù)與AI如何幫助企業(yè)“反脆弱”?
原創(chuàng)2023年,無(wú)論是個(gè)人還是企業(yè),“脆弱“幾乎是一種普遍的狀態(tài)。
在全球經(jīng)濟(jì)經(jīng)歷諸多重大動(dòng)蕩的今天,越來(lái)越多個(gè)人和企業(yè)意識(shí)到“反脆弱“的重要性?!胺创嗳酢斑@一概念由作家尼古拉斯 · 塔勒布提出,是一個(gè)比復(fù)原力、強(qiáng)韌性更高階的概念。簡(jiǎn)單來(lái)講,反脆弱指的是在混亂或充滿變數(shù)的環(huán)境中生存、發(fā)展和繁榮的能力。
2024年,可以預(yù)見的是,商業(yè)世界依然會(huì)充滿波動(dòng)性、隨機(jī)性、混亂、壓力和風(fēng)險(xiǎn),企業(yè)若想更好地生存發(fā)展,必須重視自身的“反脆弱“能力的提升。
降本增效,“反脆弱”的重要一環(huán)
“‘反脆弱’能力在現(xiàn)代企業(yè)中表現(xiàn)在對(duì)于技術(shù)、人員和流程方面的準(zhǔn)備,這將是企業(yè)在不確定因素下獲得成功的關(guān)鍵。“肯睿中國(guó)Cloudera大中華區(qū)區(qū)域副總裁王剛認(rèn)為,在當(dāng)前艱難的經(jīng)濟(jì)環(huán)境下,企業(yè)規(guī)劃未來(lái)業(yè)務(wù)方向時(shí),需要在基礎(chǔ)設(shè)施和技能方面投入資源以落實(shí)長(zhǎng)期業(yè)務(wù)戰(zhàn)略,從而實(shí)現(xiàn)降本增效及資源利用的最大化。
肯睿中國(guó)Cloudera大中華區(qū)區(qū)域副總裁 王剛
以數(shù)據(jù)變現(xiàn)為例,王剛預(yù)計(jì),越來(lái)越多的企業(yè)將會(huì)開始將數(shù)據(jù)視為資產(chǎn)或產(chǎn)品去衡量?jī)r(jià)值,通過數(shù)據(jù)變現(xiàn)幫助企業(yè)在降本的同時(shí)也實(shí)現(xiàn)增收。同時(shí),企業(yè)也在考慮如何利用數(shù)據(jù)推動(dòng)關(guān)鍵業(yè)務(wù)的決策與創(chuàng)新。為此,企業(yè)必須有可信賴的數(shù)據(jù),數(shù)據(jù)的完整性、數(shù)據(jù)準(zhǔn)確全面和一致都需要得到保證。
然而,現(xiàn)代企業(yè)在逐步發(fā)展的過程中,數(shù)據(jù)類型和來(lái)源變得越來(lái)越多,有結(jié)構(gòu)化的文本數(shù)據(jù),也有諸如音頻、視頻、文檔等非結(jié)構(gòu)化類型,不同類的數(shù)據(jù)如果采用不同類的方案或系統(tǒng)進(jìn)行管理,一個(gè)企業(yè)可能有幾十個(gè)傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),這在后續(xù)進(jìn)行數(shù)據(jù)分析、挖掘時(shí)就會(huì)非常困難。
用一個(gè)平臺(tái)將全量的數(shù)據(jù)管理起來(lái),會(huì)讓數(shù)據(jù)挖掘更加容易,企業(yè)也更容易從數(shù)據(jù)上獲得相應(yīng)的價(jià)值?!翱项?/span>Cloudera提供的湖倉(cāng)一體的解決方案,可以把企業(yè)內(nèi)部的結(jié)構(gòu)化、非結(jié)構(gòu)化、半結(jié)構(gòu)化的數(shù)據(jù)全部都管理好。”王剛表示,作為數(shù)據(jù)湖倉(cāng)技術(shù)方案的提供商,肯睿Cloudera可以從數(shù)據(jù)的角度提高企業(yè)的反脆弱能力。
肯睿中國(guó)Cloudera大中華區(qū)技術(shù)總監(jiān)劉隸放介紹,今年以來(lái),Cloudera在幫很多客戶將傳統(tǒng)的數(shù)據(jù)庫(kù)整合到更大的數(shù)據(jù)平臺(tái)之上,通過平臺(tái)來(lái)支撐以往的數(shù)據(jù)。同時(shí),從幾十個(gè)運(yùn)行的數(shù)據(jù)庫(kù)到一個(gè)平臺(tái),存儲(chǔ)、管理和運(yùn)營(yíng)成本也實(shí)現(xiàn)了大幅度降低。
肯睿中國(guó)Cloudera大中華區(qū)技術(shù)總監(jiān) 劉隸放
可信的數(shù)據(jù)等于可信的AI。隨著生成式AI在2023年風(fēng)靡一時(shí),數(shù)據(jù)的價(jià)值被進(jìn)一步看見。
盡管使用各大公司已發(fā)布的大語(yǔ)言模型是利用AI最直接、簡(jiǎn)單的方式,但對(duì)于企業(yè)而言,用自己內(nèi)部的數(shù)據(jù)來(lái)搭建AI/ML模型對(duì)業(yè)務(wù)更有價(jià)值?!敖衲晡覀兛吹胶芏嗥髽I(yè)都在搭建自己的大語(yǔ)言模型,并將這一很好的工具推廣到不同的部門使用“王剛透露,2023年,很多客戶通過Cloudera大數(shù)據(jù)的平臺(tái)和技術(shù),來(lái)搭建企業(yè)內(nèi)部私有化的大模型,幫助業(yè)務(wù)部門實(shí)現(xiàn)了效率的提升。
以新加坡的OCBC華僑銀行為例,通過Cloudera大數(shù)據(jù)的平臺(tái)和技術(shù)搭建起來(lái)的私有化大模型在三個(gè)典型場(chǎng)景下的應(yīng)用,多個(gè)部門都實(shí)現(xiàn)了業(yè)務(wù)效率的提升:
- Cloud System:通過AI幫助IT人員快速檢索程序問題,提高程序質(zhì)量;
- Document AI:AI生成企業(yè)財(cái)務(wù)報(bào)告總結(jié),便于快速判斷投資風(fēng)險(xiǎn);
- 售后服務(wù):AI識(shí)別客戶情感并生成對(duì)話腳本,快速解決客戶問題,提升客戶體驗(yàn)。
總體來(lái)看,AI、大數(shù)據(jù)等技術(shù)能夠幫助企業(yè)實(shí)現(xiàn)降本增效的目的,以此幫助企業(yè)在不確定的環(huán)境下成長(zhǎng)并獲利。那么企業(yè)又該如何制定自己的數(shù)據(jù)或者AI戰(zhàn)略呢?
“大模型不是一秒生成的”
“我們能不能直接copy競(jìng)爭(zhēng)對(duì)手的大模型?” 劉隸放笑稱,這是經(jīng)常會(huì)被客戶問到的問題。
“但大模型從0到1這個(gè)過程是很復(fù)雜的,在數(shù)據(jù)的加工處理,到最終生成模型,這是一個(gè)完整的過程?!?/span> 在光鮮成果產(chǎn)出的背后,是前期大量數(shù)據(jù)的產(chǎn)生、收集、清洗到模型化,再到后續(xù)的加工處理,都涉及到大量的工作。
依舊以OCBC華僑銀行為例,在沒有大模型之前,其大數(shù)據(jù)平臺(tái)已經(jīng)搭建多年且非常成熟穩(wěn)定,所有的AI技術(shù)都是在其原有的數(shù)據(jù)基礎(chǔ)之上更進(jìn)一步。例如, Document AI系統(tǒng)并不是最近才開始研發(fā)的,而是經(jīng)過了多年的實(shí)踐和改進(jìn)。最初是基于OCR技術(shù)進(jìn)行文檔的自動(dòng)化處理,隨后引入了算法來(lái)提高處理效率?,F(xiàn)在,通過生成式AI技術(shù),系統(tǒng)可以更快地處理文檔,并且可以通過問答方式加速流程。
因此,對(duì)于哪些數(shù)據(jù)量小、數(shù)據(jù)源分散且數(shù)據(jù)還未被完全納管起來(lái)的企業(yè)而言,王剛建議可以將數(shù)據(jù)的底座搭建得更為扎實(shí),再部署AI?!捌髽I(yè)在部署AI時(shí)不能盲目跟風(fēng),而是必須與其業(yè)務(wù)戰(zhàn)略保持一致。若是草率部署一個(gè)或多個(gè)不同的AI用例,則很可能不會(huì)給企業(yè)帶來(lái)更多收益?!?/span>
寫在最后
伴隨著種種新技術(shù)的應(yīng)用和黑天鵝事件的沖擊,企業(yè)想長(zhǎng)久生存下去,就需要把自己塑造成一個(gè)反脆弱型組織。
對(duì)于企業(yè)而言,變化未必是壞事,正如尼古拉斯 · 塔勒布在《反脆弱》一書結(jié)尾寫道:
“脆弱的事物喜歡一成不變的安寧環(huán)境,而活的東西才喜歡波動(dòng)性。驗(yàn)證是否活著的最好方式,就是查驗(yàn)?zāi)闶欠裣矚g變化?!?/span>
在變化中嘗試、改變并成長(zhǎng)起來(lái),或許是讓企業(yè)變得更強(qiáng)大的契機(jī)。