自然語言處理在如何改變數(shù)據(jù)分析界
譯文【51CTO.com快譯】
自然語言處理(NLP)是計算機理解和處理人類自然語言的過程。如果您使用谷歌搜索、Alex、Siri或谷歌助理,想必已看到其功效。NLP的優(yōu)點在于,它讓用戶無需先轉(zhuǎn)換成“計算機語言”就可以進行查詢。
NLP有望使企業(yè)應用和消費級應用都更易于使用。軟件開發(fā)人員已經(jīng)將其集成到比以往更多的應用中,包括機器翻譯、語音識別、情感分析、聊天機器人、市場情報、文本分類和拼寫檢查等。
這項技術在數(shù)據(jù)分析界來得特別有用,可以分析數(shù)據(jù)以幫助企業(yè)負責人、研究人員及其他人員獲得有助于他們做出高效決策的洞察力。正如下文所介紹,NLP可以從多方面支持數(shù)據(jù)分析工作,比如解決重大的全球性問題,以及幫助更多的人(甚至數(shù)據(jù)處理方面未受過培訓的人)使用這些系統(tǒng)。
管理大數(shù)據(jù)
在NLP的幫助下,用戶可以分析比以往更多的數(shù)據(jù),包括醫(yī)學研究等關鍵過程。由于研究人員試圖尋找新冠病毒疫苗,這項技術現(xiàn)在尤為重要。
世界經(jīng)濟論壇組織(WEF)在最近的一篇文章中指出,NLP可以通過研究分析人類無法分析的大量數(shù)據(jù)來幫助研究人員應對新冠疫情。“機器可以找到、評估和總結(jié)成千上萬篇有關新冠病毒的研究論文,論文每周增加數(shù)千篇……”。此外,這項技術還可以通過檢測新的爆發(fā)來幫助跟蹤病毒的傳播。
據(jù)WEF的文章顯示,當數(shù)據(jù)分析員“[訓練]機器以分析完整句子的用戶問題,然后閱讀數(shù)據(jù)庫中成千上萬篇學術文章,對文章進行排名,并生成答案片段和摘要,NLP就可以輔助研究過程。”比如說,研究人員可能會提出“新冠病毒是不是季節(jié)性病毒?”這種問題。系統(tǒng)會檢查數(shù)據(jù)并給出相關響應。
解決問題
除了緊迫的健康問題外,與人工智能(AI)結(jié)合使用的NLP還可以幫助專業(yè)人員克服其他全球性挑戰(zhàn),比如清潔能源、全球饑餓、改善教育和自然災害。比如說,據(jù)《福布斯》刊文,“像谷歌這樣的大公司正將目光投向防洪、利用AI預先確定有風險的方面,并通知受影響地區(qū)的人們。”
支持更多的專業(yè)人員
據(jù)《信息周刊》雜志的文章報道:“憑借自然語言搜索功能,用戶不必了解SQL或布爾搜索,因此搜索起來變得更容易。”由于洞察力的質(zhì)量取決于知道如何“提出正確的問題”,這項技能可能很快對企業(yè)運營人員、經(jīng)理和行政人員來說變得至關重要。
比如說,公司內(nèi)的任何人都可以使用NLP,提出此類問題:“上一個財年的庫存周轉(zhuǎn)率與本財年相比如何?”,從而查詢商業(yè)智能(BI)系統(tǒng)。系統(tǒng)會將每個短語轉(zhuǎn)換成數(shù)字信息,搜索所需的數(shù)據(jù),然后以自然語言的格式返回。這類查詢使任何部門的任何員工都可以獲得重要的洞察力,以幫助他們做出明智的決定。
打造數(shù)據(jù)驅(qū)動型文化
過去,數(shù)據(jù)分析支持的商業(yè)智能(BI)需要訓練有素的數(shù)據(jù)專業(yè)人員來正確輸入查詢并解讀結(jié)果。但NLP改變了這種情況,導致一些專家所謂的“數(shù)據(jù)民主化”:更多人能夠訪問以前僅留給擁有解讀數(shù)據(jù)集所需的高級技能的那些人的數(shù)據(jù)集。
公司內(nèi)知道如何基于數(shù)據(jù)獲取洞察力的人越多,公司從數(shù)據(jù)驅(qū)動型文化中獲得的好處就越大,這種文化依賴可靠的證據(jù),而不是依賴猜測、觀察或理論來做出決策。這種文化可以在任何行業(yè)中加以培養(yǎng),包括醫(yī)療保健、制造、金融、零售或物流等行業(yè)。
比如說,零售營銷經(jīng)理可能希望確定每次購買花費最多的客戶的人口統(tǒng)計數(shù)據(jù),利用特殊優(yōu)惠或忠誠度獎勵來牢牢吸引那些客戶。制造業(yè)的輪班負責人可能希望測試其運營部門的不同方法,確定哪種方法的效率最高。使用NLP,獲取這種信息所需的命令可以由企業(yè)中的任何人來執(zhí)行。
總結(jié)
NLP尚未普及開來。據(jù)《信息周刊》的那篇文章報道,“少數(shù)幾家BI和分析供應商在提供NLP功能,但它們目前占少數(shù)。更多的供應商可能很快會進入市場,以保持競爭力。”
隨著NLP變得更普遍,它將使人們能夠以前所未有的方式與計算機進行交互。這種新型協(xié)作將改善廣泛的人類活動,包括商業(yè)、慈善、健康和溝通。
隨著計算機學會識別上下文,甚至學會識別肢體語言和面部表情等非語言性人類線索,這些進步將變得更有用。換句話說,與計算機對話可能會繼續(xù)變得越來越像人類。
原文標題:How Natural Language Processing Is Changing Data Analytics,作者:Malcom Ridgers
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】