自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

什么是自然語言處理(NLP)?

譯文
人工智能 語音識別 自然語言處理
自然語言處理(NLP)是人工智能的一個分支,它使計算機能夠像人類一樣理解、處理和生成語言。搜索引擎、機器翻譯以及語音助理均由該技術(shù)提供支持。

[[399636]]

【51CTO.com快譯】自然語言處理(NLP)的定義

自然語言處理(NLP)是人工智能的一個分支,它使計算機能夠像人類一樣理解、處理和生成語言。搜索引擎、機器翻譯以及語音助理均由該技術(shù)提供支持。

雖然這一術(shù)語最初指的是人工智能系統(tǒng)的閱讀能力,但現(xiàn)在已經(jīng)成為所有計算語言學(xué)的一種通俗說法。其子類別包括自然語言生成(NLG)——計算機自行創(chuàng)建通信的能力和自然語言理解(NLU)(理解俚語、發(fā)音錯誤、拼寫錯誤和語言其他變體的能力)。

自然語言處理(NLP)的工作原理

自然語言處理(NLP)通過機器學(xué)習(xí)進行工作。機器學(xué)習(xí)系統(tǒng)像其他任何形式的數(shù)據(jù)一樣存儲單詞及其組合方式。短語、句子、有時甚至整本書的內(nèi)容都被輸入機器學(xué)習(xí)引擎,并在其中使用語法規(guī)則或人們的現(xiàn)實語言習(xí)慣,或兩者兼而有之進行處理。然后,計算機使用這些數(shù)據(jù)來查找模式并推斷出接下來的結(jié)果。以翻譯軟件為例:在法語中,“我要去公園”是“Je vais au parc”,因此機器學(xué)習(xí)預(yù)測“我要去商店”也將以“Je vais au”開頭。

自然語言處理(NLP)的應(yīng)用

機器翻譯是一種功能強大的自然語言處理(NLP)應(yīng)用程序,但是搜索是最常用的一種用法。每次人們在谷歌或Bing搜索引擎中查找內(nèi)容時,都人為將數(shù)據(jù)輸入到系統(tǒng)中。當(dāng)單擊搜索結(jié)果時,搜索引擎會將其解釋為確認其找到的結(jié)果是正確的,并在以后使用這一信息更好地進行搜索。

聊天機器人的工作方式與其相同:它們與Slack、Microsoft Messenger和其他聊天程序集成在一起,可以讀取人們使用的語言,然后在鍵入觸發(fā)短語時將其打開。當(dāng)Siri和Alexa等語音助理聽到諸如“嘿,Alexa”之類的短語時,它們就會有回應(yīng),而這就是為什么批評人士指責(zé)這些人工智能程序一直在進行監(jiān)聽的原因:如果不這樣做,它們永遠不知道人們什么時候需要它們。除非人們自己打開應(yīng)用程序,否則自然語言處理(NLP)程序必須在后臺運行,并等待這一短語的出現(xiàn)。

自然語言處理(NLP)的示例

數(shù)據(jù)有多種形式,但是最大的未使用數(shù)據(jù)池由文本組成。專利、產(chǎn)品規(guī)格、學(xué)術(shù)出版物、市場研究、新聞以及社交媒體的文章,所有這些都以文本作為主要組成部分,并且文本的數(shù)量正在不斷增長。將技術(shù)應(yīng)用到語音,數(shù)據(jù)池將會變得更大。以下是組織如何使用自然語言處理(NLP)技術(shù)的三個示例:

(1)全球管理咨詢服務(wù)商埃森哲公司使用自然語言處理(NLP)技術(shù)分析合同:“埃森哲法律智能合同探索(ALICE)”工具已經(jīng)幫助該公司的2,800名專業(yè)人士處理上百萬份合同,通過執(zhí)行文本搜索,來搜索合同條款。ALICE工具使用“嵌入單詞”逐段瀏覽合同文件,尋找關(guān)鍵字來確定每段是否與特定合同條款類型相關(guān)。

(2)美國電信商Verizon公司采用自然語言處理(NLP)技術(shù)處理客戶請求:Verizon公司業(yè)務(wù)服務(wù)保證團隊使用自然語言處理(NLP)技術(shù)和深度學(xué)習(xí)來自動處理客戶請求注釋。該團隊每月收到10萬個以上的入站請求。其人工智能支持服務(wù)可以讀取維修票證,并自動響應(yīng)最常見的請求,例如報告當(dāng)前票證狀態(tài)或維修進度更新。而更為復(fù)雜的問題將交給工程師解決。

(3)美國公共電力和天然氣公司((PSE&G)通過虛擬助理幫助客戶:新澤西州州公用事業(yè)公司使用虛擬助理技術(shù)和其他數(shù)字服務(wù),以使其客戶能夠通過語音命令來管理其電費或天然氣賬戶,這是使用亞馬遜公司提供的Alexa 技能工具包構(gòu)建的。

自然語言處理(NLP)的軟件

無論組織是要構(gòu)建聊天機器人、語音助理、預(yù)測文本應(yīng)用程序,還是以自然語言處理(NLP)為核心的其他應(yīng)用程序,都將需要工具來幫助做到這一點。以下是一些受到開發(fā)人員歡迎的軟件工,其中包括:

  • 自然語言工具包(NLTK)。自然語言工具包(NLTK)是一個開放源代碼框架,用于構(gòu)建Python程序以使用人類語言數(shù)據(jù)。它是在賓夕法尼亞大學(xué)計算機和信息科學(xué)系開發(fā)的,提供了與50多種語料庫和詞匯資源庫、一個文本處理庫、一個用于自然語言處理庫的包裝器以及論壇的接口。自然語言工具包(NLTK)是在Apache2.0許可證下提供的。
  • SpaCy。SpaCy是一個用于高級自然語言處理的開放源代碼庫,是專門為生產(chǎn)目的而非研究目的而設(shè)計的。SpaCy的設(shè)計充分考慮了高級數(shù)據(jù)科學(xué),并允許進行深度數(shù)據(jù)挖掘。SpaCy是由麻省理工學(xué)院開發(fā)并許可的。
  • Gensim。Gensim是一個開源Python庫。獨立于平臺的庫支持可擴展的統(tǒng)計語義,對純文本文檔進行語義結(jié)構(gòu)分析以及檢索語義相似文檔的功能。它旨在在無需人工監(jiān)督的情況下處理大量文本。
  • Amazon Comprehend。這個Amazon服務(wù)不需要機器學(xué)習(xí)的經(jīng)驗。它旨在幫助組織從電子郵件、客戶評論、社交媒體、其他文本中找到見解。它使用情感分析、詞性提取和標(biāo)記化來分析單詞背后的意圖。
  • IBM Watson音頻分析器。這個基于云計算的解決方案旨在用于社交監(jiān)聽、聊天機器人集成和客戶服務(wù)監(jiān)控。它可以分析客戶帖子中的情緒和語氣,并監(jiān)控客戶服務(wù)電話和聊天對話。
  • 谷歌云翻譯。這個API使用自然語言處理(NLP)來檢查源文本以確定語言,然后使用神經(jīng)機器翻譯將文本動態(tài)翻譯為另一種語言。該API允許用戶將功能集成到他們自己的程序中。

自然語言處理(NLP)的課程

有許多資源可用于學(xué)習(xí)創(chuàng)建和維護自然語言處理(NLP)應(yīng)用程序,其中許多是免費的。其中包括:

  • DataCamp中的Python自然語言處理簡介。這門免費課程提供15個視頻和51個練習(xí)文件,涵蓋了使用Python進行自然語言處理(NLP)的基礎(chǔ)知識,其中包括如何識別和分隔單詞,如何在文本中提取主題以及如何構(gòu)建自己的虛假新聞分類器。
  • Udemy的自然語言處理(NLP)簡介。這一入門課程提供使用Python和Natural Language Toolkit處理和分析文本的經(jīng)驗。它包括三個小時的點播視頻、三篇文章以及16個可下載資源。該課程費用為19.99美元,并提供結(jié)業(yè)證書。
  • 使用Udemy的Python進行自然語言處理(NLP)。這一課程面向具有任何語言基礎(chǔ)編程經(jīng)驗,對面向?qū)ο缶幊谈拍畹睦斫?,具有基礎(chǔ)到中級數(shù)學(xué)知識以及矩陣運算知識的個人。它完全基于項目,并且涉及構(gòu)建文本分類器以實時預(yù)測推文的情緒,以及構(gòu)建文章摘要器,該文章摘要器可以獲取文章并提取摘要。該課程包括10.5小時的點播視頻和8篇文章。該課程費用為19.99美元,并提供結(jié)業(yè)證書。
  • edX的自然語言處理(NLP)。這門由微軟公司通過edX提供的為期六周的課程,概述了自然語言處理和經(jīng)典機器學(xué)習(xí)方法的使用。它涵蓋了統(tǒng)計機器翻譯和深度語義相似性模型(DSSM)及其應(yīng)用。它還涵蓋了在自然語言處理(NLP)和視覺語言多模式智能中應(yīng)用的深度強化學(xué)習(xí)技術(shù)。這是一門高級課程,完成該課程的人員只需支付99美元就可以獲得認證證書。
  • Coursera提供的自然語言處理。該課程是Coursera公司的高級機器學(xué)習(xí)專業(yè)化的一部分,涵蓋自然語言處理任務(wù),其中包括情感分析、摘要、對話狀態(tài)跟蹤等。Coursera公司表示,這是一門高級課程,估計需要五個星期的學(xué)習(xí)時間,每周需要學(xué)習(xí)四到五個小時才能完成。
  • Coursera在TensorFlow中進行自然語言處理。該課程是Coursera公司的實踐專業(yè)化TensorFlow的一部分,它涵蓋了使用TensorFlow構(gòu)建自然語言處理系統(tǒng),該系統(tǒng)可以處理文本和輸入語句到神經(jīng)網(wǎng)絡(luò)中。Coursera公司表示,這是一門中級課程,估計需要四個星期的學(xué)習(xí)時間,每周需要四到五個小時才能完成。

原文標(biāo)題:What is NLP? Natural language processing explained,作者:Terena Bell,Thor Olavsrud

【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2021-05-18 07:15:37

Python

2024-04-24 11:38:46

語言模型NLP人工智能

2021-01-21 10:28:16

自然語言NLP人工智能

2023-08-04 10:18:15

2020-11-12 18:57:14

摘要PythonNLP

2017-03-28 17:52:58

自然語言處理商業(yè)智能

2017-03-30 14:52:34

自然語言商業(yè)智能

2022-03-29 09:58:15

自然語言處理人工智能技術(shù)

2018-07-08 07:08:07

2021-06-01 12:46:26

人工智能機器人 機器學(xué)習(xí)

2021-05-13 07:17:13

Snownlp自然語言處理庫

2024-12-06 12:19:43

自然語言NLP人工智能

2017-06-29 13:02:54

大數(shù)據(jù)自然語言NLP

2021-02-22 11:38:59

深度學(xué)習(xí)人工智能機器學(xué)習(xí)

2020-04-30 11:05:50

機器閱讀人工智能機器學(xué)習(xí)

2017-12-07 10:46:04

人工智能自然語言處理

2018-10-19 08:48:22

自然語言NLP開源工具

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2024-02-05 14:18:07

自然語言處理

2017-11-14 19:19:07

人工智能自然語言處理百度
點贊
收藏

51CTO技術(shù)棧公眾號