50多種適合機(jī)器學(xué)習(xí)和預(yù)測(cè)應(yīng)用的API,你的選擇是?
本文盤點(diǎn)了2018年以來(lái)人臉和圖像識(shí)別、文本分析、自然語(yǔ)言處理、情感分析、語(yǔ)言翻譯、 機(jī)器學(xué)習(xí)和預(yù)測(cè)這幾個(gè)領(lǐng)域常用的API,讀者可以根據(jù)自己需求選擇合適的API完成相應(yīng)的任務(wù)。
對(duì)于做工程項(xiàng)目和搞科研的人來(lái)說(shuō),有現(xiàn)成的模塊或工具使用是一件多么美妙的事情啊,無(wú)需訪問(wèn)源碼或理解內(nèi)部工作機(jī)制的細(xì)節(jié)即可完成相應(yīng)的任務(wù)。常用的方法是調(diào)用一些API,即一些預(yù)先定義的函數(shù),目的是提供應(yīng)用程序與開(kāi)發(fā)人員基于某軟件或硬件得以訪問(wèn)一組例程的能力。本文總結(jié)對(duì)于機(jī)器學(xué)習(xí)行業(yè)者有用的50多個(gè)API,主要涉及的領(lǐng)域如下:
- 人臉和圖像識(shí)別(Face and Image Recognition)
- 文本分析、自然語(yǔ)言處理、情感分析(Text Analysis, NLP, Sentiment Analysis)
- 語(yǔ)言翻譯(Language Translation)
- 機(jī)器學(xué)習(xí)和預(yù)測(cè)(Machine Learning and prediction)
本文對(duì)每個(gè)研究領(lǐng)域都列出了一些主流的API,其排列順序是根據(jù)字母順序而來(lái)。
人臉和圖像識(shí)別
1.Animetrics Face Recognition:該API可用于檢測(cè)圖像中的人臉,并將其與已知的人臉數(shù)據(jù)集相匹配。此外,還可以從可搜索圖庫(kù)中添加或移除某個(gè)分類,或者是從某個(gè)分類中添加或刪除某張面部圖像。
2.Betaface:該API提供人臉識(shí)別與WEB服務(wù)檢測(cè)。識(shí)別的特征包括多人臉檢測(cè)、人臉裁剪、123個(gè)人臉特征點(diǎn)檢測(cè)、人臉驗(yàn)證與識(shí)別、以及在大數(shù)據(jù)庫(kù)中進(jìn)行相似性搜索。
3.Eyedea Recognition:致力于提供高階的計(jì)算機(jī)視覺(jué)解決方案,主要是對(duì)象檢測(cè)和識(shí)別。其識(shí)別服務(wù)提供了眼睛、臉部、車輛、版權(quán)以及車牌檢測(cè)。該API主要的價(jià)值在于可以對(duì)對(duì)象、用戶和行為進(jìn)行實(shí)時(shí)理解。
4.Face++:提供面部識(shí)別和檢測(cè)服務(wù),用戶可以調(diào)用該API來(lái)訓(xùn)練程序,人臉檢測(cè)、人臉識(shí)別、群體人臉、創(chuàng)建人臉集、獲取信息等。
5.FaceMark:該API能夠檢測(cè)正面照上的68個(gè)特征點(diǎn),以及面部輪廓照上的35個(gè)特征點(diǎn)。
6.FaceRect:該API非常強(qiáng)大且免費(fèi)。能夠在正面照和輪廓照上檢測(cè)人臉或多個(gè)人臉,還可以將檢測(cè)結(jié)果以JSON格式輸出,此外,該API可以顯示檢測(cè)到的眼睛、鼻子、嘴等面部特征。
7.Google Cloud Vision API:發(fā)布在TensorFlow平臺(tái)上,使得模型能夠?qū)W習(xí)和預(yù)測(cè)圖像的內(nèi)容。此外,還可以幫助用戶搜索到最愛(ài)的圖像,快速、準(zhǔn)確地獲取它的注釋。它還能夠按照船、獅子、埃菲爾鐵塔等分成數(shù)以千計(jì)的類別,檢測(cè)面部的相關(guān)情緒,識(shí)別多種語(yǔ)言的印刷語(yǔ)。
8.IBM Watson Visual Recognition:該API能夠理解圖像的內(nèi)容,比如圖像標(biāo)記,檢測(cè)人臉、年齡和性別預(yù)測(cè),還可以進(jìn)行人臉相似檢測(cè)。此外,還可以利用該API根據(jù)自身任務(wù)開(kāi)發(fā)相關(guān)服務(wù)。
9.Imagga:該API能夠自動(dòng)為圖像分配標(biāo)簽,以使得圖像可被找到,它是基于圖像識(shí)別平臺(tái)服務(wù)的。
10.Kairos:該平臺(tái)方便開(kāi)發(fā)者快速地在應(yīng)用程序和服務(wù)中添加情感分析和人臉識(shí)別。
11.Microsoft Cognitive Service - Computer Vision:該API可以基于輸入或用戶選擇以不同的方式分析視覺(jué)內(nèi)容。比如,基于內(nèi)容標(biāo)記圖像、分類圖像、檢測(cè)人臉并返回坐標(biāo)、識(shí)別特定區(qū)域的內(nèi)容、生成內(nèi)容描述、標(biāo)識(shí)圖像中的文本、標(biāo)記成人內(nèi)容。
12.Skybiometry Face Detection and Recognition:該API提供人臉檢測(cè)和識(shí)別服務(wù),最新版的API還能夠區(qū)分深色眼鏡和透明眼鏡。
文本分析、自然語(yǔ)言處理和情感分析
1.Bitext:提供市面上最準(zhǔn)確的多語(yǔ)種情感主題分析。目前,已經(jīng)提供四個(gè)語(yǔ)義服務(wù):實(shí)體、概念提取、情感分析以及文本分類,該API支持8種語(yǔ)言。
2.Diffbot Analyze:為開(kāi)發(fā)人員提供可識(shí)別、分析以及從任何網(wǎng)頁(yè)中提取主要內(nèi)容和章節(jié)的工具。
3.Free Natural Language Processing Service:,免費(fèi)提供包括情感分析、內(nèi)容提取、語(yǔ)言檢測(cè)等服務(wù),該API也在API市場(chǎng)mashape.com中挺受歡迎。
4.Google Cloud Natural Language API:該API分析文本的結(jié)構(gòu)和意義,包括情感分析、實(shí)體識(shí)別以及文本注釋。
5.Watson Natural Language Understanding:該API分析文本以從概念、實(shí)體、關(guān)鍵詞、類別、關(guān)系以及語(yǔ)義角色等內(nèi)容中提取元數(shù)據(jù)。
6.MeaningCloud Text Classification:該API完成預(yù)分類任務(wù),比如文本提取、文本標(biāo)記、詞語(yǔ)切分等。
7.Microsoft Cognitive Service - Text Analytics:該API從文本中檢測(cè)情緒、關(guān)鍵短語(yǔ)、話題和語(yǔ)音。該組中的其它API提供包括Bing拼寫檢查、語(yǔ)言理解、語(yǔ)言分析以及Web語(yǔ)言模型等。
8.nlpTools:在HTTP RESTful網(wǎng)絡(luò)服務(wù)上的簡(jiǎn)單JSON,被用于自然語(yǔ)言處理,能夠?qū)W(wǎng)絡(luò)新聞媒體進(jìn)行情感分析和文本分類。
9.Geneea:該API可以對(duì)提供的原始文本、從給定的URL中提取到的文本或直接提供的文檔進(jìn)行分析。
10.Thomson Reuters Open Calais?:基于自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和其它方法,將文檔與實(shí)體(人、地點(diǎn)、組織等)進(jìn)行分類和鏈接。
11.Yactraq Speech2TopicsIs:該API通過(guò)語(yǔ)言識(shí)別與自然語(yǔ)言處理技術(shù)將視聽(tīng)內(nèi)容轉(zhuǎn)化為主題元數(shù)據(jù)。
語(yǔ)言翻譯
1.Google Cloud Translation:該API能夠動(dòng)態(tài)地在數(shù)千種語(yǔ)言之間對(duì)文本進(jìn)行翻譯,且允許將網(wǎng)站和程序與該翻譯服務(wù)集成在一起。
2.Google Cloud SPEECH-TO-TEXT:該API可以應(yīng)用強(qiáng)大的神經(jīng)網(wǎng)絡(luò)模型,開(kāi)發(fā)人員可以將音頻轉(zhuǎn)換成文本,該API支持120種語(yǔ)言及其變體。
3.IBM Watson Language Translator:該API將文本從一種語(yǔ)言翻譯為另外一種語(yǔ)言,此外也允許開(kāi)發(fā)者基于自己的需求進(jìn)行自定義模型開(kāi)發(fā)。
4.MotaWord:人工快速翻譯平臺(tái),支持70種語(yǔ)言,且允許開(kāi)發(fā)人員查詢翻譯報(bào)價(jià)、提交翻譯項(xiàng)目文檔和風(fēng)格指南、跟蹤項(xiàng)目進(jìn)度并實(shí)時(shí)獲取活動(dòng)信息。
5.WritePath Translation:該API允許開(kāi)發(fā)人員將WritePath集成到其它應(yīng)用程序中,提供字?jǐn)?shù)檢索、提交文本翻譯任務(wù)以及獲取分宜信息等服務(wù)。
6.Houndify:通過(guò)始終學(xué)習(xí)的獨(dú)立平臺(tái)將語(yǔ)音和會(huì)話智能地集成到產(chǎn)品中。
7.IBM Watson Conversation:構(gòu)建理解自然語(yǔ)言的聊天機(jī)器人,可以將其部署在消息平臺(tái)和網(wǎng)站上。該組中的其它API能夠提供包括對(duì)話、自然語(yǔ)言分類器、個(gè)性分析、文檔轉(zhuǎn)化以及音調(diào)分析器等功能。
8.IBM Watson Speech:該API提供語(yǔ)音到文本以及文本到語(yǔ)音的轉(zhuǎn)換功能。
機(jī)器學(xué)習(xí)與預(yù)測(cè)
1.Amazon Machine Learning:從數(shù)據(jù)中查找模式。該API的典型用法包括詐騙檢測(cè)、需求預(yù)測(cè)、目標(biāo)營(yíng)銷和點(diǎn)擊預(yù)測(cè)等。
2.BigML:提供云托管的機(jī)器學(xué)習(xí)和數(shù)據(jù)分析服務(wù)。用戶可以建立一個(gè)數(shù)據(jù)源,并通過(guò)標(biāo)準(zhǔn)的HTTP創(chuàng)建模型來(lái)處理標(biāo)準(zhǔn)的有監(jiān)督和無(wú)監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)任務(wù)。
3.Google Cloud Prediction:提供REST API來(lái)構(gòu)建機(jī)器學(xué)習(xí)模型。這些工具可以幫助分析數(shù)據(jù)以向應(yīng)用程序中添加各種特征。
4.co:為電子商務(wù)網(wǎng)站提供產(chǎn)品推薦引擎,準(zhǔn)確地預(yù)測(cè)客戶的意圖。
5.Hu:toma:幫助世界各地的開(kāi)發(fā)者建立和構(gòu)建商用級(jí)別的深度學(xué)習(xí)聊天機(jī)器人。
6.IBM Watson Retrieve and Rank:開(kāi)發(fā)人員可以將自定義數(shù)據(jù)加載到這個(gè)服務(wù)中,并使用相關(guān)算法來(lái)訓(xùn)練機(jī)器學(xué)習(xí)模型(Rank)。服務(wù)輸出包括一系列相關(guān)文件和元數(shù)據(jù)。
7.indico:提供文本分析和圖像分析,該API免費(fèi)使用且不需要任何的訓(xùn)練數(shù)據(jù)。
8.Microsoft Azure Cognitive Service API:為顧客提供個(gè)性化的產(chǎn)品建議并提高銷售量,新版本增加的一些功能,比如支持批量處理、更好的API資源管理器、更簡(jiǎn)潔的API接口等。
9.Microsoft Azure Anomaly Detection API:檢測(cè)異常事件序列數(shù)據(jù),比如檢測(cè)內(nèi)存使用中是否存在內(nèi)存泄露。
10.Microsoft Cognitive Service - QnA Maker:將信息提煉為對(duì)話或易于瀏覽的形式。該組中的其它API提供包括學(xué)術(shù)知識(shí)、實(shí)體鏈接、知識(shí)探索等服務(wù)。
11.Microsoft Cognitive Service - Speaker Recognition:使得應(yīng)用程序具有檢測(cè)當(dāng)前說(shuō)話者的能力。該組中的其它API提供包括Bing語(yǔ)言和自定義識(shí)別等服務(wù)。
12.MLJAR:為原型開(kāi)和部署模式識(shí)別算法提供服務(wù)。
13.NuPIC:基于Python和C++實(shí)現(xiàn)的Numenta's Cortical學(xué)習(xí)算法,并由nupic社區(qū)維護(hù)。該API允許開(kāi)發(fā)人員使用原始算法,將多個(gè)區(qū)域串起來(lái),并利用其它平臺(tái)的功能。
14.PredicSis:該API對(duì)大數(shù)據(jù)有很好的洞察力,并通過(guò)預(yù)測(cè)分析來(lái)改善營(yíng)銷業(yè)績(jī)。
15.PredictionIO:建立在Apache上的一個(gè)開(kāi)源機(jī)器學(xué)習(xí)服務(wù)器。典型API方法包括創(chuàng)建、管理和用戶記錄、檢索項(xiàng)目和內(nèi)容、以及基于用戶進(jìn)行個(gè)性推薦等。
16.RxNLP - Cluster Sentences and Short Texts:文本挖掘和自然語(yǔ)言處理服務(wù)器,其語(yǔ)句聚類API可以將長(zhǎng)文本或短文本轉(zhuǎn)換成邏輯組。
17.Recombee:通過(guò)REST API提供數(shù)據(jù)挖掘、語(yǔ)言查詢和機(jī)器學(xué)習(xí)算法服務(wù)。
其它API可以參Mashape的博客以及Programmable Web網(wǎng)站。如果你有更好的API推薦,可以留言回復(fù),十分感謝。