AWS發(fā)布三項(xiàng)全新的Amazon AI服務(wù)
- Amazon Lex,支持Amazon Alexa的技術(shù),讓任何開(kāi)發(fā)者都能為web、移動(dòng)和互聯(lián)設(shè)備應(yīng)用構(gòu)建豐富的、對(duì)話式的用戶體驗(yàn)。
- Amazon Polly可將文本轉(zhuǎn)化成生動(dòng)傳神的談話,讓?xiě)?yīng)用能以47種逼真的聲音、24種語(yǔ)言對(duì)話。
- Amazon Rekognition可輕松添加圖像分析至應(yīng)用,使用強(qiáng)大的、基于深度學(xué)習(xí)的圖像和面部識(shí)別。
- Capital One, Motorola Solutions, SmugMug, American Heart Association, NASA, HubSpot, Redfin, Ohio Health, DuoLingo, Royal National Institute of Blind People, LingApps, GoAnimate及Coursera,還有很多客戶都在使用這些Amazon AI服務(wù)。
美國(guó)西雅圖,2016年11月30日 ,亞馬遜旗下公司Amazon Web Services, Inc.(AWS)發(fā)布三項(xiàng)人工智能(AI)服務(wù),讓任何開(kāi)發(fā)者都能輕松構(gòu)建理解自然語(yǔ)言的應(yīng)用程序,將文本變成生動(dòng)的言語(yǔ),使用聲音或文本進(jìn)行對(duì)話,分析圖像并識(shí)別人臉、物體和場(chǎng)景。Amazon Lex、Amazon Polly和Amazon Rekognition都基于同樣經(jīng)驗(yàn)證的、高可擴(kuò)展的Amazon技術(shù),由全公司數(shù)千名深度學(xué)習(xí)和機(jī)器學(xué)習(xí)專(zhuān)家打造。Amazon AI服務(wù)全都提供高質(zhì)量、高精度的AI能力,可擴(kuò)展且經(jīng)濟(jì)高效。Amazon AI服務(wù)是完全托管的服務(wù),因此無(wú)需構(gòu)建深度學(xué)習(xí)算法,無(wú)需訓(xùn)練機(jī)器學(xué)習(xí)模型,無(wú)需前期承諾或基礎(chǔ)設(shè)施投資。這解放了開(kāi)發(fā)者,讓他們能專(zhuān)注于定義并構(gòu)建全新一代的應(yīng)用,這些程序能看到、聽(tīng)到、說(shuō)、理解并與周?chē)氖澜缁?dòng)。要了解有關(guān)Amazon Lex,Amazon Polly或Amazon Rekognition的更多信息,請(qǐng)?jiān)L問(wèn):https://aws.amazon.com/amazon-ai
到目前為止,很少有開(kāi)發(fā)人員能構(gòu)建、部署并大規(guī)模擴(kuò)展具備AI能力的應(yīng)用程序,因?yàn)檫@樣做需要訪問(wèn)大量數(shù)據(jù),以及機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)方面的專(zhuān)業(yè)知識(shí)。有效地應(yīng)用AI涉及大量手動(dòng)操作,以開(kāi)發(fā)并調(diào)整許多不同類(lèi)型的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法(例如自動(dòng)語(yǔ)音識(shí)別、自然語(yǔ)言理解、圖像分類(lèi)),收集清理訓(xùn)練數(shù)據(jù),訓(xùn)練并調(diào)整機(jī)器學(xué)習(xí)模型。并且,這一過(guò)程必須對(duì)應(yīng)用程序中的每個(gè)對(duì)象、面部、語(yǔ)音和語(yǔ)言特性重復(fù)。Amazon AI服務(wù)消除了所有這些繁重的工作,讓AI可以為所有應(yīng)用程序開(kāi)發(fā)人員廣泛地訪問(wèn),提供Amazon強(qiáng)大且可靠的深度學(xué)習(xí)算法和技術(shù),以任何開(kāi)發(fā)人員可通過(guò)API調(diào)用或在AWS管理控制臺(tái)點(diǎn)擊幾次即可達(dá)成的完全托管服務(wù)形式呈現(xiàn)。Amazon AI服務(wù)完全釋放了Amazon的自然語(yǔ)言理解、語(yǔ)音識(shí)別、文本到語(yǔ)音和圖像分析技術(shù)能力,任意規(guī)模、任意應(yīng)用程序、任意設(shè)備,在任何地方。
“更好的算法、對(duì)大量數(shù)據(jù)的廣泛訪問(wèn)以及由云提供的高效經(jīng)濟(jì)的計(jì)算能力,三者結(jié)合,使得AI成為應(yīng)用程序開(kāi)發(fā)人員的現(xiàn)實(shí)。AWS是目前使用的一些極具創(chuàng)新性和創(chuàng)造性的AI應(yīng)用程序的家,”AWS數(shù)據(jù)庫(kù)、分析和AI副總裁Raju Gulabani說(shuō):“多年來(lái),Amazon成千上萬(wàn)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)專(zhuān)家一直在開(kāi)發(fā)人工智能技術(shù),以預(yù)測(cè)顧客可能喜歡閱讀什么,通過(guò)機(jī)器人技術(shù)和計(jì)算機(jī)視覺(jué)技術(shù)提高我們物流中心的效率,并帶給客戶我們AI支持的虛擬助理Alexa?,F(xiàn)在,我們正將這些創(chuàng)新的基礎(chǔ)技術(shù)以任何開(kāi)發(fā)人員都可用的形式提供,包括三種易于使用、功能強(qiáng)大且高效經(jīng)濟(jì)的完全托管的Amazon AI服務(wù)。我們很興奮看到客戶如何使用Amazon Lex、Amazon Polly和Amazon Rekognition,構(gòu)建新一代的應(yīng)用程序。這些應(yīng)用程序具有類(lèi)似人類(lèi)的智能,可以看到、聽(tīng)到、說(shuō)話,并與人和他們的環(huán)境進(jìn)行交互。”
用Amazon Lex實(shí)現(xiàn)智能對(duì)話
Amazon Lex是一項(xiàng)新服務(wù),使用支持Amazon Alexa的、基于相同的自動(dòng)語(yǔ)音識(shí)別(ASR)技術(shù)和自然語(yǔ)言理解(NLU)的語(yǔ)音和文本構(gòu)建對(duì)話界面。Amazon Lex可輕松將復(fù)雜的自然語(yǔ)言功能帶到幾乎任何應(yīng)用程序。開(kāi)發(fā)人員可以通過(guò)輸入幾個(gè)示例短語(yǔ)(例如,“查找航班”或“預(yù)訂航班”),用于獲得完成任務(wù)所需參數(shù)(例如,旅行日期和目的地)的指令以及相應(yīng)的澄清問(wèn)題以詢問(wèn)用戶(例如,“你想什么時(shí)候旅行?”,“你想去哪里?),直接從AWS管理控制臺(tái)構(gòu)建和測(cè)試機(jī)器人(執(zhí)行自動(dòng)化任務(wù)的會(huì)話應(yīng)用,如檢查天氣或預(yù)訂航班)。 Amazon Lex負(fù)責(zé)其余部分,構(gòu)建語(yǔ)言模型并詢問(wèn)完成任務(wù)所需的后續(xù)問(wèn)題。由于Amazon Lex是與AWS Lambda集成的,開(kāi)發(fā)人員可以將Amazon Lex配置為通過(guò)AWS Lambda函數(shù)調(diào)用適當(dāng)?shù)暮蠖朔?wù)(例如航班預(yù)訂服務(wù))。開(kāi)發(fā)人員還可以使用執(zhí)行AWS Lambda函數(shù)的預(yù)構(gòu)建企業(yè)連接器,通過(guò)從Salesforce、Microsoft Dynamics、Marketo、Zendesk、QuickBooks和HubSpot等企業(yè)系統(tǒng)中獲取數(shù)據(jù)來(lái)回答諸如“我在Salesforce.com中的前十個(gè)帳戶是什么”這樣的問(wèn)題。
使用Amazon Lex構(gòu)建的機(jī)器人可以在任何地方使用:從Web應(yīng)用程序,到Slack和Facebook Messenger等聊天和信使應(yīng)用程序,或通過(guò)移動(dòng)或連接設(shè)備上的應(yīng)用程序中的語(yǔ)音。 Amazon Lex處理不同平臺(tái)所需的身份驗(yàn)證,并通過(guò)不要求開(kāi)發(fā)人員為每個(gè)平臺(tái)編寫(xiě)自定義代碼來(lái)簡(jiǎn)化用戶界面設(shè)計(jì)。 此外,開(kāi)發(fā)人員不必?fù)?dān)心擴(kuò)展其基礎(chǔ)架構(gòu),因?yàn)锳mazon Lex會(huì)隨著流量增加而自動(dòng)擴(kuò)展,并且開(kāi)發(fā)人員僅需對(duì)Amazon Lex API的調(diào)用進(jìn)行支付。
Capital One通過(guò)各種渠道為消費(fèi)者、小型企業(yè)和商業(yè)客戶提供廣泛的金融產(chǎn)品和服務(wù)。 Capital One實(shí)驗(yàn)室首席技術(shù)官Firoze Lafeer表示:“作為AWS的資深用戶,Amazon Lex與其他AWS服務(wù)(如AWS Lambda和Amazon DynamoDB)的無(wú)縫集成非常吸引人。 一個(gè)高度可擴(kuò)展的解決方案,Amazon Lex還帶來(lái)了加快新一代語(yǔ)音和文本交互上市速度的潛力,例如我們最近為Alexa推出的Capital One技術(shù)。”
OhioHealth是一個(gè)全國(guó)認(rèn)可的醫(yī)療保健組織,在47個(gè)縣擁有11多家醫(yī)院的網(wǎng)絡(luò)。 “我們對(duì)利用不斷演進(jìn)的語(yǔ)音識(shí)別和自然語(yǔ)言處理技術(shù)來(lái)改善客戶的生活感到很興奮。Amazon Lex為我們提供了一個(gè)很好的機(jī)會(huì),帶給我們的病人一種新體驗(yàn)。” OhioHealth運(yùn)營(yíng)支持高級(jí)副總裁兼首席信息官M(fèi)ichael Krouse表示:“我們?cè)贠hioHealth所做的一切都是為了在正確的時(shí)間和地點(diǎn)為我們的患者提供適當(dāng)?shù)淖o(hù)理。Amazon Lex的下一代技術(shù)和我們正在開(kāi)發(fā)的創(chuàng)新應(yīng)用程序,將有助于提供增強(qiáng)的客戶體驗(yàn)。我們擁有無(wú)限可能。”
HubSpot是一個(gè)營(yíng)銷(xiāo)和銷(xiāo)售軟件的領(lǐng)導(dǎo)者。“HubSpot的GrowthBot是一個(gè)一體化的聊天機(jī)器人,通過(guò)使用會(huì)話界面提供對(duì)相關(guān)數(shù)據(jù)和服務(wù)的訪問(wèn),幫助營(yíng)銷(xiāo)人員和銷(xiāo)售人員提高工作效率。使用GrowthBot,營(yíng)銷(xiāo)人員可在創(chuàng)建內(nèi)容、研究競(jìng)爭(zhēng)對(duì)手并監(jiān)控其分析方面獲得幫助。通過(guò)Amazon Lex,我們添加了復(fù)雜的自然語(yǔ)言處理能力,幫助GrowthBot為我們的用戶提供更直觀的UI,“HubSpot創(chuàng)始人和首席技術(shù)官Dharmesh Shah表示:“Amazon Lex讓我們利用先進(jìn)的AI和機(jī)器學(xué)習(xí),不必自己編寫(xiě)算法。”
通過(guò)允許將實(shí)時(shí)通信和身份驗(yàn)證功能直接嵌入軟件應(yīng)用程序,Twilio幫助企業(yè)實(shí)現(xiàn)通信相關(guān)并合乎語(yǔ)境。Twilio消息產(chǎn)品部總監(jiān)Benjamin Stein表示:“開(kāi)發(fā)者和企業(yè)使用Twilio來(lái)構(gòu)建應(yīng)用程序,可以與世界各地的客戶進(jìn)行溝通。Amazon Lex將為開(kāi)發(fā)人員提供一個(gè)易于使用的模塊化架構(gòu)和全面的API,以支持在移動(dòng)平臺(tái)上構(gòu)建和部署對(duì)話機(jī)器人。我們期待看到我們的客戶使用Twilio和Amazon Lex構(gòu)建的東西。”
用Amazon Polly實(shí)現(xiàn)智能語(yǔ)音
Amazon Polly使開(kāi)發(fā)人員能夠輕松地向現(xiàn)有應(yīng)用程序(如新聞閱讀器和電子學(xué)習(xí)平臺(tái))添加自然語(yǔ)音功能,或創(chuàng)建全新類(lèi)別的語(yǔ)音功能產(chǎn)品(從移動(dòng)應(yīng)用程序到設(shè)備和設(shè)備)。 Amazon Polly易于使用,開(kāi)發(fā)人員可以使用SDK或從AWS管理控制臺(tái)中向Amazon Polly發(fā)送文本,Polly會(huì)立即返回可以直接播放或以標(biāo)準(zhǔn)音頻文件格式存儲(chǔ)的音頻流。47個(gè)逼真的聲音和24種語(yǔ)言的支持,開(kāi)發(fā)人員可以選擇男性和女性的聲音與各種口音,使應(yīng)用程序面向全球用戶。Amazon Polly流暢的文本內(nèi)容發(fā)音意味著,應(yīng)用程序可跨多種文本格式,提供高質(zhì)量的語(yǔ)音輸出。Amazon Polly是可擴(kuò)展的,即使在將大量文本轉(zhuǎn)換為語(yǔ)音時(shí),也能夠快速返回高質(zhì)量的語(yǔ)音。使用Amazon Polly,開(kāi)發(fā)人員只需為他們轉(zhuǎn)換的文本支付,并且可以緩存生成的語(yǔ)音,隨意重復(fù)播放,沒(méi)有任何次數(shù)限制。
華盛頓郵報(bào)是一家曾獲普利策獎(jiǎng)的媒體和技術(shù)公司,每天出版超過(guò)1200個(gè)故事。“華盛頓郵報(bào)高級(jí)產(chǎn)品經(jīng)理Joseph Price說(shuō):“我們一直對(duì)提供我們故事的音頻版本感興趣,但發(fā)現(xiàn),現(xiàn)有的文本到語(yǔ)音解決方案相對(duì)于它們提供的語(yǔ)音質(zhì)量而言,不具備什么成本效益。 隨著Amazon Polly的到來(lái)和其高品質(zhì)的聲音,我們期待為讀者提供更豐富多樣的方式體驗(yàn)我們的內(nèi)容。”
GoAnimate是一個(gè)基于云的動(dòng)畫(huà)視頻創(chuàng)作平臺(tái),旨在讓沒(méi)有動(dòng)畫(huà)背景的商業(yè)人士快速、容易地創(chuàng)建動(dòng)畫(huà)視頻。“Amazon Polly讓GoAnimate用戶能夠立刻為使用我們平臺(tái)創(chuàng)建的角色配音。這在現(xiàn)場(chǎng)解說(shuō)難得或時(shí)間不允許的場(chǎng)景中尤其有幫助,例如開(kāi)發(fā)一個(gè)多語(yǔ)言的視頻,或者是加快審批流程的預(yù)生產(chǎn)制作,”GoAnimate創(chuàng)始人兼首席執(zhí)行官Alvin Hung表示:“Amazon Polly的語(yǔ)音與我們豐富的前動(dòng)畫(huà)資產(chǎn)無(wú)縫集成,鞏固了GoAnimate的易用性,在為我們的客戶帶來(lái)高效率的同時(shí),加速產(chǎn)品上市。”
用Amazon Rekognition實(shí)現(xiàn)智能圖像分析
Amazon Rekognition可讓開(kāi)發(fā)者快速、容易地構(gòu)建應(yīng)用程序,分析圖像,識(shí)別人臉、物體和場(chǎng)景。Amazon Rekognition使用深度學(xué)習(xí)技術(shù),自動(dòng)確定物體或場(chǎng)景,例如汽車(chē)、寵物或家具,并提供一個(gè)置信度得分,讓開(kāi)發(fā)者可以給圖像打標(biāo)簽,這樣應(yīng)用程序使用者就可使用關(guān)鍵詞搜索特定的圖像。Amazon Rekognition可在圖像內(nèi)定位面部并探測(cè)屬性,例如是否在微笑,或眼睛是否是睜開(kāi)的。Amazon Rekognition還支持先進(jìn)的面部分析功能,例如面部對(duì)比和人臉?biāo)阉鳌J褂肦ekognition,開(kāi)發(fā)者可構(gòu)建一個(gè)應(yīng)用,評(píng)估兩張圖像中的面部是來(lái)自同一個(gè)人的可能性,從而能夠近實(shí)時(shí)地根據(jù)參考照片驗(yàn)證用戶。類(lèi)似地,開(kāi)發(fā)者可創(chuàng)建成百上千萬(wàn)面部(在圖像中探測(cè)到)的集合,根據(jù)其參考圖像,在集合中搜索相似的面部。通過(guò)借助一個(gè)簡(jiǎn)單、高效經(jīng)濟(jì)且可靠的AWS服務(wù)實(shí)現(xiàn)全面的圖像分類(lèi)、探測(cè)和管理能力,Amazon Rekognition消除了開(kāi)發(fā)和管理昂貴的圖像處理流程所需的復(fù)雜性和開(kāi)銷(xiāo)。
Redfin是一個(gè)全方位服務(wù)的經(jīng)紀(jì)商,使用現(xiàn)代技術(shù)幫助人們買(mǎi)賣(mài)房子。“Redfin用戶喜歡在我們的網(wǎng)站和移動(dòng)應(yīng)用程序上瀏覽房產(chǎn),我們希望讓用戶更容易篩選數(shù)億的列表和圖像。”Redfin大數(shù)據(jù)和分析總監(jiān)Yong Huang表示:“Amazon Rekognition可從圖像直接生成一組豐富的標(biāo)簽。這使得構(gòu)建智能搜索功能相對(duì)簡(jiǎn)單,幫助客戶根據(jù)他們的特定需求(如壁爐,院子或游泳池)發(fā)現(xiàn)房子。由于Rekognition是接受Amazon S3 URL的,因此可在探測(cè)物體、場(chǎng)景和人臉上節(jié)省大量時(shí)間,無(wú)需移動(dòng)圖像。
SmugMug是一個(gè)每天為成百上千萬(wàn)客戶存儲(chǔ)數(shù)十億張優(yōu)美照片的家,安全又美麗。 SmugMug創(chuàng)始人、首席執(zhí)行官和首席極客Don MacAskill說(shuō):“SmugMug的客戶希望花時(shí)間創(chuàng)造更多的回憶,而不是手動(dòng)管理他們的照片收藏。Amazon Rekognition允許我們自動(dòng)識(shí)別客戶的照片中的內(nèi)容,解鎖一大堆功能,允許他們和其訪客將更多時(shí)間放在享受生活和慶祝他們的照片上。”
基于AWS的深度學(xué)習(xí)和AI
Amazon Polly今天在美國(guó)東部(N. Virginia)、美國(guó)東部(Ohio)、美國(guó)西部(Oregon)和歐盟(Dublin)地區(qū)可用,并將在未來(lái)幾個(gè)月擴(kuò)展到更多地區(qū)。 Amazon Rekognition在美國(guó)東部(N. Virginia)、美國(guó)西部(Oregon)和歐盟(Dublin)地區(qū)提供,并將在未來(lái)幾個(gè)月擴(kuò)展到更多地區(qū)??蛻艨梢詮慕裉扉_(kāi)始注冊(cè)Amazon Lex預(yù)覽。
除了這些服務(wù),AWS最近宣布正在大力投資MXNet,一個(gè)開(kāi)源的分布式深度學(xué)習(xí)框架,最初由卡內(nèi)基梅隆大學(xué)和其他頂尖大學(xué)開(kāi)發(fā),貢獻(xiàn)代碼并改進(jìn)開(kāi)發(fā)人員體驗(yàn)。 MXNet將使機(jī)器學(xué)習(xí)科學(xué)家能夠構(gòu)建可擴(kuò)展的深度學(xué)習(xí)模型,從而大大減少其應(yīng)用的訓(xùn)練時(shí)間。有關(guān)AWS支持MXNet的更多信息,請(qǐng)?jiān)L問(wèn):http://www.allthingsdistributed.com/2016/11/mxnet-default-framework-deep-learning-aws.html。
AWS還使開(kāi)發(fā)人員能夠輕松運(yùn)行自己的深度學(xué)習(xí)和機(jī)器學(xué)習(xí)工作負(fù)載,在AWS之上構(gòu)建自己的AI平臺(tái)。Amazon Elastic Compute Cloud(Amazon EC2)具有廣泛的實(shí)例類(lèi)型,并擁有包含大量?jī)?nèi)存的GPU,是深度學(xué)習(xí)訓(xùn)練的理想選擇。P2實(shí)例在2016年9月推出,旨在面向大規(guī)模機(jī)器學(xué)習(xí)和深度學(xué)習(xí),具備高達(dá)8個(gè)NVIDIA Tesla K80加速器,每個(gè)都運(yùn)行一對(duì)NVIDIDA GK210 GPU,有12 GiB的內(nèi)存和2,496個(gè)并行處理核心。并且,客戶可以使用AWS的深度學(xué)習(xí)AMI,其中包含六個(gè)預(yù)配置和預(yù)測(cè)試的深度學(xué)習(xí)框架,包括所有依賴(lài)項(xiàng)、Nvidia驅(qū)動(dòng)程序和數(shù)據(jù)科學(xué)工具,如Jupyter和Anaconda。 此外,AWS CloudFormation模板可用于規(guī)?;纳疃壬窠?jīng)網(wǎng)絡(luò)訓(xùn)練,幾次點(diǎn)擊便可實(shí)現(xiàn)。