深度剖析Amazon AI技術(shù)應(yīng)用和戰(zhàn)略布局: Alexa篇
Amazon超過(guò)微軟成為全球市值最高的公司,市值7900萬(wàn)美元。Jeff Bezos一直有個(gè)非常著名的“Day 1”哲學(xué),就是讓公司永遠(yuǎn)保持在一個(gè)"Day 1"的狀態(tài),他認(rèn)為一旦到了“Day 2”,就意味著進(jìn)入停滯期。那如何保持“Day 1”?Jeff在2017年給股東的公開(kāi)信中提到了4個(gè)策略:用戶至上(Amazon內(nèi)部神一般的教條),抵制形式主義,關(guān)注外部趨勢(shì)和快速?zèng)Q策。
Jeff早在1997年Amazon還剛起步的時(shí)候提到”Day1”,當(dāng)時(shí)的vision:But this is Day 1 for the Internet and,if we execute well for Amazon.com. Today, online commerce saves customers moneyand precious time. Tomorrow,through personalization online commerce well accelerate the very process ofdiscovery。從網(wǎng)上書(shū)店起步的Amazon,Jeff已經(jīng)很早預(yù)測(cè)到技術(shù)對(duì)驅(qū)動(dòng)業(yè)務(wù)發(fā)展的重要性——1998年推出的協(xié)同過(guò)濾推薦引擎充分體驗(yàn)了這一點(diǎn)。
這就是Amazon為什么在“Day1”就對(duì)機(jī)器學(xué)習(xí)和人工智能非常的重視,從面向消費(fèi)者的語(yǔ)音助手Alexa,showcase的無(wú)人商店Amazon Go,到藏在電商王國(guó)背后的AI技術(shù),從inside到outside,從topdown到bottomup,AI滲透進(jìn)Amazon內(nèi)部每一個(gè)細(xì)胞。
相對(duì)其他巨頭,Amazon在AI領(lǐng)域的收購(gòu)稍顯保守,但Amazon Alexa基金就非常aggressive,后面會(huì)作介紹。2013年,收購(gòu)英國(guó)公司Evi Technology,該公司當(dāng)時(shí)開(kāi)發(fā)了一款跟Siri類似的語(yǔ)音助手Evi。據(jù)了解,Amazon Echo的語(yǔ)音技術(shù)來(lái)自于Evi。2016年,收購(gòu)做圖像識(shí)別的華人初創(chuàng)公司Orbeus,這是目前AWS上提供計(jì)算視覺(jué)服務(wù)Rekognition的前身。同年9月,收購(gòu)聊天機(jī)器人平臺(tái)Angel.ai,顯然是為Alexa布局。2017年,收購(gòu)AI云服務(wù)安全公司Harvest.ai,就是目前AWS推出的支持ML技術(shù)的安全服務(wù)Macie。
Amazon的AI應(yīng)用可分為三大類,一類是能“看得見(jiàn)、摸得著”的前沿技術(shù)moonshot產(chǎn)品,像Alexa, Amazon Go和無(wú)人機(jī)Prime Air;一類是“不可見(jiàn)、藏在后臺(tái)”的AI技術(shù),如推薦引擎、倉(cāng)庫(kù)機(jī)器人和fulfillment中心的“最后一公里”;另外就是企業(yè)級(jí)應(yīng)用AWS云平臺(tái),提供AI工具和服務(wù),讓企業(yè)構(gòu)建自己的AI應(yīng)用。
下面會(huì)分為3篇文章,全面、深入地剖析Amazon的AI技術(shù)應(yīng)用和戰(zhàn)略布局。
Amazon在2004年成立Lab126, 專注于硬件產(chǎn)品的研發(fā)。實(shí)驗(yàn)室曾有4個(gè)神秘的項(xiàng)目,代號(hào)為”ABCD”。擁有3000多名研發(fā)人員的Lab126以2007年發(fā)布的Kindle一戰(zhàn)成名。但后來(lái)卻因重壓賭注的智能手機(jī)Fire Phone的失敗而大規(guī)模重組,項(xiàng)目C(據(jù)說(shuō)是AR產(chǎn)品)也隨之流產(chǎn)。但萬(wàn)萬(wàn)想不到,一直不受重視的項(xiàng)目D,竟然打了一場(chǎng)漂亮的翻身仗,成為Amazon歷史上第二個(gè)成功的硬件產(chǎn)品。
2014年Echo從Lab126孵化出來(lái),先定位Prime會(huì)員做市場(chǎng)試水,直到2015年在美國(guó)地區(qū)開(kāi)放給全部用戶,接著就一發(fā)不可收拾,高歌猛進(jìn)。憑著快速的語(yǔ)音響應(yīng),多場(chǎng)景的語(yǔ)音交互能力,親民的價(jià)格,瞬間秒殺市場(chǎng)上的音箱產(chǎn)品。Echo從“點(diǎn)”到“面”的鋪開(kāi)戰(zhàn)略,從音箱到家電,從家庭到汽車,全面占據(jù)消費(fèi)者的生活場(chǎng)景。Amazon最新對(duì)外公布,Alexa的設(shè)備超過(guò)1億。雖然一直處于虧損狀態(tài),但這并不阻擋“Alexa Everywhere”的戰(zhàn)略??坑布⒉皇茿mazon的目的,布局才是大棋。這跟當(dāng)年AWS“低價(jià)切進(jìn),閃電式占領(lǐng)市場(chǎng)”的策略如出一轍。AWS開(kāi)始target中小型企業(yè),財(cái)務(wù)上一直虧損,但市場(chǎng)滲透極深,等競(jìng)爭(zhēng)對(duì)手開(kāi)始醒覺(jué)的時(shí)候,已被AWS拋離到很遠(yuǎn)。另外,Alexa最殺手的大招是開(kāi)放,允許第三方的技能集成,吸引了大量的開(kāi)發(fā)者進(jìn)入生態(tài)。2018年,Alexa技能個(gè)數(shù)已超7萬(wàn)。
這是一個(gè)典型的Alexa驅(qū)動(dòng)開(kāi)燈的場(chǎng)景。當(dāng)用戶發(fā)起語(yǔ)音指令,傳給云端的Alexa解析和處理。Alexa如果發(fā)現(xiàn)使用的不是它內(nèi)帶技能,就會(huì)去調(diào)用外部第三方開(kāi)發(fā)者的技能,最后發(fā)出“開(kāi)燈”的指令。
Alexa主要通過(guò)2個(gè)核心服務(wù)連接開(kāi)發(fā)者和消費(fèi)者構(gòu)建生態(tài): AVS (Alexa Voice Service) 和 ASK (Alexa Skill Kit)。AVS讓設(shè)備廠商把Alexa的“智能大腦”內(nèi)嵌進(jìn)自己開(kāi)發(fā)的設(shè)備里,讓Alexa“無(wú)處不在”。而ASK提供工具和接口給第三方開(kāi)發(fā)者添加定制化的Alexa技能,讓Alexa“無(wú)所不能”。另外,Amazon近期還推出連接工具箱 ACK (Alexa Connect Kit) ,允許設(shè)備制造商不聯(lián)網(wǎng)、不走云端、不需開(kāi)發(fā)技能,通過(guò)本地連接就可實(shí)現(xiàn)設(shè)備“智能化”。很明顯,Amazon這些布局極具前瞻性,不但籠絡(luò)了消費(fèi)者和開(kāi)發(fā)者,還降低技術(shù)門檻讓傳統(tǒng)的硬件制造商進(jìn)入生態(tài)。它的最終目標(biāo)是讓Alexa無(wú)處不在,無(wú)所不能,統(tǒng)治從家居家電,消費(fèi)級(jí)可穿戴設(shè)備到汽車的一切平臺(tái)。
我們從技術(shù)層面drill down,對(duì)Alexa的處理流程進(jìn)行拆解。AVS主要負(fù)責(zé)兩個(gè)轉(zhuǎn)化:語(yǔ)音轉(zhuǎn)文字(Speech-to-Text)和文字轉(zhuǎn)語(yǔ)音(Text-to-Speech)。這兩個(gè)轉(zhuǎn)化的背后是由兩個(gè)深度學(xué)習(xí)引擎所支撐:Amazon Lex和Amazon Polly。
1. Amazon Lex:語(yǔ)音轉(zhuǎn)文字服務(wù),包含自動(dòng)語(yǔ)音識(shí)別ASR和自然語(yǔ)言理解NLU的功能,可以獨(dú)立于Alexa使用,是Amazon AWS對(duì)外提供的chatbot服務(wù)
2. Amazon Polly:文字轉(zhuǎn)語(yǔ)音服務(wù),利用的是語(yǔ)音合成技術(shù)(speech synthesis)
首先,AVS解析用戶發(fā)起的語(yǔ)音請(qǐng)求,識(shí)別技能的名稱,轉(zhuǎn)成結(jié)構(gòu)化的信息。如果技能已經(jīng)部署在AWS,ASK就直接運(yùn)行AWS Lambda服務(wù)。AWS Lambda是云計(jì)算Serverless的計(jì)算架構(gòu),函數(shù)即服務(wù)(Function-as-a-Service, FaaS)。簡(jiǎn)單的來(lái)說(shuō),就是開(kāi)發(fā)人員直接編寫運(yùn)行在云端上的函數(shù),后面AWS章節(jié)會(huì)詳細(xì)描述。如果技能不在AWS,ASK就通過(guò)REST API調(diào)用外部服務(wù)。返回的結(jié)果通過(guò)AVS轉(zhuǎn)成語(yǔ)音信息傳給Echo,或者圖像形式發(fā)送到手機(jī)App。
Alexa的成功主要在產(chǎn)品、市場(chǎng)先機(jī)和開(kāi)放策略。先從Echo單點(diǎn)爆發(fā),迅速占領(lǐng)市場(chǎng),形成第一道“護(hù)城河”。然后,利用開(kāi)放的策略,吸引更多的開(kāi)發(fā)者研發(fā)第三方的Alexa設(shè)備,滿足消費(fèi)者各種場(chǎng)景需求,用戶體驗(yàn)不斷提升,然后帶來(lái)更多的流量,吸引更多的開(kāi)發(fā)者進(jìn)入,打造一個(gè)自給自足的生態(tài)循環(huán),形成第二道“護(hù)城河”。另外,生態(tài)的增長(zhǎng),持續(xù)產(chǎn)生大量有價(jià)值的用戶偏好數(shù)據(jù),數(shù)據(jù)的反哺幫助ML算法優(yōu)化,分析更加精確,個(gè)性化程度更高,客戶的體驗(yàn)更好,形成第三道“護(hù)城河”。從用戶流量,到開(kāi)發(fā)生態(tài),到數(shù)據(jù)反哺,持續(xù)優(yōu)化模型,層層遞進(jìn),形成一個(gè)讓競(jìng)爭(zhēng)對(duì)手難以復(fù)制的巨大壁壘,最終壟斷市場(chǎng)。
Amazon在2015年成立1億美元的Alexa Fund,2017年再加注1億美元,target全球更多地區(qū)(美國(guó)、加拿大、澳新、印度等)?;鹉康闹饕菄@Alexa打造智能助手的生態(tài),讓Alexa植入到更多的外部第三方產(chǎn)品,開(kāi)發(fā)更多技能,引入先進(jìn)的語(yǔ)音交互,NLP等AI技術(shù)?;鸪岁P(guān)注ToC應(yīng)用,還會(huì)進(jìn)入ToB領(lǐng)域,這跟逐漸從消費(fèi)級(jí)轉(zhuǎn)型到企業(yè)級(jí)的微軟Cortana正面交鋒。
除了基金,Alexa跟知名加速器Techstars合作,孵化以語(yǔ)音技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)公司。據(jù)了解,Amazon與Techstars向每家加速器創(chuàng)業(yè)公司投資12萬(wàn)美元,換取6%的普通股。另外,基金還與大學(xué),如卡內(nèi)基梅隆CMU,Johns Hopkins,南加州大學(xué),以及加拿大的Waterloo等,合作創(chuàng)辦fellowship項(xiàng)目,爭(zhēng)取從更早期階段孵化語(yǔ)音AI技術(shù)。
基金的portfolio有3家來(lái)自加拿大,7家來(lái)自歐洲,1家來(lái)自以色列和1家來(lái)自印度,其他均是美國(guó)地區(qū)。領(lǐng)域覆蓋了智能家居,汽車出行、教育、醫(yī)療護(hù)理、企業(yè)應(yīng)用等領(lǐng)域。很明顯,智能家居仍然是Alexa的重心,從智能冰箱貼,寵物喂食器到安防攝像頭,共投了14家。其中智能門鎖Garageio,智能門鈴Ring,安全路由器Luma,智能灑水系統(tǒng)Rachio均被收購(gòu)。兒童教育也是Alexa的關(guān)注領(lǐng)域,結(jié)合語(yǔ)音技術(shù)和IoT,賦能兒童STEM教育。核心技術(shù)和平臺(tái)方面,KiTT.ai 專注語(yǔ)音喚醒和自然語(yǔ)音交互技術(shù),尤其定制化的熱詞檢測(cè)和支持多回合、多平臺(tái)的語(yǔ)音會(huì)話技術(shù),2017年被百度收購(gòu)。DefinedCrowd針對(duì)的是語(yǔ)音識(shí)別,NLP和計(jì)算視覺(jué)方面的數(shù)據(jù)打標(biāo)簽和訓(xùn)練服務(wù)。還有明星公司Ctrl-Labs,同時(shí)獲得GV,Matrix Partners,Peter Thiel的Founders Fund等知名風(fēng)投的投資,結(jié)合計(jì)算神經(jīng)科學(xué),機(jī)器學(xué)習(xí),生物物理,人機(jī)交互等技術(shù),打造新一代的“腦機(jī)接口”。另外,Alexa也進(jìn)入ToB領(lǐng)域,包括銷售場(chǎng)景的Tact.ai、零售場(chǎng)景的Blutag、餐飲場(chǎng)景的SeverRooms。
80到90年代,微軟的Windows一直穩(wěn)坐PC操作系統(tǒng)的王者地位。從2000年開(kāi)始,移動(dòng)互聯(lián)網(wǎng)開(kāi)始崛起。2007年是一個(gè)關(guān)鍵里程碑,Google推出免費(fèi)操作系統(tǒng)Android和Apple發(fā)布iPhone,標(biāo)志著正式進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代。雖然兩家走的路線不一樣,一個(gè)開(kāi)放操作系統(tǒng)以應(yīng)用生態(tài)為主,一個(gè)封閉走中高端路線,提供極致的用戶體驗(yàn),但并不阻擋iOS和Android的發(fā)展勢(shì)頭,完全占據(jù)了用戶手機(jī)使用的半壁江山。2015年,Echo橫空出世,以極快地進(jìn)入智能家居市場(chǎng),從點(diǎn)到面地爆發(fā)。通過(guò)精準(zhǔn)的產(chǎn)品定位,
閃電式的市場(chǎng)策略,開(kāi)放的生態(tài),以及投資布局,建立極高的競(jìng)爭(zhēng)壁壘。得用戶者得天下,Amazon目標(biāo)只有一個(gè),就是打造下一代基于語(yǔ)音交互的操作系統(tǒng)。
根據(jù)“The Alchemy of Growth”理論(中文: 增長(zhǎng)的煉金術(shù)),企業(yè)有三個(gè)層次的增長(zhǎng)。第一個(gè)層次是Operator,維持當(dāng)前業(yè)務(wù)的核心競(jìng)爭(zhēng)力。第二個(gè)層次是Business Builder,開(kāi)拓新的業(yè)務(wù)增長(zhǎng)模式和解決方案,擴(kuò)展核心競(jìng)爭(zhēng)力。第三層次是最高級(jí)別Visionary,也是離公司的comfort zone最遠(yuǎn)的區(qū)域,創(chuàng)造獨(dú)有的解決方案,開(kāi)拓全新市場(chǎng),實(shí)現(xiàn)業(yè)務(wù)爆炸性的增長(zhǎng)。我們可以看出,Echo一系列智能產(chǎn)品利用語(yǔ)音技術(shù),讓Amazon從電商業(yè)務(wù)拓展到智能家居,實(shí)現(xiàn)了新的業(yè)務(wù)模式,進(jìn)入到Horizon II。盈利不是首要目標(biāo),速度才是關(guān)鍵。這讓我想到了“The Lean Startup”里面的原則: learning and iterating as quickly as you can to build a viable business。而Alexa最大的潛力在于開(kāi)放API給第三方的開(kāi)發(fā)者,打造生態(tài)系統(tǒng),讓Alexa的設(shè)備達(dá)到1億多臺(tái),一年之內(nèi)翻了5倍,把Amazon帶進(jìn)了Horizon III,實(shí)現(xiàn)transformative的增長(zhǎng)。是否能實(shí)現(xiàn)Amazon最終的目標(biāo)?我們拭目以待。