贏在Cloud,只是暫時;輸掉AIoT,將是永遠
1982 年,計算機領域的先驅艾倫·凱(Alan Kay)說:認真寫軟件的人,應該自己做硬件。喬布斯多次引用過這句名言。
現(xiàn)在,認真寫軟件的人,不僅自己做硬件,而且還在自己做最硬核的芯片。由于成本、空間和功耗的限制,定制化芯片時代來了,隨之掀起了一場難以避免的算力對決。
這周,與物聯(lián)網密切相關的云計算領域,正在發(fā)生一場有關算力的巨變!
華為通過連續(xù)兩屆全連接 HC 大會,完成并強化了一次華麗轉身:從連接優(yōu)先,到算力優(yōu)先。過去三十多年里,從有線到無線,從 2G/ 3G/ 4G 到 5G,華為一直在專心做連接?,F(xiàn)在,聯(lián)接到哪里,華為的算力就布局到哪里。
2017 年,華為云提出一個小目標:讓華為云躋身全球“五朵云”之一,為隨后的戰(zhàn)略演進埋下伏筆。
2018 年,華為正式發(fā)布全棧全場景 AI 解決方案,同時亮相兩款 AI 芯片,華為昇騰 910 和昇騰 310。
2019 年,華為公布計算戰(zhàn)略,并帶來了全球最快的 AI 訓練集群 Atlas 900,計算產業(yè)新的大航海時代徐徐開啟。
總之一句話:華為將在云邊端各個層面引發(fā)算力革新。
緊接著,在云棲大會,“算力”再次成為關鍵詞。
阿里巴巴董事局主席兼首席執(zhí)行官張勇說:在數字經濟時代,大數據是石油,而算力是引擎。隨著算力的發(fā)展,最終一定是“數”和“智”的全面結合,并邁入數字經濟時代。
自從阿里宣布將物聯(lián)網列入新賽道之后,便以“生死看淡、不服就干”的態(tài)度一路狂奔完成了“由軟到硬”的演進。
2018 年,阿里宣布成立一家獨立運營的芯片公司:“平頭哥半導體有限公司”。
2019 年,阿里的云邊端一體化全棧芯片產品家族已顯雛形,涵蓋云端 AI 芯片(含光 800)、終端高性能處理器 IP(玄鐵系列)和一站式芯片設計平臺(無劍 SoC 平臺)。
同時,阿里云正式發(fā)布開源物聯(lián)網操作系統(tǒng) AliOS Things 3.0,在硬件驅動層與最新的平頭哥 AI 芯片架構緊密集成。阿里人工智能實驗室和平頭哥共同定制開發(fā)的智能語音芯片 TG6100N,也即將在智能音箱產品中使用。
除了上述提到的兩家,同樣出擊云邊端全棧芯片布局,推進算力革新的公司,還有亞馬遜、谷歌、微軟、百度、IBM…沒錯,云計算企業(yè)跨界造芯,而且是圍繞 AIoT 云邊端“一體化”造芯的做法,正在成為顯性趨勢。
這篇文章,我們將對巨頭們云邊端全棧造芯的布局進行全景式呈現(xiàn)。
曾經的云計算服務商只是云端 AI 芯片的主要推動者,現(xiàn)在他們則將技術能力滲透到了邊緣。這些巨頭們需要云邊端一體的戰(zhàn)略挖掘數據的價值,在數據的時代保持領先,而這個戰(zhàn)略非常重要的支撐就是云端、邊緣和終端的 AI 芯片。如果說巨頭們研發(fā)云端 AI 芯片的做法尙屬“醉翁之意不在酒”,那么研發(fā)終端和邊緣芯片則是明確劍指 AIoT 智聯(lián)網而來。
在這場前所未有的造芯趨勢中,巨頭們發(fā)布了哪些芯片?出于什么動機,巨頭們選擇扎堆造芯?這波浪潮將會涌向何方,又會塑造哪些商業(yè)模式?哪些企業(yè)更有希望生存并獲利?
或許誰率先悟透了這波造芯戰(zhàn)事,誰就更易卡位前排,獲得在物聯(lián)網市場未來戰(zhàn)役中的更多主動權。
云計算巨頭“扎堆”造 AIoT 芯片
根據 OpenAI 在 2018 年發(fā)布的分析數據顯示,自 2012 年以來,最大規(guī)模的人工智能 AI 訓練運行所使用的計算量呈指數增長,3.5 個月翻一倍(相比之下,摩爾定律需要 18 個月)。自 2012 年以來,該指標增長了 30 多萬倍。如此快速增長的市場,可謂絕無僅有,自然吸引了巨頭們的注意。
亞馬遜想做 AI 芯片,已經是由來已久的事情了。畢竟在云服務領域,AWS 承載著全球的 AI 需求爆發(fā);而終端領域隨著 Alexa 和 Echo 的布局越來越大,也急需要芯片層的突破,將技術進化的主旋律掌握在自己手中。
為了實現(xiàn)自有 AI 芯片的目標,2015 年,亞馬遜以 3.5 億美元收購了以色列芯片制造商 Annapurna Labs。2017 年,亞馬遜收購安全攝像頭制造商 Blink,這家芯片廠商在 IoT 低功耗芯片和機器視覺處理芯片上都有技術積累。
自從 2018 年初,就有消息稱亞馬遜可能正在設計終端 AI 芯片。自研的專用 AI 芯片將主要用于提升 AI 語音任務的效率,降低 Alexa 對云計算的依賴,提升搭載 Alexa 設備的本地 AI 算力,同時降低設備功耗,增強 Alexa 設備的可移動性。
在云端,亞馬遜的 AI 芯片已經亮相,首款云端 AI 推理芯片 AWS Inferentia 的目標是殺傷微軟 Azure、谷歌云等一批對手,不給別人可乘之機。
谷歌:試水專用 AI 芯片的先鋒
作為最早開始做 AI 相關研發(fā)的科技公司之一,谷歌亦是試水專用 AI 芯片的先鋒,最早驗證了專用集成電路 ASIC 可以在深度學習領域替代 GPU。
早在 2006 年,谷歌就開始考慮在其數據中心部署 GPU 或者 FPGA、ASIC,當時的結論是,能在專門的硬件上運行的應用并不多,使用谷歌大型數據中心的富余計算能力即可。
情況在 2013 年發(fā)生了轉變,當時谷歌用戶每天使用語音識別 DNN 語音搜索三分鐘,使得谷歌數據中心的計算需求增加了一倍,而如果使用傳統(tǒng)的 CPU 將會非常昂貴。因此,谷歌啟動了一項優(yōu)先級別非常高的項目,快速生產一款定制芯片 ASIC 用于推理,并購買現(xiàn)成的 GPU 用于訓練。
谷歌于 2016 年推出了自己開發(fā)的 AI 芯片 Tensor Processing Unit(TPU),現(xiàn)已進入第三代,為谷歌的語音助理、谷歌地圖、谷歌翻譯等各種 AI 應用提供算力支撐。最初設計的 TPU 用于深度學習的推理階段,而新版本已經可以用于 AI 訓練。
谷歌聲稱,使用 32 種最好的商用 GPU 訓練機器翻譯系統(tǒng)需要一天的時間,相同的工作量需要在 8 個連接的 TPU 上花費 6 個小時。
可以明確,谷歌 TPU 的推出,主要是因為市場上沒有滿足其需求的芯片,使得他們進入了自研芯片領域,并且 TPU 作為云端推理芯片并不對外出售,而是通過谷歌云對外提供算力。
百度:AIoT 芯片為遠場語音交互打造
今年 7 月的百度 AI 開發(fā)者大會上,百度 CTO 王海峰正式推出了百度首款語音 AIoT 芯片“鴻鵠”。該款芯片是百度語音團隊與 AIoT 芯片企業(yè)欣博電子合作打造的,由百度技術團隊偏重算法,欣博電子團隊偏重芯片硬件。
搜索是百度的根基,無處不在的搜索入口是百度必須把握住的。阿里騰訊可以沒有智能音箱,但是百度必須有智能音箱。根據科技媒體“智東西”的報道,今年 4 月份,“鴻鵠”芯片就已經流片成功。目前“鴻鵠”AIoT 芯片已投片量產,將搭載在下一代小度 AI 音箱、以及某些汽車新品中。
在云端,百度給 AI 芯片以“昆侖”命名,它基于百度 CPU、GPU 和 FPGA 的 AI 加速器的研發(fā),通過 20 多次迭代產生。
IBM:仿人腦芯片硬件,押注神經模態(tài)計算
IBM 在最近的研究中證明,深度學習算法可以在仿人腦硬件上運行,而后者通常支持的是一種完全不同形式的神經網絡。
TrueNorth 是 IBM 的神經形態(tài) CMOS ASIC 與 DARPA 的 SyNAPSE 項目共同開發(fā)的。它是一個芯片設計上的多核處理器網絡,有 4096 個核,每個核模擬 256 個可編程硅“神經元”,總共有 100 多萬個神經元。反過來,每個神經元有 256 個可編程的“突觸”來傳遞它們之間的信號。因此,可編程突觸的總數超過 2.68 億個。就基本的構建模塊而言,它的晶體管數量是 54 億。
根據芯片專家唐杉博士在 GitHub 上面的總結,全球有超過 10 家企業(yè)都同時布局了云邊端全棧 AI 芯片,感興趣的讀者可以參考 https://github.com/basicmi/AI-Chip。
尋找 AIoT“最大公約數”
目前,云端、邊緣和終端設備往往是配合工作,云邊端協(xié)同發(fā)展已是大勢所趨。最常見的做法是,在云端訓練神經網絡,然后在邊緣側進行推斷。隨著邊緣設備能力的不斷增強,越來越多的計算工作將在邊緣設備上得以執(zhí)行。另一方面,云的邊界也逐漸向數據的源頭推進,未來很可能在傳統(tǒng)的終端設備和云端設備之間,出現(xiàn)更多的邊緣設備,它們會把 AI 能力分布在各種設備中,并激發(fā)云計算的進一步發(fā)展。
從這個角度來看,跨越云邊端的一個巨大的 AI 處理網絡正在形成。智聯(lián)網 AIoT 可能不僅僅代表一個具體的產品或設備,而是事關大量的產品與云端的高頻互動和規(guī)?;瘎?chuàng)新。為了讓智聯(lián)網前進的“車輪”迅速轉動,巨頭們勢必會有所作為。
最大公約數是個數學詞匯,是指能夠整除多個整數的最大正整數。
面向萬物智聯(lián),整個行業(yè)仍然面臨應用碎片化的困擾,直接導致產業(yè)集中度低,新應用新產品的滲透率低。對于移動互聯(lián)網來說,手機就是最大公約數,掌握了手機幾乎就掌握了移動互聯(lián)網的入口。但在 AIoT 時代,這樣的通用設備并不存在。從現(xiàn)階段來看,AIoT 端云一體化芯片與解決方案有可能是 AIoT 的最大公約數,成為破解碎片化難題的最佳“解藥”。
針對這一話題,平頭哥半導體有限公司 IoT 芯片研究員孟建熠曾經做過題為“端云一體 IoT 芯片的機遇與挑戰(zhàn)”的演講分享,此處援引他的觀點。
他提到,要改變 IoT 芯片產品研發(fā)速度慢、市場尚未被有效打開、同質化競爭嚴重等問題,就需要徹底切換思路:
首先,需要將芯片研發(fā)思想從技術驅動轉變?yōu)閼抿寗樱嵘酒嫦蚴袌龅男省?/p>
傳統(tǒng)芯片研發(fā)思維認為按技術脈絡做下去總會有市場。然而,智聯(lián)網市場是應用驅動的市場,市場瞬間變化很快。AIoT 芯片是針對特定應用場景的專用芯片,而不是通用芯片。如果芯片技術周期不能匹配上應用發(fā)展的速度,就會出現(xiàn)“芯片出來了但是應用場景已經不存在了”的尷尬局面。此外,也只有應用推動才可以體現(xiàn)差異化,才可以幫助芯片廠商走出同質化競爭的困境。
其次,端和云的協(xié)同發(fā)展是 AIoT 技術的新趨勢。AIoT 芯片的研發(fā)不能只考慮端,還要考慮云上的應用和開發(fā)。
以安全為例,安全是物聯(lián)網應用的關鍵,首先要思考如何以更低成本將安全融合到 IoT 芯片中,而不能是獨立的兩個芯片(AIoT 芯片和安全芯片);同時,還必須要從完整的安全體系出發(fā),考慮與云端安全的協(xié)同,安全體現(xiàn)于應用的全部使用過程中。
因此,阿里最新推出的是一整套萬物智聯(lián) AIoT 的基礎設施,在設備智能化以及應用智能化兩側分別提供了 AIoT 的操作系統(tǒng)與邊緣計算,在云端提供了智聯(lián)網平臺以及 AI 一站式應用的開發(fā)能力。
在設備智能化方面,阿里正在構建起一個非常豐富的產業(yè)鏈,涉及芯片設計、芯片制造、模組生產、智能設備設計與制造等合作伙伴。其最新發(fā)布的 AliOS Things 3.0,使用了全新的應用開發(fā)框架,在硬件驅動層,集成了最新的平頭哥 AI 芯片架構。值得一提的是,AliOS Things 3.0 采用微內核架構,能夠將在智能硬件上運行的軟件容器化和在線化升級,這意味軟硬件可以快速解耦、運維,極大地降低了硬件廠商的生產與維護成本。
算力的特征:云邊端深度協(xié)同
由云邊端一體化驅動的最新一輪算力革新,有自己的顯著特征。華為輪值董事長胡厚崑對于這些特征有詳細闡述:
第一個,對算力高度依賴。
統(tǒng)計計算本身就是一種暴力計算,高度依賴于算力。舉個例子,為了讓計算機認識一只貓,就需要數百萬圖片的訓練,這對算力的消耗是非常驚人的,面向自動駕駛、天文探索、氣象預測等更復雜場景,對算力的需求將會更大。
第二個,計算和智能將會無處不在,而不僅僅是分布在中心側。
從中心節(jié)點的暴力計算,到邊緣側的專業(yè)計算,如基因測序,以及端側的個性計算,如耳機、手機,一起構成了未來智能時代的計算形態(tài)。AI 無處不在,不只在云上,還在終端上。在端上面的 AI,以每年 40% 的復合增長率在增長,所以端上 AI 也非常重要。
第三個,云邊端之間需要高效的協(xié)同。
中心側負責通用模型的計算,為端側的個性化計算和邊緣側的專業(yè)化計算,提供協(xié)同支撐。
平頭哥的孟建熠也有相似觀點,他認為芯片行業(yè)呈現(xiàn)出的趨勢表明,未來的創(chuàng)新將會是基于云和端的深度協(xié)同創(chuàng)新。未來越多越的產品不僅僅要實現(xiàn)端側的智能,也要實現(xiàn)云側的智能,任何的產品都會以數字孿生的形式存在。這也就要求芯片行業(yè)的基礎設施發(fā)生相應的改變。
相比云端 AI,邊緣 AI 更大
根據 IDC 數據顯示,2025 年全球每天每個人與聯(lián)網設備互動的次數將近 4800 次,平均每 18 秒將產生一次互動。更多的互動,意味著更多的數據。全球數據分析總量將在 2025 年增長至 5.2 ZB,是原來的 50 倍。超過 25% 的數據將成為實時數據,物聯(lián)網實時數據將占其中的 95%。未來 IoT 整體的市場會非常龐大,聯(lián)網的設備還會越來越多,這些設備在一天里將產生 65G 的數據。
最近,市場研究機構 ABI Research 發(fā)布了兩份報告,詳細描繪了邊緣和云端的 AI 芯片市場狀態(tài)。
其中一份報告聚焦于快速成長的云端 AI 推理與訓練服務應用,預期該市場在 2024 年將從 2019 年的 42 億美元成長至 100 億美元。
另一份報告則聚焦于邊緣 AI 市場,指出邊緣 AI 推理芯片市場在 2018 年的規(guī)模為 19 億美元;而邊緣訓練市場在同一年度的規(guī)模只有 140 萬美元。雖然邊緣 AI 訓練市場目前還很小,但在 2019 年至 2024 年之間,整體邊緣 AI 市場規(guī)模估計可達到 31% 的復合年平均成長率(CAGR)。
更應關注的是由邊緣 AI 開啟的巨大市場。具體而言,ABI Research 認為邊緣 AI 將覆蓋三大利基市場:
第一個利基市場是基于異構運算的機器人。
第二個利基市場是智能工業(yè)應用,包括智能制造、智能建筑與石油天然氣等領域。
第三個利基應用是在“非常邊緣”的地方,也就是將超低功耗 AI 芯片嵌入到傳感器與其他廣域網上的小型終端節(jié)點。
就在本周,Linux 基金會總經理 Arpit Joshipura 拋出一個非常激進的預測,他認為在 2025 年邊緣計算將會超越云計算。
無論這一預測能否成真,邊緣計算的崛起,引起了云計算巨頭們的極大重視。
雖然云計算的幾大巨頭保持明顯的領先位置,但排序仍在動態(tài)變化,領先只是暫時。如果一步踏錯,就有可能滿盤皆輸。
以亞馬遜為例。在云計算服務上,亞馬遜雖然依舊處于霸主地位,但根據最新財報數據顯示來看其增速依舊在放緩。據亞馬遜最新財報顯示,亞馬遜云計算服務 AWS 第二季度營收為 83.8 億美元,同比增長 37%,去年同期增速為 49%。在云計算發(fā)展趨勢越來越迅速的環(huán)境下,亞馬遜的云服務業(yè)務卻放緩了腳步,這勢必將影響他的發(fā)展勁頭。
在云端,亞馬遜推出 AI 芯片,不僅可以擺脫對少數供應商的高度依賴和束縛,還可以降低成本,進一步鞏固優(yōu)勢。
在邊緣,AI 芯片有利于推進亞馬遜在 B2B 和 B2C 領域的滲透。
比如在智能家居這個市場,亞馬遜以 Alexa 和 Echo 系列智能音箱為開端,現(xiàn)在已經奠定了在智能家居里面的基礎。無奈競爭者眾多,例如谷歌就在亦步亦趨,對于亞馬遜來說,通過定制芯片可以更便捷的打造自己的差異化方案,這點顯得尤為重要。
寫在最后
算力革新是手段,數據增值是目的。
如果說云邊端全棧芯片正在引發(fā)的算力革新,屬于智能時代生產力的變革,那么更應該關注的是生產關系的變化,也就是企業(yè)之間將以何種方式協(xié)作,讓數據能夠被高效使用。
云計算巨頭的自研芯片將會服務于自己的業(yè)務和生態(tài),他們都沒有將芯片銷售作為商業(yè)模式,而是致力于拉通由硬到軟、由芯片到應用的整個垂直架構。智能設備連接帶來的數據以標準服務的方式承載于開放平臺之上,更容易橫向貫通不同 AIoT 應用企業(yè)或服務商之間,基于整體數據服務的分工與協(xié)同。
一直以來,物聯(lián)網硬件和物聯(lián)網數據的重要性都被低估了。過去幾年大家都在喊著設備先聯(lián)網,但是發(fā)現(xiàn)聯(lián)網后產生了一大堆數據沒法變現(xiàn)。現(xiàn)在如果大家還在想著設備先智能、先 AI,就仍然不會在數據和應用變現(xiàn)方向產生突破。
在剛剛結束的云棲大會上,阿里通過一些實際案例,展示了數據“升維”的潛力,從單一的數據感知、邁向 AIoT 的多維感知,將人的數據、車的數據和社會公共服務數據打通,探索利用應用業(yè)務合作,達成創(chuàng)新變現(xiàn)的可能性。
比如阿里將搭載斑馬智行系統(tǒng)的智聯(lián)網汽車與云棲小鎮(zhèn)智慧停車系統(tǒng)打通,只要汽車駛入違章區(qū)域違規(guī)停放,被違章監(jiān)控探頭成功鎖定識別后,違停預警系統(tǒng)在 20 秒左右便會發(fā)出預警通知,通過車機語音和手機短信的方式提醒車主及時駛離,并推送周邊停車場以及泊位信息,引導車主有序停放。
這套“智慧防違章”系統(tǒng)不僅大幅度降低了違停發(fā)生率,減少車主因為臨停產生的罰單,也減輕了城市管理基層工作人員的負擔,降低了疏導交通的成本,提高了城市運行效率。根據統(tǒng)計,“智慧防違章”系統(tǒng)讓杭州云棲小鎮(zhèn)區(qū)域違停率下降了 37.8%,車位周轉率提升了5%。更重要的是,這是一個城市管理實現(xiàn)違停“硬性執(zhí)法”到“柔性執(zhí)法”的有效轉變,運用數字化和智能化實現(xiàn)人性化服務。
在這個場景中,通過物聯(lián)網硬件有效采集和綜合利用各種數據,成為關鍵能力。其中涉及到各種角色,包括物聯(lián)網數據的提供者、數據價值的獲得者、合作與協(xié)同的撮合者…大家如何各取所需、共享收益?新型生產關系中不同角色的定位和分工還在重構和裂變的過程中。