本地人工智能:智能手機時代的低功耗分析
人工智能有一個瓶頸問題。它基于深度神經(jīng)網(wǎng)絡(luò),可能需要數(shù)億到數(shù)十億次計算——這是一項處理和能源密集型任務(wù)。然后是將數(shù)據(jù)從內(nèi)存中移入或移出以執(zhí)行這些和其他分析計算的成本和延遲。麻省理工學(xué)院(MIT)副教授Vivienne Sze因其在開發(fā)視頻壓縮標(biāo)準(zhǔn)方面的作用而聞名,該標(biāo)準(zhǔn)至今仍在使用?,F(xiàn)在,她專注于設(shè)計更高效的深度神經(jīng)網(wǎng)絡(luò)來處理視頻,以及更高效的硬件來在智能手機、嵌入式設(shè)備、微型機器人、智能家居和醫(yī)療設(shè)備上運行人工智能應(yīng)用程序。
在麻省理工學(xué)院最近的一次采訪中,她解釋了為什么我們現(xiàn)在需要低功耗人工智能。“人工智能應(yīng)用正在向智能手機、微型機器人、互聯(lián)網(wǎng)連接設(shè)備和其他功率和處理能力有限的設(shè)備轉(zhuǎn)移。挑戰(zhàn)在于人工智能具有很高的計算要求。將分析應(yīng)用于自駕汽車的傳感器和攝像頭數(shù)據(jù)可能會消耗約2500瓦,但sm的計算預(yù)算很低artphone大約只有一瓦。”
Sze說,在智能手機等小型設(shè)備上本地化人工智能“意味著數(shù)據(jù)處理不再需要在云端、倉庫服務(wù)器機架上進(jìn)行”。“從云上卸載計算使我們能夠擴大人工智能的影響范圍。它通過減少與遠(yuǎn)程服務(wù)器通信造成的延遲來加快響應(yīng)時間。這對于交互式應(yīng)用程序(如自主導(dǎo)航和增強現(xiàn)實)至關(guān)重要,因為它們需要對不斷變化的條件做出即時響應(yīng)。在開發(fā)設(shè)備上處理數(shù)據(jù)ice還可以保護(hù)醫(yī)療和其他敏感記錄。數(shù)據(jù)可以在收集的地方進(jìn)行處理。”
從硬件角度來看,Sze尋求“在本地重用數(shù)據(jù),而不是將其發(fā)送到芯片外。將重用數(shù)據(jù)存儲在芯片上使處理過程極為節(jié)能。”在軟件方面,Sze正在設(shè)計算法代碼的“剪枝”,以去除深層網(wǎng)絡(luò)中的能源密集型“權(quán)重”,并進(jìn)行其他調(diào)整。她正在研究的一個潛在應(yīng)用是眼動跟蹤,以幫助診斷神經(jīng)退行性疾病,這可以通過患者家中的普通智能手機來完成,而到目前為止通常需要昂貴的辦公室設(shè)備。