使用UGC降低99.7%圖片識別成本 學霸君AI高考首戰(zhàn)告捷
134分!這是學霸君研發(fā)的高考機器人Aidam挑戰(zhàn)全國卷二文科數(shù)學卷取得 的成績,用時僅9分47秒。
150元!這是學霸君使用UCloud研發(fā)的通用計算服務(UGC)后,每月用于OCR圖片識別的計算資源成本。
學霸君自成立伊始,就一直非常重視深度學習技術等人工智能(AI)領域的研究,高考機器人就是成果之一。除了高考機器人,學霸君還在研究手寫識別技術,并應用于拍照搜題業(yè)務,在圖片識別場景中,學霸君大量使用UCloud研發(fā)的UGC服務,不僅輕松解決多個業(yè)務痛點,而且將成本降低至原來的千分之三。
學霸君的拓展藍圖
學霸君是一款面向學生的解題APP,提供在線免費解答作業(yè)題、疑難點等服務。比如,學生在寫作業(yè)時遇到不會做的題目,只需打開APP,將紙上的難題拍照并上傳,就能立刻獲取答案,同時還附帶完整的解題思路和步驟,實現(xiàn)“難題一拍,答案秒出”。
目前,宣布完成1億美元C輪融資的學霸君已經練習了80萬套試卷,7000萬道題目,100億道學生搜題數(shù)據,用戶月活躍量2000萬人次。
不過,學霸君的“雄心”不止于此。今年高考期間,學霸君研發(fā)出的高考機器人Aidam與高考狀元同臺PK,目的在于用高考機器人技術輔助師生教學。同時基于Aidam的技術,學霸君將正式推出智慧教育平臺Ai學,為學校的師生提供服務。
考試機器人是機器理解技術的一種典型應用,也是AI領域的重要挑戰(zhàn)。學霸君創(chuàng)始人兼CEO張凱磊認為,AI在教育領域擁有豐富的應用場景,使機器判卷、個性化指導、個性化作業(yè)變成可能,老師和學生的學習效率都可以大幅度提升。
另外,學霸君還在研究手寫識別技術,并應用于拍照搜題業(yè)務,進一步加強“讀圖識題”。
圖片識別場景痛點
在學霸君的解題應用中,學生用戶將題目拍照并上傳到服務器,APP后臺程序從圖片文件中讀取文字、公式,再將圖片中的像素信息轉化成計算機程序能夠識別的數(shù)據類型。這一過程中,學霸君使用了OCR(光學字符識別)技術。
作為一款面向學生群體的產品,學霸君擁有海量用戶,因此后臺每天都需要同時處理大量圖片識別請求。此時,如果僅使用傳統(tǒng)的OCR技術,將不可避免地遇到圖片識別慢、識圖率低等問題。這就要求學霸君團隊將OCR結合深度學習的識圖技術整合成服務端程序,以提高識別速度與效率。
在技術優(yōu)化之前,學霸君團隊曾面臨多個技術難題和困擾。首先,雖然識別圖片和搜索答案是學霸君的核心業(yè)務,但為了應付客戶端的海量請求和服務端程序性能優(yōu)化問題,無法將全部精力投入到最有價值的方向上。其次,隨著請求量日益增大,學霸君團隊需要及時做好資源預估,購置服務器資源并擴容;架構上需要支持平行擴展,并且做好負載均衡與高可用容災,這都增加了架構優(yōu)化和運維壓力。
另外,學霸君研發(fā)團隊在每臺圖片識別服務器啟動了與CPU核心數(shù)相同的Worker進程數(shù),為了保證并發(fā)量,每個識圖請求只能由一個CPU核心處理。為了應對逐漸增加的識圖請求,學霸君前后共擴容了數(shù)十臺24核物理機用于部署圖片識別服務。然而,在實際日常運行中,很多物理服務器在每天業(yè)務低谷時段處于低負載狀態(tài),導致整體資源利用率低下,計算資源大量浪費。
UGC“對癥下藥”
為了解決這些技術痛點,學霸君選擇使用UCloud的通用計算服務(UGC)。通過評估UGC處理識圖請求的可行性,學霸君認為UGC的產品特性能***解決之前遇到的難題。
作為UCloud研發(fā)的分布式大規(guī)模并行計算服務,UGC(UCloud General Compute)是一款Serverless產品,以用戶算法代碼為中心,無需關心計算資源的交付部署,且計算資源服務化,用戶通過API使用計算資源。同時,UGC提供十萬核級的海量計算資源,輕松支持高并發(fā)計算任務請求,自動實現(xiàn)資源分配和擴展,具備高可用和跨可用區(qū)自動容災能力。更重要的是,UGC實現(xiàn)按需付費(Pay As You Go),用戶只需要為實際消耗的計算資源付費。

學霸君研發(fā)團隊將圖片識別算法代碼打包提交到UGC算法倉庫中,通過調用UGC的API過程嵌入到自身中控程序代碼中。下一步,UGC平臺會立刻調用運行圖片識別算法,將識別后的數(shù)據實時返回到學霸君中控程序。如此一來,學霸君的算法工程師們不用再為如何實現(xiàn)優(yōu)化高性能服務器程序而費心,可以集中精力優(yōu)化OCR深度學習算法。
在學霸君APP業(yè)務流量高峰期,UGC能為增長的識圖請求自動擴展分配更多計算資源,輕松應對高并發(fā)請求。這就徹底解決了學霸君的資源預估、服務器擴容、架構伸縮平行擴展以及容災設計等架構難題。
根據UGC的“Pay As You Go”計費原則,學霸君只需要為執(zhí)行過圖片識別算法任務所消耗的CPU核時付費。在使用UGC之前,學霸君每月需要花費57000元物理機資源用于OCR圖片識別;UGC產品上線后,這一費用下降至每月150元,成本大幅降低99.7%,UGC為學霸君每年節(jié)省了近70萬元的物理機維護開銷。
學霸君圖片識別場景 使用UGC之前

學霸君圖片識別場景 使用UGC之后

“用戶的需求就是我們下一個產品”,UCloud始終致力于為用戶提供更好的產品與服務。通過使用UGC輕松解決用戶的圖片識別技術困擾,助力學霸君圓夢。