自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="2kz4y"></blockquote>}

<center id="2kz4y"></center>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

身份證識別服務性能優(yōu)化實踐

發(fā)布于 2025-3-13 07:05

瀏覽

0收藏

本文作者為中國移動云能力中心云智團隊圖像處理算法工程師周華健。身份證識別場景下服務調用量大，往往對于服務的吞吐量要求較高。本文主要從業(yè)務邏輯、模型、工程三個層面對身份證識別服務進行優(yōu)化，取得了較大的性能提升。

1. 業(yè)務邏輯優(yōu)化

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

一個身份證通常包含了4個模型，身份證檢測模型，身份證方向判斷模型，身份證文字檢測模型，身份證文字識別模型。由于身份證檢測與身份證文字檢測模型任務類型相似，模型輸入圖像也可以一致，因此將二者的模型進行合并。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

這里采用一個骨干網+兩個分支的架構實現模型的合并，采用輕量級模型mobilenetV3[1]作為模型的骨干網，分別取DBNet[2]（常用文字檢測算法）及PicoDet[3]（百度輕量級檢測算法）的頭部分支作為模型的head。如此可以減少一個模型推理及其預處理的計算開銷，提升效率。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

2.模型效率優(yōu)化

為了提升模型推理的效率，在模型設計中廣泛使用分組卷積。分組卷積是一種高效的卷積。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

假設標準卷積操作的輸入特征圖尺寸為{H,W,c1}，卷積核尺寸為{h1,w1,c1}，輸出特征圖尺寸為{H,W,c2}，標準卷積層的參數量為：h1*w1*c1*c2。假設分組卷積操作將輸入特征圖按照通道數分成g組，則每組通道輸入特征圖的尺寸為{H,W,c1/g}，對應的卷積核尺寸為{h1,w1,c1/g}，每組輸出特征圖尺寸為{H,W,c2/g}。將g組結果拼接，得到最終尺寸為{H,W,c2}的輸出特征圖。分組卷積層的參數量為h1*w1*(c1/g)*(c2/g)*g=h1*w1*c1*c2/g。在相同輸入輸出大小的情況下，分組卷積較標準卷積參數量及計算量減少為原來的1/g。

為了整體性能，這次優(yōu)化將所有的模型包括檢測模型、方向判斷模型、文字識別模型從標準卷積模型的骨干網升級為使用帶分組卷積的MobileNet系列骨干網，大幅提升模型推理的效率。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

3. 工程優(yōu)化

服務化框架的性能通常是被忽略的，舊版服務采用multimodel server。本次優(yōu)化選用Paddle C++ Serving[4]框架。Paddle C++ Serving采用brpc框進行Client/Server端的通信。brpc是百度開源的一款PRC網絡框架，具有高并發(fā)、低延時等特點的核心執(zhí)行引擎是一個有向無環(huán)圖(也稱作DAG圖），DAG圖中的每個節(jié)點(在PaddleServing中,借用模型中operator算子的概念，將DAG圖中的節(jié)點也稱為OP代表預估服務的一個環(huán)節(jié),可以理解為模型的前后處理環(huán)節(jié)，DAG圖支持多個OP按照串并聯的方式進行組合，從而實現在一個服務中完成多個模型的預測整合最終產出結果。

整個框架原理如下圖所示，可分為Client Side 和Server Side。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

Client端通過Pybind API接口將Request請求，按照ProtoBuf協議進行序列化后，經由BRPC網絡框架Client端發(fā)送給Server端。Paddle C++ Serving中定義了Client Side 和 Server Side之間通信的Protobuf, Portobuf的序列化的結果體積要比XML、JSON小很多，速度比XML、JSON快很多。對于較小的圖片性能差異不大，但是對大圖像性能差異明顯。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

Client端等待Server端的返回數據并反序列化為正常的數據，之后將結果返給Client調用方。Server端接收到序列化的Request請求后，反序列化正常數據，進入圖執(zhí)行引擎，按照定義好的DAG圖結構，執(zhí)行每個OP環(huán)節(jié)的操作。身份證識別模塊定義了3個C++實現的OP，分別是身份證檢測及文字檢測前后處理OP，方向判斷前后處理OP，文字識別前后處理OP，性能較multimodel server中python實現的前后處理更為優(yōu)越。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

當DAG圖中所有OP環(huán)節(jié)均執(zhí)行完成后，將結果數據序列化后返回給Client端。

Paddler Serving支持使用TensorRT推理引擎進行推理，性能較其原生的paddleinference更為優(yōu)越。

身份證識別服務性能優(yōu)化實踐-AI.x社區(qū)

4. 總結

本次從業(yè)務邏輯層面、模型層面、工程層面對身份證識別服務進行優(yōu)化，精度輕微下降，性能得到了大幅提升，后續(xù)將繼續(xù)探索低精度推理等性能優(yōu)化技術以進一步提升服務性能，降低運營成本。

5. 參考文獻

[1] Searching for MobileNetV3. https://arxiv.org/abs/1905.02244

[2] Real-time Scene Text Detection with Differentiable Binarization

??https://arxiv.org/pdf/1911.0894??

[3] PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices

??https://arxiv.org/abs/2111.00902??

4] https://github.com/PaddlePaddle/Serving

本文轉載自 ??AI遇見云??，作者：周華健

標簽

贊

收藏

回復

舉報

回復

相關推薦

大模型推理優(yōu)化實踐：KV cache復用與投機采樣

wx5bbef785639a1 ? 5987瀏覽 ? 0回復
再次提升RAG性能：兩種高效的Rerank模型實踐指南

AIGC觀察者 ? 1.9w瀏覽 ? 0回復
如何在保證模型性能條件下優(yōu)化Prompt降低使用成本及響應延遲？

Syrupup ? 2501瀏覽 ? 0回復
兩篇論文：面向AI/ML集群的高性能網絡傳輸協議優(yōu)化研究

chengganfei ? 2775瀏覽 ? 0回復
輕量級級表格識別算法模型-SLANet

大模型自然語言處理 ? 2516瀏覽 ? 0回復
一次多模態(tài)大模型表格識別解析探索小實踐記錄

大模型自然語言處理 ? 2183瀏覽 ? 0回復
提升RAG性能的全攻略：優(yōu)化檢索增強生成系統的策略大揭秘

Halo咯咯 ? 5201瀏覽 ? 0回復
文本文字識別、公式識別、表格文字識別核心算法及思路及實踐-DBNet、CRNN、TrOCR

大模型自然語言處理 ? 2467瀏覽 ? 0回復
商業(yè)化大前端在性能優(yōu)化領域的探索與實踐

快手技術 ? 1845瀏覽 ? 0回復
人臉識別和MTCNN模型

一起AI技術 ? 1831瀏覽 ? 0回復
DeepSeek-V3 模型深度剖析：架構創(chuàng)新、訓練優(yōu)化與性能卓越

AI論文解讀 ? 9906瀏覽 ? 0回復
提升RAG性能：分塊后，Chunk Enrichment的2個關鍵優(yōu)化步驟不可錯過

凝固的雨_1 ? 2139瀏覽 ? 0回復
低成本+高性能+超靈活！Deepseek 671B + Milvus 重新定義知識庫搭建！

玄姐聊AGI ? 4217瀏覽 ? 0回復
從大模型性能優(yōu)化到DeepSeek部署

卓勝微wjp ? 4138瀏覽 ? 0回復
從推理到編程，詳細比較DeepSeek 32B、70B、R1實踐性能

小虎哦哦 ? 9584瀏覽 ? 0回復
PathRAG：通過圖剪枝的方法優(yōu)化Graph-based RAG的性能方法淺析

大模型自然語言處理 ? 1680瀏覽 ? 0回復
Google Gemma 3：性能“炸裂”還是榜單優(yōu)化？

amei2000go ? 1360瀏覽 ? 0回復
公式識別：利用分層且聚焦細節(jié)的網絡提升復雜公式識別能力

大模型自然語言處理 ? 884瀏覽 ? 0回復
五個開源 MCP 服務器，讓你的AI代理勢如破竹

51CTO技術棧 ? 950瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

揭秘Google A2A協議：原理、應用與未來 9h前發(fā)布
融合語言模型的多模態(tài)大模型研究 2025-04-08 00:32:18發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現 Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：淺談國產化AI芯片模型部署實踐

下一篇：融合語言模型的多模態(tài)大模型研究

社區(qū)精華內容

目錄

<acronym id="ubl5a"></acronym>