總模型僅17M!這個(gè)超輕量中文OCR開源項(xiàng)目在Github火了
項(xiàng)目地址:https://github.com/ouyanghuiyu/chineseocr_lite
光學(xué)字符識(shí)別(OCR)相信大家都不陌生,就是指電子設(shè)備(例如掃描儀或數(shù)碼相機(jī))檢查紙上打印的字符,通過檢測(cè)暗、亮的模式確定其形狀,然后用字符識(shí)別方法將形狀翻譯成計(jì)算機(jī)文字的過程。
目前比較常用的中文OCR開源項(xiàng)目是 chineseocr,最近又有一個(gè)新開源的中文OCR項(xiàng)目,登上Github Trending榜單第二——chineseocr_lite
這是一個(gè)超輕量級(jí)中文 ocr,支持豎排文字識(shí)別,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 總模型僅 17M。目前已經(jīng)在Github上標(biāo)星2.6K,累積343個(gè)Fork(Github地址:https://github.com/ouyanghuiyu/chineseocr_lite)
chineseocr_lite實(shí)現(xiàn)的功能如下:
- 提供輕量的backone檢測(cè)模型psenet(8.5M),crnn_lstm_lite(9.5M) 和行文本方向分類網(wǎng)絡(luò)(1.5M)
- 任意方向文字檢測(cè),識(shí)別時(shí)判斷行文本方向
- crnncrnn_lite lstmdense識(shí)別(ocr-dense和ocr-lstm是搬運(yùn)chineseocr的)
- 支持豎排文本識(shí)別
- ncnn 實(shí)現(xiàn) (支持lstm)
- mnn 實(shí)現(xiàn)
話不多說(shuō),先來(lái)看看效果:
接下來(lái),我們?cè)僬f(shuō)一下chineseocr_lite的運(yùn)行環(huán)境:
- Ubuntu 18.04
- Python 3.6.9
- Pytorch 1.5.0.dev20200227+cpu
此外,最近項(xiàng)目作者對(duì)更新了可實(shí)現(xiàn)的功能。
- nihui 大佬實(shí)現(xiàn)的 crnn_lstm 推理
- 升級(jí) crnn_lite_lstm_dw.pth 模型 crnn_lite_lstm_dw_v2.pth , 精度更高
- 提供豎排文字樣例以及字體庫(kù)(旋轉(zhuǎn) 90 度的字體)
如果你也對(duì)這個(gè)項(xiàng)目感興趣就趕緊嘗試下吧。