15個值得推薦的開源免費(fèi)圖像標(biāo)注工具
圖像標(biāo)注是向圖像添加標(biāo)簽或注釋的元數(shù)據(jù),使圖像上的內(nèi)容具有上下文含義。這個過程在機(jī)器學(xué)習(xí)中具有重要意義,助于在訓(xùn)練視覺模型過程中準(zhǔn)確地識別圖像中的元素。
視覺模型最終的用途也非常廣泛,例如,幫助車輛識別道路上的不同物體或障礙物、通過對醫(yī)學(xué)圖像的識別幫助疾病檢測和診斷。
本文主要推薦一些較好的開源免費(fèi)的圖像標(biāo)注工具。
1.Makesense.ai
https://github.com/SkalskiP/make-sense
Makesense.ai是一個免費(fèi)的在線跨平臺工具,用于標(biāo)記照片,非常適合小型計算機(jī)視覺深度學(xué)習(xí)項目。它簡化了數(shù)據(jù)集的準(zhǔn)備,標(biāo)簽可以以多種格式下載。該應(yīng)用程序使用TypeScript編寫,基于React/Redux框架開發(fā)。它集成了YOLOv、在COCO數(shù)據(jù)集上預(yù)訓(xùn)練的SSD和PoseNet等先進(jìn)的AI模型,可以自動化圖像標(biāo)注。其中AI功能基于TensorFlow.js框架,因為照片不需要傳輸?shù)椒?wù)器,可確保數(shù)據(jù)隱私安全。
2.Labelme
https://github.com/labelmeai/labelme
Labelme是一個基于Python的圖像標(biāo)注工具,支持各種標(biāo)注類型,并提供自定義GUI??梢詫?dǎo)出VOC和COCO格式的數(shù)據(jù)集,用于語義和實例分割。
功能特征:
- 支持多邊形、矩形、圓形、直線、點和圖像級標(biāo)志注釋
- 適用于Ubuntu、macOS和Windows
- 標(biāo)注信息保存為JSON文件
- 高級用法示例
- 將標(biāo)記分配給整個圖像
- 將標(biāo)注指定給單個面
3.Xtreme1
https://github.com/xtreme1-io/xtreme1
Xtreme1是一個用于標(biāo)注多模式訓(xùn)練數(shù)據(jù)的開源平臺,提高了數(shù)據(jù)注釋、管理和本體管理的效率。其人工智能工具旨在提高2D/3D對象檢測、3D實例分割和激光雷達(dá)相機(jī)融合項目的效率。
功能特征:
- 支持圖像、3D LiDAR和2D/3D傳感器融合數(shù)據(jù)集的數(shù)據(jù)標(biāo)注
- 內(nèi)置預(yù)標(biāo)記和交互式模型支持2D/3D對象檢測、分割和分類
- 可配置的本體中心,用于一般類(具有層次結(jié)構(gòu))和屬性,用于模型訓(xùn)練
- 數(shù)據(jù)管理和質(zhì)量監(jiān)測
- 查找和修復(fù)標(biāo)簽錯誤的工具
- 模型結(jié)果可視化以協(xié)助模型評估
- 用于大型語言模型的RLHF(beta版)
- 易于使用Docker或從源代碼安裝
4.Label Studio
https://github.com/HumanSignal/label-studio
Label Studio是一個可用于標(biāo)記數(shù)據(jù)類型(如:音頻、文本、圖像、視頻和時間序列)的開源工具。
- 它具有友好的用戶界面,可以導(dǎo)出標(biāo)準(zhǔn)化格式的數(shù)據(jù),支持集成機(jī)器學(xué)習(xí)模型,并可針對特定項目進(jìn)行定制。
- 它基于Apache-2.0開源許可證。
5.LOST
https://github.com/l3p-cv/lost
LOST(Label Object and Save Time)是一個基于Web的圖像協(xié)同標(biāo)注工具。它提供了預(yù)先構(gòu)建的注釋管道,無需編程知識即可進(jìn)行即時圖像注釋,但也允許用戶定義注釋管道。
該應(yīng)用程序是可擴(kuò)展的,可以輕松連接到外部文件系統(tǒng),如S3 Bucket或Azure Blobstorage。可以在本地或Web服務(wù)器上設(shè)置,并支持組織建立標(biāo)簽樹,監(jiān)控標(biāo)注過程和瀏覽器內(nèi)標(biāo)注。
關(guān)鍵特征:
- 基于Web的協(xié)同圖像標(biāo)注框架
- 用于即時圖像注釋的預(yù)構(gòu)建注釋管道
- 自定義的標(biāo)注管道
- 可擴(kuò)展的應(yīng)用
- 輕松連接到外部文件系統(tǒng),如S3 Bucket或Azure Blobstorage
- 在瀏覽器中實現(xiàn)標(biāo)注過程的可視化
- 可在本地或Web服務(wù)器上進(jìn)行配置
- 支持組織標(biāo)簽樹
- 監(jiān)控標(biāo)注過程
- 支持在瀏覽器內(nèi)標(biāo)注
- 能夠?qū)Π胱詣訕?biāo)注管道進(jìn)行建模
- 標(biāo)注建議生成
- 單圖像標(biāo)注工具(SIA),用于標(biāo)注bbox、多邊形、點或線
- 多圖像標(biāo)注工具(MIA),用于標(biāo)注整個圖像簇
- 導(dǎo)出標(biāo)注函數(shù)
- 基于個人和項目的標(biāo)注統(tǒng)計
- 用于標(biāo)簽組織的彩色標(biāo)簽樹
- 查看標(biāo)注功
- 管道項目進(jìn)出口
- 管道項目共享
- 集成Jupyter-Lab,輕松開發(fā)流水線
- LDAP集成
- 電子郵件通知
- 可擴(kuò)展設(shè)計,跨多臺機(jī)器分布密集型計算過程
6.CVAT
https://github.com/opencv/cvat
CVAT(Computer Vision Annotation Tool )是一種用于視頻和圖像標(biāo)注的交互式工具,在計算機(jī)視覺中廣泛使用。它支持以數(shù)據(jù)為中心的人工智能方法,可以免費(fèi)在線使用,也可以訂閱其他功能。CVAT也可以私有化安裝,并為高級功能提供企業(yè)支持。
7.Gromit-MPX
https://github.com/bk138/gromit-mpx
Gromit-MPX是一個Unix桌面環(huán)境下的標(biāo)注工具,用戶可以直接在屏幕上繪制,突出顯示感興趣的點來增強(qiáng)演示文稿。
8.MyVision
https://github.com/OvidijusParsiunas/myvision
MyVision是一個免費(fèi)的在線圖像標(biāo)注工具,用于生成計算機(jī)視覺的機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)。支持繪制邊界框和多邊形,用于對象標(biāo)注、多邊形操作,并支持各種數(shù)據(jù)集格式。它還支持使用”COCO-SSD”模型進(jìn)行自動標(biāo)注,可以在本地操作以確保數(shù)據(jù)隱私安全。
支持的數(shù)據(jù)格式:
功能特征:
- 為對象標(biāo)注繪制邊界框和多邊形
- 使用要素進(jìn)行面操作以編輯、移除和添加新點
- 支持各種數(shù)據(jù)集格式
- 支持使用“COCO-SSD”模型自動標(biāo)注
- 在本地運(yùn)行以維護(hù)數(shù)據(jù)隱私
- 允許導(dǎo)入和繼續(xù)處理現(xiàn)有批注項目
- 可用于將數(shù)據(jù)集從一種格式轉(zhuǎn)換為另一種格式
9.LabelImg
https://github.com/HumanSignal/labelImg
LabelImg是一個流行的圖像標(biāo)注工具,目前已加入Label Studio社區(qū),不再積極開發(fā)。Label Studio是一個靈活的開源數(shù)據(jù)標(biāo)簽工具,適用于各種類型的數(shù)據(jù),包括圖像,文本,音頻,視頻和時間序列數(shù)據(jù)。
LabelImg中的標(biāo)注信息以PASCAL VOC格式保存,另外,它還支持YOLO和XML格式。
10.Coco Annotator
https://github.com/jsbroks/coco-annotator
COCO Annotator是一個基于Web的高效且多功能的圖像標(biāo)記工具,旨在為訓(xùn)練圖像定位和對象檢測創(chuàng)建數(shù)據(jù)集。
它提供的功能包括段標(biāo)記、對象實例跟蹤以及標(biāo)記具有斷開連接的可見部分的對象。它通過直觀和可定制的界面以COCO格式存儲和導(dǎo)出注釋。
功能特征:
- 基于We的工具
- 高效和通用的圖像標(biāo)記
- 專為圖像定位和物體檢測的訓(xùn)練數(shù)據(jù)創(chuàng)建而設(shè)計
- 段標(biāo)號
- 對象實例跟蹤
- 標(biāo)記具有斷開的可見部分的對象
- 以COCO格式存儲和導(dǎo)出注釋
- 直觀和可定制的界面
- 允許用戶手動定義圖像中的區(qū)域
- 創(chuàng)建文本說明
- 通過邊界框、遮罩工具或標(biāo)記點進(jìn)行對象標(biāo)記
- 自由形式曲線或多邊形標(biāo)注
- 直接導(dǎo)出為COCO格式
- 分割對象的
- 添加關(guān)鍵點的能力
- 用于數(shù)據(jù)分析的有用API端點
- 導(dǎo)入COCO格式的數(shù)據(jù)集
- 將斷開連接的對象標(biāo)注為單個實例
- 同時使用任意數(shù)量的標(biāo)簽標(biāo)記圖像片段
- 允許為每個實例或?qū)ο笞远x元數(shù)據(jù)
- 高級選擇工具,如DEXTR、MaskRCNN和Magic Wand
- 用半訓(xùn)練模型標(biāo)注圖像
- 使用Google圖像生成數(shù)據(jù)集
- 用戶認(rèn)證系統(tǒng)
11.Universal Data Tool
https://github.com/UniversalDataTool/universal-data-tool
Universal Data Tool是一個多功能的應(yīng)用程序,用于編輯和標(biāo)注圖像、文本、音頻和文檔等數(shù)據(jù)類型。它支持圖像分割、文本分類和音頻轉(zhuǎn)錄等任務(wù)。該工具支持實時協(xié)作,可運(yùn)行于各種平臺,并支持多種數(shù)據(jù)格式。
12.RectLabel
https://github.com/ryouchinsa/Rectlabel-support
Label是一個離線圖像標(biāo)注工具,可用于對象檢測和分割。
關(guān)鍵特征:
- 使用Segment Anything模型標(biāo)記面和像素
- 使用Core ML模型自動標(biāo)記
- 行和詞的自動文本識別
- 使用孔標(biāo)記面
- 標(biāo)注三次貝塞爾曲線、線段和點
- 航空影像中面向標(biāo)簽的邊界框
- 使用骨架標(biāo)記關(guān)鍵點
- 使用畫筆和超像素標(biāo)記像素
- 快速設(shè)置對象、屬性、熱鍵和標(biāo)簽
- 在圖庫視圖中搜索對象、屬性和圖像名稱
- 導(dǎo)出為COCO、Labelme、COML、YOLO、DOTA和CSV格式
- 導(dǎo)出索引顏色蒙版圖像和灰度蒙版圖像
- 視頻到圖像幀、增強(qiáng)圖像等。
13.OpenLabeling
https://github.com/Cartucho/OpenLabeling
OpenLabeling是一個用于標(biāo)注圖像和視頻的開源工具。它支持PASCAL VOC和YOLO Darknet等多種格式。
該工具已被用于:深度學(xué)習(xí)對象檢測模型、用于視覺對象跟蹤的干擾感知Siamese網(wǎng)絡(luò)、邊界框跟蹤和用于視頻對象跟蹤的OpenCV跟蹤器。
14.bbox-visualizer
https://github.com/shoumikchow/bbox-visualizer
bbox-visualizer可以幫助用戶在對象周圍繪制邊界框,消除了對標(biāo)簽定位的復(fù)雜數(shù)學(xué)計算的需要。它提供了各種可視化類型,用于在識別后標(biāo)記對象。邊界框點的數(shù)據(jù)格式為:(xmin, ymin, xmax, ymax)。
15.PixelAnnotationTool
https://github.com/abreheret/PixelAnnotationTool
PixelAnnotationTool是一個可以使用OpenCV的分水嶺算法快速手動注釋目錄中圖像的工具。
用戶可以用畫筆手動標(biāo)記區(qū)域,然后啟動算法。如果初始分割需要校正,用戶可以在錯誤區(qū)域上重新繪制新的區(qū)域標(biāo)注。