計(jì)算機(jī)視覺領(lǐng)域非常好用的5個(gè)開源圖像標(biāo)注工具
本文介紹了 5 個(gè)很棒的標(biāo)注工具,我希望它們能幫助你創(chuàng)建計(jì)算機(jī)視覺數(shù)據(jù)集。
如果你是一名計(jì)算機(jī)視覺領(lǐng)域的數(shù)據(jù)科學(xué)家,你可能也意識(shí)到了你需要一個(gè)快速而簡(jiǎn)單的標(biāo)注工具,其原因至少是以下兩個(gè)之一:
- PoC(譯者注:Proof of Concept)或研發(fā)實(shí)驗(yàn)需要?jiǎng)?chuàng)建數(shù)據(jù)集
- 保證你的數(shù)據(jù)質(zhì)量,這樣它就不會(huì)影響你的深度學(xué)習(xí)算法的性能
我深入探究了計(jì)算機(jī)視覺標(biāo)注領(lǐng)域,發(fā)現(xiàn)它包含了大量令人印象深刻的工具(請(qǐng)看如下三個(gè)超級(jí)棒的工具清單:清單一,清單二,清單三,或者查看 這個(gè)博客)。我花了相當(dāng)多的時(shí)間比較最有前景的(和活躍的)項(xiàng)目,發(fā)現(xiàn)其中大部分工具都只能達(dá)到如下三個(gè)設(shè)計(jì)目標(biāo)中的其中一個(gè):
1、如果你想在標(biāo)注行業(yè)展開業(yè)務(wù),你需要:
a. 先進(jìn)的項(xiàng)目管理功能
b. 足夠多的功能,以完成任何標(biāo)注任務(wù)
c. 提高效率的自動(dòng)化工具
2、如果你屬于一家創(chuàng)業(yè)公司,你可能需要:
a. API,或者至少是將標(biāo)注工具連接到私有 API 的簡(jiǎn)單方法
b. 直觀的用戶體驗(yàn)(UX),使你臨時(shí)聘用的每個(gè)標(biāo)注人員都可以立即開始工作
3、如果你只是為自己工作,你:
a. 不用關(guān)心 API 或者項(xiàng)目管理
b. 只是想盡快開始標(biāo)注!
下面是我最喜歡的工具列表,這些工具允許為計(jì)算機(jī)視覺應(yīng)用標(biāo)注包圍框(用于物體檢測(cè)任務(wù))和多邊形框(用于分割任務(wù))。
如果你發(fā)現(xiàn)這些工具不能正常工作,請(qǐng)嘗試在 Chrome 中運(yùn)行它們。
計(jì)算機(jī)視覺標(biāo)注的簡(jiǎn)要基礎(chǔ)知識(shí) [可選]
在計(jì)算機(jī)視覺中,訓(xùn)練算法的數(shù)據(jù)主要有三種類型:
- 圖片 + 分類器訓(xùn)練標(biāo)簽(ResNets)
- 包圍框 + 檢測(cè)器標(biāo)簽(YOLOv3,F(xiàn)aster R-CNN……)
- 多邊形 + 用于分割應(yīng)用程序標(biāo)簽(Mask R-CNN)
注意分割數(shù)據(jù)(藍(lán)色)與檢測(cè)數(shù)據(jù)(紫色)的差異
正如你很可能已經(jīng)意識(shí)到的,對(duì)于 AI 項(xiàng)目來(lái)說(shuō),成功的最重要的影響因素之一是你可以使用的“優(yōu)質(zhì)數(shù)據(jù)”的數(shù)量。我所說(shuō)的計(jì)算機(jī)視覺應(yīng)用的“優(yōu)質(zhì)數(shù)據(jù)”是指:
- 每個(gè)圖片 / 標(biāo)注都有一個(gè)恰當(dāng)?shù)臉?biāo)簽
- 每個(gè)邊界框或多邊形都緊致地包圍著要訓(xùn)練的物體。
即使后一種定義明顯缺乏客觀性,但我們希望我們的算法能夠達(dá)到人類的水平。因此,我們需要“人類水平”的標(biāo)注。
打標(biāo)公司的最佳開源標(biāo)注工具
計(jì)算機(jī)視覺標(biāo)注工具(CVAT)
計(jì)算機(jī)視覺標(biāo)注工具(CVAT)
在推出 OpenCV 近 20 年后,Intel 在計(jì)算機(jī)視覺領(lǐng)域再次發(fā)力,并發(fā)布了 CVAT,這是一個(gè)非常強(qiáng)大和完整的標(biāo)注工具。盡管它需要一些時(shí)間來(lái)學(xué)習(xí)和掌握,但它包含了大量的功能來(lái)標(biāo)注計(jì)算機(jī)視覺數(shù)據(jù)。
優(yōu)點(diǎn):
- 它很容易安裝和擴(kuò)展,因?yàn)樗且粋€(gè)運(yùn)行在 Docker 中的 Web 應(yīng)用程序
- 它包含了許多自動(dòng)化工具(如使用 TensorFlow 物體檢測(cè) API 的自動(dòng)標(biāo)注、視頻插值……)
- 它允許協(xié)同工作管理,這樣團(tuán)隊(duì)中的不同成員就可以在同一個(gè)標(biāo)注任務(wù)上協(xié)同工作
缺點(diǎn):
- UI 相當(dāng)復(fù)雜。例如,對(duì)于初次設(shè)置標(biāo)注任務(wù)的用戶而言,這可能會(huì)非常棘手
- 一開始用起來(lái)不是很直觀,可能需要幾天的時(shí)間來(lái)掌握
- 只能運(yùn)行于 Chrome,所以如果你擔(dān)心谷歌……,你必須找到其他變通辦法
點(diǎn)擊這里查看在線演示:https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces!
創(chuàng)業(yè)公司的最佳開源標(biāo)注工具
可視化對(duì)象標(biāo)注工具(VoTT)
可視化對(duì)象標(biāo)注工具(VoTT)
VoTT 是由微軟開發(fā)的,它提供了非常棒的用戶體驗(yàn),這可能會(huì)在你標(biāo)注時(shí)為你節(jié)省大量的時(shí)間和精力。而且,創(chuàng)建項(xiàng)目也很直接,所以你可以不用深入閱讀其文檔就能使用它。
優(yōu)點(diǎn):
- 代碼寫得非常好(在 React 中),并且完美地定義了接口,因此獲取代碼和添加所需的額外功能都很容易
- 正如我所說(shuō)的,UX 是完美的,它有一個(gè)黑色的主題和一個(gè)跟隨鼠標(biāo)的虛線網(wǎng)格,所以很容易知道從哪里開始標(biāo)注一個(gè)邊界框。這看起來(lái)像是一種額外嘉獎(jiǎng),但是相信我,這對(duì)于標(biāo)注來(lái)說(shuō)真的很重要!
- 它提出使用深度學(xué)習(xí)算法來(lái)自動(dòng)檢測(cè)對(duì)象(它附帶了在 COCO 數(shù)據(jù)集上訓(xùn)練的 SSD 模型)
- 它是一個(gè) web 應(yīng)用程序和一個(gè)電子應(yīng)用程序。這使你可以將它作為一個(gè)重客戶端使用,也可以將它作為 web 瀏覽器中運(yùn)行的應(yīng)用程序來(lái)使用
缺點(diǎn):
- 要使用 web 應(yīng)用程序版本,你需要將數(shù)據(jù)托管在微軟的云計(jì)算服務(wù) Azure 上(然而,電子版應(yīng)用程序允許你在硬盤上使用數(shù)據(jù),但需要使用 npm 安裝程序)
- 它沒有提供一個(gè)內(nèi)置的 API(但是,通過(guò)調(diào)整代碼,使你的私有 API 能夠與之通信,這是非常容易的)
- 你不能給整張圖片貼標(biāo)簽:你只被允許繪制帶有相關(guān)標(biāo)簽的邊界框(或多邊形)。因此,它不適合創(chuàng)建 分類數(shù)據(jù)庫(kù)
點(diǎn)擊 https://vott.z5.web.core.windows.net/ 查看網(wǎng)頁(yè)應(yīng)用程序!
DataTurks
DataTurks
DataTurks 是一家成立于 2018 年的初創(chuàng)公司,提供圖片、視頻和文字的標(biāo)注服務(wù)。然而,直到最近它才成為開源軟件(這可能與沃爾瑪在 2019 年 2 月買下了它有關(guān)),此前你都必須向其付費(fèi)。盡管在那之后,他們幾乎沒有對(duì)外發(fā)聲,而且似乎已經(jīng)停止了任何開發(fā),但是這個(gè)標(biāo)注工具非常棒,而且現(xiàn)在是免費(fèi)的!
當(dāng)你使用它的時(shí)候,不用在意任何許可,也不用考慮隨處可見的任何非商業(yè)用途的限制條款。Dataturks 現(xiàn)在免費(fèi)啦,而且你可以使用它的所有功能(我已經(jīng)嘗試和測(cè)試過(guò)了)!
優(yōu)點(diǎn):
- 說(shuō)起 CVAT,它是一個(gè)在 Docker 中運(yùn)行的 Web 應(yīng)用程序(查看 https://medium.com/@dataturks/dataturks-on-prem-a-fully-self-hosted-data-annotation-solution-86b455bf0634 獲取 Docker 圖像)
- 允許協(xié)作和異步工作:處理相同數(shù)據(jù)集的兩個(gè)隊(duì)友不會(huì)得到相同的圖像進(jìn)行標(biāo)注
- 提出一種用于創(chuàng)建和獲取標(biāo)注任務(wù)的 API
缺點(diǎn):
- DataTurks 似乎已經(jīng)停止了其產(chǎn)品的開發(fā)
- UX 還可以,但是一些小小的調(diào)整還可以讓它變得更好
- 點(diǎn)擊 https://dataturks.com/projects/Dataturks 查看在線演示!
自定義最好的開源圖像標(biāo)注工具
Make-Sense
MakeSense.ai
Make-sense 在 2019 年 6 月剛剛發(fā)布,并且已經(jīng)擁有了令人難以置信的用戶體驗(yàn)。開始啟動(dòng)打標(biāo)從來(lái)沒有這么快!進(jìn)入網(wǎng)站,拖放你的圖片,即可開始標(biāo)注。
優(yōu)點(diǎn):
- 快速,高效,但最重要的是,簡(jiǎn)單!
- 很酷的用戶體驗(yàn)
- 至于你上傳的圖片的隱私問(wèn)題,不要擔(dān)心,因?yàn)樗麄冋f(shuō):“【我們】不會(huì)存儲(chǔ)你的圖片,因?yàn)槲覀儾粫?huì)把它們發(fā)送到任何地方。”
缺點(diǎn):
- 不提供任何項(xiàng)目管理功能
- 也不提供任何 API
點(diǎn)擊 https://www.makesense.ai/ 開始打標(biāo)!
我希望這篇文章能夠幫助你選擇一個(gè)適合你需要的打標(biāo)工具,如果你找到了更好的工具,請(qǐng)盡管在評(píng)論區(qū)告訴我們!
P.S. 以下是其他一些工具的簡(jiǎn)短列表,這些工具盡管我沒有提到,但是都很酷。
- VGG VIA,一個(gè)非常容易使用的標(biāo)注器,其由牛津機(jī)器人實(shí)驗(yàn)室開發(fā)。它被編碼在單個(gè)的 html/js 文件里,所以它很容易進(jìn)行開發(fā)!
- LabelMe,由麻省理工學(xué)院開發(fā)的。在 這里 可以看到一個(gè)在線版本,或者在 這里 可以運(yùn)行它。
- Coco-Annotator 似乎功能很齊全,但它是最近才出現(xiàn)的(用戶身份驗(yàn)證系統(tǒng)、API 接入點(diǎn))。查看 這里 的演示(用戶名:admin 密碼:password)