準(zhǔn)備 YOLO 訓(xùn)練數(shù)據(jù):數(shù)據(jù)標(biāo)注技術(shù)和優(yōu)秀實踐
如果你已經(jīng)對YOLO目標(biāo)檢測算法有了基本的了解,并且可能迫不及待地想在你的項目中嘗試它。成功的關(guān)鍵是一個定制的訓(xùn)練數(shù)據(jù)集。
量身定制的數(shù)據(jù)集對于開發(fā)高精度、高效的YOLO模型至關(guān)重要,這些模型滿足你的特定用例需求。通過標(biāo)注你自己的數(shù)據(jù),你確保模型學(xué)習(xí)識別與你領(lǐng)域相關(guān)的對象,無論是在道路上檢測車輛、識別傳送帶上的產(chǎn)品,還是在建筑工地上發(fā)現(xiàn)安全隱患。
在這篇文章中,我們將指導(dǎo)你如何準(zhǔn)備用于訓(xùn)練YOLO模型的標(biāo)注數(shù)據(jù),從在圖像中標(biāo)記對象到組織你的數(shù)據(jù)集。
YOLO 訓(xùn)練的數(shù)據(jù)準(zhǔn)備
記住,一個準(zhǔn)備充分的標(biāo)注數(shù)據(jù)集不僅提高了模型的性能,還減少了訓(xùn)練所需的時間和資源。數(shù)據(jù)準(zhǔn)備過程可以分為四個步驟:
- 數(shù)據(jù)收集:收集一個大型、多樣化的圖像數(shù)據(jù)集,代表你希望模型檢測的所有類別。你可以使用像COCO和Pascal VOC這樣的公共數(shù)據(jù)集,或者收集你自己的定制數(shù)據(jù)。
- 數(shù)據(jù)標(biāo)注:每張圖像都需要YOLO格式的標(biāo)注,包括每個對象的類別和位置(通常是邊界框)。標(biāo)注的準(zhǔn)確性直接影響模型性能。
- 標(biāo)注格式轉(zhuǎn)換:YOLO需要特定格式的標(biāo)注。每張圖像都有一個.txt文件,列出所有對象及其類別和邊界框信息。邊界框的格式如下:
<object-class> <x_center> <y_center> <width> <height>
坐標(biāo)是相對于圖像尺寸歸一化的。<object-class> 是類別索引。
- 數(shù)據(jù)集分割:將數(shù)據(jù)集分割為訓(xùn)練集、驗證集和測試集。這對于避免過擬合并評估模型性能至關(guān)重要。典型的分割比例是70%訓(xùn)練,15%驗證,15%測試。
YOLO 的數(shù)據(jù)標(biāo)注
現(xiàn)在,讓我們逐步了解數(shù)據(jù)標(biāo)注過程,為YOLO訓(xùn)練準(zhǔn)備數(shù)據(jù)集。首先,選擇一個標(biāo)注工具。開源和基于云的工具都可以工作,但在線版本對于團(tuán)隊來說往往更高效。我們將以BasicAI Cloud為例,這是目標(biāo)檢測研究的流行選擇。無需安裝;只需在https://app.basic.ai. 注冊一個免費賬戶即可。
我們已經(jīng)收集了一個用于海龜檢測的數(shù)據(jù)集。沒有標(biāo)注,模型無法學(xué)習(xí),所以讓我們開始標(biāo)注。
上傳數(shù)據(jù)
在BasicAI Cloud UI上,轉(zhuǎn)到“Datasets”,點擊“+Create”,選擇“Image”類型,命名你的數(shù)據(jù)集,然后點擊“Create”。
在預(yù)覽界面中,點擊藍(lán)色“+Upload”按鈕。你可以通過本地文件、URL或云存儲上傳。這里,我們從本地地址上傳。
創(chuàng)建本體
讓我們創(chuàng)建一個“Turtle”本體類別。轉(zhuǎn)到“Ontology”標(biāo)簽頁,點擊“+Create”。選擇邊界框類型,命名它,并設(shè)置框顏色。
標(biāo)注數(shù)據(jù)
回到“Data”標(biāo)簽頁,選擇所有數(shù)據(jù),然后點擊“Annotate”。
標(biāo)注工具在左側(cè),類別在右側(cè)。
選擇“Bounding Box Tool”(快捷鍵‘1’)。光標(biāo)變成十字準(zhǔn)線。
提示:預(yù)先選擇類別,以便自動將其分配給新框。非常適合多目標(biāo)檢測。
點擊對象的一個角,然后點擊對角,創(chuàng)建一個框。使用箭頭工具調(diào)整邊緣。詳情可以參考:
https://video.wixstatic.com/video/4b3c31_95a85dde75de4bbf83e616098f9b73b1/720p/mp4/file.mp4
提示:在“Display setting”中啟用“Measure Line”以獲得輔助線。
使用這種方法在所有圖像中標(biāo)注對象。完成后點擊“Save”并退出。
“Preview Annotateions”顯示結(jié)果。
導(dǎo)出數(shù)據(jù)點擊“Export”以創(chuàng)建導(dǎo)出任務(wù)。
在“Annotation Format”下,選擇YOLO的TXT格式。點擊“Create”。
準(zhǔn)備好后下載結(jié)果。
每個文件都包含訓(xùn)練所需的信息。在這里,系統(tǒng)自動將“0”分配給單個標(biāo)簽。
項目結(jié)構(gòu)像YOLO v7一樣組織項目,因為其結(jié)構(gòu)與v9非常相似。
為什么選擇BasicAI Cloud進(jìn)行YOLO數(shù)據(jù)標(biāo)注?
BasicAI Cloud是一個全面的智能數(shù)據(jù)標(biāo)注解決方案,它與你的YOLO工作流程無縫集成,使標(biāo)注過程高效且協(xié)作。
- 全面功能:BasicAI Cloud支持所有數(shù)據(jù)類型,包括圖像、視頻、激光雷達(dá)融合、音頻和文本。模型輔助工具支持自動預(yù)標(biāo)注(實例標(biāo)注、語義分割、語音識別)和交互式標(biāo)注。
- 為團(tuán)隊協(xié)作而建:可擴(kuò)展的項目管理,將外部團(tuán)隊和模型集成到自定義工作流程中??焖倥糠峙錁?biāo)注任務(wù)。自定義實時QA快速捕捉質(zhì)量問題。提供了詳細(xì)的績效報告。
- 數(shù)據(jù)集管理:上傳預(yù)標(biāo)注數(shù)據(jù)進(jìn)行微調(diào)。視頻幀提取和連續(xù)幀分割/合并。云存儲集成。
- 成本:免費賬戶幾乎具有全部功能——5個座位,200GB存儲,10,000個免費自動標(biāo)簽。
它們非常適合小型研究團(tuán)隊,并且對于大型團(tuán)隊來說價格具有競爭力。提供企業(yè)級本地部署。通過利用BasicAI Cloud滿足你的YOLO數(shù)據(jù)標(biāo)注需求,你可以簡化準(zhǔn)備高質(zhì)量標(biāo)注數(shù)據(jù)的過程,與你的團(tuán)隊有效協(xié)作,并輕松管理你的數(shù)據(jù)集。這個強(qiáng)大的平臺使你能夠?qū)W⒂陂_發(fā)準(zhǔn)確高效的YOLO目標(biāo)檢測模型,同時最小化花在數(shù)據(jù)標(biāo)注上的時間和精力。