自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<legend id="zmzaf"><track id="zmzaf"><dfn id="zmzaf"></dfn></track></legend>

<sub id="zmzaf"><p id="zmzaf"></p></sub>

<sup id="zmzaf"><i id="zmzaf"></i></sup>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

深度學(xué)習(xí)二分類評估詳細(xì)解析與代碼實(shí)戰(zhàn)

AI悠閑區(qū)

發(fā)布于 2024-12-20 11:20

瀏覽

0收藏

如果你關(guān)心前面的深度學(xué)習(xí)二分類的實(shí)戰(zhàn)代碼，可以參考下述官方的技術(shù)文檔：使用 Trainer API 微調(diào)模型. https://huggingface.co/learn/nlp-course/zh-CN/chapter3/3

如果你剛接觸自然語言處理，huggingface 是你繞不過去的坎。但是目前它已經(jīng)被墻了，相信讀者的實(shí)力，自行解決吧。

設(shè)置代理，如果不設(shè)置的話，那么huggingface的包無法下載；

import os
os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890'
os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890'

在探討二分類問題時(shí)，經(jīng)常會遇到四種基本的分類結(jié)果，它們根據(jù)樣例的真實(shí)類別與分類器的預(yù)測類別來定義。以下是對這些分類結(jié)果的詳細(xì)解釋：

這四個(gè)定義均由兩個(gè)字母組成，它們各自代表了不同的含義。

第一個(gè)字母（True/False）用于表示算法預(yù)測的正確性，而第二個(gè)字母（Positive/Negative）則用于表示算法預(yù)測的結(jié)果。

第1個(gè)字母（True/False）：描述的是分類器是否預(yù)測正確。True表示分類器判斷正確，而False則表示分類器判斷錯(cuò)誤。
第2個(gè)字母（Positive/Negative）：表示的是分類器的預(yù)測結(jié)果。Positive代表分類器預(yù)測為正例，而Negative則代表分類器預(yù)測為負(fù)例。

真正例（True Positive，TP）：當(dāng)樣例的真實(shí)類別為正例時(shí)，如果分類器也預(yù)測其為正例，那么我們就稱這個(gè)樣例為真正例。簡而言之，真實(shí)情況與預(yù)測結(jié)果均為正例。
假正例（False Positive，F(xiàn)P）：有時(shí)，分類器可能會將真實(shí)類別為負(fù)例的樣例錯(cuò)誤地預(yù)測為正例。這種情況下，我們稱該樣例為假正例。它代表了分類器的“過度自信”或“誤報(bào)”現(xiàn)象。
假負(fù)例（False Negative，F(xiàn)N）：與假正例相反，假負(fù)例指的是真實(shí)類別為正例的樣例被分類器錯(cuò)誤地預(yù)測為負(fù)例。這種情況下的“遺漏”或“漏報(bào)”是分類器性能評估中需要重點(diǎn)關(guān)注的問題。
真負(fù)例（True Negative，TN）：當(dāng)樣例的真實(shí)類別和預(yù)測類別均為負(fù)例時(shí)，我們稱其為真負(fù)例。這意味著分類器正確地識別了負(fù)例。

數(shù)據(jù)準(zhǔn)備

做深度學(xué)習(xí)的同學(xué)應(yīng)該都默認(rèn)裝了 torch，跳過 torch的安裝

!pip install evaluate

導(dǎo)包

import torch
import random
import evaluate

隨機(jī)生成二分類的預(yù)測數(shù)據(jù) pred 和 label；

label = torch.tensor([random.choice([0, 1]) for i in range(20)])
pred = torch.tensor([random.choice([0, 1, label[i]]) for i in range(20)])
sum(label == pred)

下述是隨機(jī)生成的 label 和 pred

# label
tensor([0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 0, 0])

# pred
tensor([0, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1, 1, 1, 0, 0])

使用 random.choice([0, 1, label[i]]? 是為了提高 pred 的準(zhǔn)確率；因?yàn)?label[i] 是真實(shí)的 label；

下述的是計(jì)算TP、TN、FP、FN的值：

Tips:
pred : 與第2個(gè)字母（Positive/Negative）保持一致，
label: 根據(jù)第一個(gè)字母是否預(yù)測正確，再判斷填什么

TP = sum((label == 1) & (pred == 1))
TN = sum((label == 0) & (pred == 0))
FP = sum((label == 0) & (pred == 1))
FN = sum((label == 1) & (pred == 0))

標(biāo)簽	Value
TP	6
TN	8
FP	2
FN	4

準(zhǔn)確率 Accuracy

準(zhǔn)確率（Accuracy）: 分母通常指的是所有樣本的數(shù)量，即包括真正例（True Positives, TP）、假正例（False Positives, FP）、假負(fù)例（False Negatives, FN）和真負(fù)例（True Negatives, TN）的總和。而分子中的第一個(gè)字母為“T”（True），意味著我們計(jì)算的是算法預(yù)測正確的樣本數(shù)量，即TP和TN的總和。

然而，準(zhǔn)確率作為一個(gè)評價(jià)指標(biāo)存在一個(gè)顯著的缺陷，那就是它對數(shù)據(jù)樣本的均衡性非常敏感。當(dāng)數(shù)據(jù)集中的正負(fù)樣本數(shù)量存在嚴(yán)重不均衡時(shí)，準(zhǔn)確率往往不能準(zhǔn)確地反映模型的性能優(yōu)劣。

例如，假設(shè)有一個(gè)測試集，其中包含90%正樣本和10%負(fù)樣本。若模型將所有樣本都預(yù)測為正樣本，那么它的準(zhǔn)確率將輕松達(dá)到90%。從準(zhǔn)確率這一指標(biāo)來看，模型似乎表現(xiàn)得非常好。但實(shí)際上，這個(gè)模型對于負(fù)樣本的預(yù)測能力幾乎為零。

因此，在處理樣本不均衡的問題時(shí)，需要采用其他更合適的評價(jià)指標(biāo)，如精確度（Precision）、召回率（Recall）、F1分?jǐn)?shù)（F1 Score）等，來更全面地評估模型的性能。這些指標(biāo)能夠更準(zhǔn)確地反映模型在各類樣本上的預(yù)測能力，從而幫助我們做出更準(zhǔn)確的決策。

精準(zhǔn)率的公式如下：

深度學(xué)習(xí)二分類評估詳細(xì)解析與代碼實(shí)戰(zhàn)-AI.x社區(qū)

accuracy = evaluate.load("accuracy")
accuracy.compute(
        predictinotallow=pred, 
        references=label
    )

Output:

{'accuracy': 0.7}

下述三種方法都可以用來計(jì)算 accuracy:

print(
    (TP + TN) / (TP + TN + FP +FN),
    (TP + TN) / len(label),
    sum((label == pred)) / 20
)

Output:

tensor(0.7000) tensor(0.7000) tensor(0.7000)

使用公式計(jì)算出來的與通過evaluate庫，算出來的結(jié)果一致，都是 0.7。

precision 精準(zhǔn)率

深度學(xué)習(xí)二分類評估詳細(xì)解析與代碼實(shí)戰(zhàn)-AI.x社區(qū)

precision = evaluate.load("precision")
precision.compute(
        predictinotallow=pred, 
        references=label
    )

Output:

{'precision': 0.75}

TP / (TP + FP)

recall 召回率

深度學(xué)習(xí)二分類評估詳細(xì)解析與代碼實(shí)戰(zhàn)-AI.x社區(qū)

recall = evaluate.load("recall")
recall.compute(
        predictinotallow=pred, 
        references=label
    )

Output:

{'recall': 0.6}

TP / (TP + FN)

F1

f1 = evaluate.load("f1")
f1.compute(
        predictinotallow=pred, 
        references=label
    )

Output:

{'f1': 0.6666666666666666}

深度學(xué)習(xí)二分類評估詳細(xì)解析與代碼實(shí)戰(zhàn)-AI.x社區(qū)

2 * 0.7500 * 0.6000 / (0.7500 + 0.6000)

Output:

0.6666666666666665

參考資料

如何在python代碼中使用代理下載Hungging face模型. https://www.jianshu.com/p/209528bed023
[機(jī)器學(xué)習(xí)] 二分類模型評估指標(biāo)---精確率Precision、召回率Recall、ROC|AUC. https://blog.csdn.net/zwqjoy/article/details/78793162
使用 Trainer API 微調(diào)模型. https://huggingface.co/learn/nlp-course/zh-CN/chapter3/3
Huggingface Evaluate 文檔. https://huggingface.co/docs/evaluate/index?

本文轉(zhuǎn)載自 ??AI悠閑區(qū)??，作者： JieShen

標(biāo)簽

深度學(xué)習(xí)

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

【春“碼”盎然學(xué)習(xí)季】春日生發(fā)，宜學(xué)習(xí)，宜進(jìn)階，宜贏取春日好禮！

AI.x社區(qū)官方賬號 ? 52.2w瀏覽 ? 52回復(fù)
VAE變分自編碼器原理解析看這一篇就夠了！另附Python代碼實(shí)現(xiàn)

angel ? 6778瀏覽 ? 0回復(fù)
Meta LlaMA 3模型深度解析

51CTO內(nèi)容精選 ? 3892瀏覽 ? 0回復(fù)
機(jī)器學(xué)習(xí)之特征工程深度解析

51CTO內(nèi)容精選 ? 2512瀏覽 ? 0回復(fù)
(分類/訓(xùn)練/評估)

angel ? 6020瀏覽 ? 0回復(fù)
應(yīng)用程序任務(wù)驅(qū)動：詳細(xì)解析LLM的評估指標(biāo)

51CTO內(nèi)容精選 ? 3083瀏覽 ? 0回復(fù)
機(jī)器學(xué)習(xí)利器——決策樹分類器深度解析

51CTO內(nèi)容精選 ? 2157瀏覽 ? 0回復(fù)
從零開始掌握OpenCV：Python圖像處理最詳細(xì)入門教程（實(shí)戰(zhàn)代碼全解析）

唐克 ? 3728瀏覽 ? 0回復(fù)
我們一起聊聊分類模型：層次聚類

寶寶數(shù)模AI ? 1658瀏覽 ? 0回復(fù)
LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實(shí)踐

AI悠閑區(qū) ? 1.4w瀏覽 ? 0回復(fù)
Questel：2024深度學(xué)習(xí)與大模型全球?qū)＠皥?bào)告

歐米伽未來研究所 ? 2408瀏覽 ? 0回復(fù)
深入解析變分自編碼器（VAE）：理論、數(shù)學(xué)原理、實(shí)現(xiàn)與應(yīng)用

唐克 ? 3268瀏覽 ? 0回復(fù)
五分鐘讀懂Manus平替：深度解析OpenManus 如何重新定義Multi Agent?

AI博物院 ? 3852瀏覽 ? 0回復(fù)
深度解析Perplexity的深度研究功能

Halo咯咯 ? 1584瀏覽 ? 0回復(fù)
低代碼AI開發(fā)平臺深度對比：Dify、FastGPT與Coze

石映飛云 ? 2887瀏覽 ? 0回復(fù)
MCP協(xié)議深度解析

Halo咯咯 ? 1588瀏覽 ? 0回復(fù)
GPT-4.1系列深度解析：從代碼到動畫，從理論到實(shí)戰(zhàn)，AI的多面手來了！

Halo咯咯 ? 1409瀏覽 ? 0回復(fù)
圖像生成新篇章：OpenAI GPT-image-1 模型深度解析與應(yīng)用前瞻

墨風(fēng)如雪小站 ? 413瀏覽 ? 0回復(fù)
RAG系統(tǒng)從60分到95分的進(jìn)化之路，LlamaParse+多模態(tài)實(shí)戰(zhàn)全解析

AI博物院 ? 334瀏覽 ? 0回復(fù)

AI悠閑區(qū)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

提示詞繞過大模型安全限制 5天前發(fā)布
從零開始微調(diào)Embedding模型：基于BERT的實(shí)戰(zhàn)教程 2025-04-14 01:31:07發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：使用 LlamaFactory 結(jié)合開源大語言模型實(shí)現(xiàn)文本分類：從數(shù)據(jù)集構(gòu)建到 LoRA 微調(diào)與推理評估

下一篇： LLaMA-Factory 微調(diào)與部署詳細(xì)流程：從入門到實(shí)踐

社區(qū)精華內(nèi)容

目錄

<sub id="u1dsw"></sub>

^{<blockquote id="u1dsw"></blockquote>}

^{<blockquote id="u1dsw"></blockquote>}