自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="lnp61"></style>

<center id="lnp61"></center>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

數(shù)據(jù)科學(xué)簡(jiǎn)化：統(tǒng)計(jì)學(xué)習(xí)的關(guān)鍵概念

作者：小熊大學(xué)AI 2019-08-19 09:31:47

大數(shù)據(jù)

在本文中，我將深入探討數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)習(xí)概念。首先，我將定義什么是統(tǒng)計(jì)學(xué)習(xí)。然后，我們將深入研究統(tǒng)計(jì)學(xué)習(xí)中的關(guān)鍵概念。

在本文中，我將深入探討數(shù)據(jù)科學(xué)中的統(tǒng)計(jì)學(xué)習(xí)概念。

首先，我將定義什么是統(tǒng)計(jì)學(xué)習(xí)。然后，我們將深入研究統(tǒng)計(jì)學(xué)習(xí)中的關(guān)鍵概念。

什么是統(tǒng)計(jì)學(xué)習(xí)?

數(shù)據(jù)科學(xué)簡(jiǎn)化：統(tǒng)計(jì)學(xué)習(xí)的關(guān)鍵概念

根據(jù)維基百科，統(tǒng)計(jì)學(xué)習(xí)理論是從統(tǒng)計(jì)學(xué)和功能分析領(lǐng)域中提取的機(jī)器學(xué)習(xí)的框架。

機(jī)器學(xué)習(xí)是通過(guò)軟件應(yīng)用程序?qū)崿F(xiàn)的統(tǒng)計(jì)學(xué)習(xí)技術(shù)的表現(xiàn)。

這在實(shí)踐中意味著什么?統(tǒng)計(jì)學(xué)習(xí)是指能夠使我們更好地理解數(shù)據(jù)的工具和技術(shù)。理解數(shù)據(jù)是什么意思?

在統(tǒng)計(jì)學(xué)習(xí)的背景下，有兩種類(lèi)型的數(shù)據(jù)：

可以直接控制的數(shù)據(jù)被稱(chēng)為自變量。
無(wú)法直接控制的數(shù)據(jù)被稱(chēng)為因變量。
無(wú)法控制的數(shù)據(jù)，即因變量需要預(yù)測(cè)或估計(jì)。

更好地理解數(shù)據(jù)是根據(jù)自變量來(lái)表示因變量。讓我用一個(gè)例子來(lái)說(shuō)明它：

假設(shè)我想根據(jù)我為電視，廣播和打印分配的廣告預(yù)算來(lái)衡量銷(xiāo)售額。我可以控制可以分配給電視，廣播和打印的預(yù)算。我無(wú)法控制的是它們將如何影響銷(xiāo)售。我想用我無(wú)法控制的數(shù)據(jù)(銷(xiāo)售)作為我可以控制的數(shù)據(jù)(廣告預(yù)算)的函數(shù)。

統(tǒng)計(jì)學(xué)習(xí)揭示隱藏的數(shù)據(jù)關(guān)系。依賴(lài)數(shù)據(jù)和獨(dú)立數(shù)據(jù)之間的關(guān)系。

參數(shù)和模型

運(yùn)營(yíng)管理中著名的商業(yè)模式之一是ITO模型。它代表輸入 - 轉(zhuǎn)換 - 輸出模型。這些輸入經(jīng)歷了一些轉(zhuǎn)換創(chuàng)建一個(gè)輸出。

統(tǒng)計(jì)學(xué)習(xí)也應(yīng)用了類(lèi)似的概念。有輸入數(shù)據(jù)，輸入數(shù)據(jù)被轉(zhuǎn)換，生成輸出(需要預(yù)測(cè)或估計(jì)的數(shù)據(jù))。

轉(zhuǎn)換引擎稱(chēng)為模型。這些是估算輸出的函數(shù)。

這個(gè)轉(zhuǎn)換是數(shù)學(xué)上的。將數(shù)學(xué)成分添加到輸入數(shù)據(jù)中以估計(jì)輸出。這些成分稱(chēng)為參數(shù)。

讓我們來(lái)看一個(gè)例子：

是什么決定了一個(gè)人的收入?收入是由一個(gè)人的教育和多年的經(jīng)驗(yàn)決定的。估計(jì)收入的模型可以是這樣的：收入= c +β0*教育+β1*經(jīng)驗(yàn)

β0和β1是表示收入與教育和經(jīng)驗(yàn)相關(guān)的參數(shù)。

教育和經(jīng)驗(yàn)是可控的變量。這些可控變量具有不同的同義詞。它們被稱(chēng)為自變量。它們也被稱(chēng)為特征。

收入是無(wú)法控制的變量。它們被稱(chēng)為目標(biāo)。

訓(xùn)練和測(cè)試

數(shù)據(jù)科學(xué)簡(jiǎn)化：統(tǒng)計(jì)學(xué)習(xí)的關(guān)鍵概念

當(dāng)我們準(zhǔn)備考試時(shí)，我們?cè)撛趺崔k?研究，學(xué)習(xí)，接受，做筆記，練習(xí)，模擬測(cè)試。這些是學(xué)習(xí)和準(zhǔn)備未知測(cè)試的工具。

機(jī)器學(xué)習(xí)也使用類(lèi)似的學(xué)習(xí)概念。數(shù)據(jù)是有限的，可用的數(shù)據(jù)需要謹(jǐn)慎使用。構(gòu)建的模型需要進(jìn)行驗(yàn)證。驗(yàn)證它的方法如下：

將數(shù)據(jù)拆分為兩部分。

一部分進(jìn)行訓(xùn)練。讓模型從中學(xué)習(xí)，讓模型使用數(shù)據(jù)。此數(shù)據(jù)集稱(chēng)為訓(xùn)練數(shù)據(jù)。
另一部分進(jìn)行測(cè)試。使用未知的數(shù)據(jù)對(duì)模型進(jìn)行“測(cè)試”。此數(shù)據(jù)集稱(chēng)為測(cè)試數(shù)據(jù)。

在競(jìng)爭(zhēng)性考試中，如果準(zhǔn)備充分，學(xué)習(xí)合理，那么最后的考試成績(jī)也會(huì)令人滿(mǎn)意。類(lèi)似地，在機(jī)器學(xué)習(xí)中，如果模型從訓(xùn)練數(shù)據(jù)中很好地學(xué)習(xí)，則它將在測(cè)試數(shù)據(jù)上表現(xiàn)良好。

類(lèi)似地，在機(jī)器學(xué)習(xí)中，一旦在測(cè)試數(shù)據(jù)集上測(cè)試了模型，就會(huì)評(píng)估模型的性能。它是根據(jù)估計(jì)的輸出與實(shí)際值的接近程度來(lái)評(píng)估的。

方差和偏差

數(shù)據(jù)科學(xué)簡(jiǎn)化：統(tǒng)計(jì)學(xué)習(xí)的關(guān)鍵概念

英國(guó)著名統(tǒng)計(jì)學(xué)家喬治·博克斯曾引用過(guò)：

“All models are wrong, but some are useful。“

沒(méi)有一個(gè)模型是100%準(zhǔn)確的。所有模型都是有誤差的。這些誤差來(lái)自?xún)蓚€(gè)來(lái)源：

偏差
方差

讓我試著用類(lèi)比來(lái)解釋這個(gè)。

一個(gè)7歲的孩子，剛剛學(xué)習(xí)了乘法的概念。他已經(jīng)掌握了1和2的法則。他的下一個(gè)挑戰(zhàn)是學(xué)習(xí)3的法則。他非常興奮并開(kāi)始練習(xí)3的乘法表。他的表是這樣的：

3 x 1 = 4
3 x 2 = 7
3 x 3 = 10
3 x 4 = 13
3 x 5 = 16

他的同學(xué)和他一樣，但是他的表看起來(lái)是這樣的：

3 x 1 = 5
3 x 2 = 9
3 x 3 = 18
3 x 4 = 24
3 x 5 = 30

讓我們從機(jī)器學(xué)習(xí)的角度來(lái)研究?jī)蓚€(gè)學(xué)生創(chuàng)建的乘法模型。(我們將兩個(gè)孩子認(rèn)定為A，B)

A的模型有一個(gè)無(wú)效的假設(shè)。它假設(shè)乘法運(yùn)算意味著在結(jié)果之后添加一個(gè)1。該假設(shè)引入了偏置誤差。假設(shè)是一致的，即在輸出中加1。這意味著A的模型具有較低的偏差。
A的模型導(dǎo)致輸出始終與實(shí)際相差1個(gè)數(shù)。這意味著他的模型具有低方差。
B的模型輸出沒(méi)有邏輯。他的模型輸出與實(shí)際值有很大差異。偏差沒(méi)有一致的模式。B的模型具有高偏差和高方差。

上面的例子粗略地解釋了方差和偏差的重要概念。

偏壓：是模型不考慮數(shù)據(jù)中的所有信息，從而不斷學(xué)習(xí)錯(cuò)誤的東西的傾向。
方差：是模型在不考慮真實(shí)信息的情況下獲取隨機(jī)信息的傾向。

偏差 - 方差的權(quán)衡

數(shù)據(jù)科學(xué)簡(jiǎn)化：統(tǒng)計(jì)學(xué)習(xí)的關(guān)鍵概念

如果模型對(duì)特定的數(shù)據(jù)集了解太多，并試圖將相同的模型應(yīng)用于未知的數(shù)據(jù)，則會(huì)出現(xiàn)較高的誤差。從給定數(shù)據(jù)集中學(xué)習(xí)太多被稱(chēng)為過(guò)度擬合，它沒(méi)有將學(xué)習(xí)推廣到有用的未知數(shù)據(jù)上。另一方面，學(xué)習(xí)太少會(huì)導(dǎo)致欠擬合，該模型非常差，甚至無(wú)法從給定的數(shù)據(jù)中學(xué)習(xí)。

阿爾伯特愛(ài)因斯坦簡(jiǎn)潔地總結(jié)了這個(gè)概念。他說(shuō)：

“每件事都應(yīng)該盡可能地簡(jiǎn)單，但絕不是越簡(jiǎn)單越好。”

在機(jī)器學(xué)習(xí)的問(wèn)題中，一個(gè)不斷努力的目標(biāo)就是找到一個(gè)正確的平衡點(diǎn)。創(chuàng)建一個(gè)不太復(fù)雜且不太簡(jiǎn)單的模型，創(chuàng)建一個(gè)通用模型，創(chuàng)建一個(gè)相對(duì)不準(zhǔn)確但有用的模型。

過(guò)度擬合的模型很復(fù)雜。它在訓(xùn)練數(shù)據(jù)方面表現(xiàn)很好。它在測(cè)試數(shù)據(jù)方面表現(xiàn)不佳。
欠擬合的模型過(guò)于簡(jiǎn)單。它對(duì)訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)都無(wú)法正常的執(zhí)行。
一個(gè)好的模型可以平衡欠擬合和過(guò)度擬合。它盡可能簡(jiǎn)單但并不簡(jiǎn)單。

這種平衡行為稱(chēng)為偏差 - 方差的權(quán)衡。

結(jié)論

統(tǒng)計(jì)學(xué)習(xí)是復(fù)雜機(jī)器學(xué)習(xí)應(yīng)用的基礎(chǔ)。本文介紹了統(tǒng)計(jì)學(xué)習(xí)的一些基本概念。本文的前5個(gè)要點(diǎn)是：

統(tǒng)計(jì)學(xué)習(xí)揭示隱藏的數(shù)據(jù)關(guān)系。依賴(lài)數(shù)據(jù)和獨(dú)立數(shù)據(jù)之間的關(guān)系。
模型是轉(zhuǎn)換引擎。參數(shù)是實(shí)現(xiàn)轉(zhuǎn)換的要素。
模型使用訓(xùn)練數(shù)據(jù)來(lái)學(xué)習(xí)，使用測(cè)試數(shù)據(jù)進(jìn)行評(píng)估。
All models are wrong, but some are useful(所有模型都是錯(cuò)誤的; 只有一些是有用的。)
偏差 - 方差權(quán)衡是一種平衡行為。平衡找到最佳平衡點(diǎn)，找到最優(yōu)模型。

我們將在以后繼續(xù)深入研究機(jī)器學(xué)習(xí)模型的細(xì)節(jié)。

責(zé)任編輯：未麗燕來(lái)源：今日頭條

數(shù)據(jù)機(jī)器學(xué)習(xí)統(tǒng)計(jì)學(xué)習(xí)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<cite id="tbkqf"></cite>

<s id="tbkqf"><abbr id="tbkqf"><menuitem id="tbkqf"></menuitem></abbr></s>

<sub id="tbkqf"></sub>

<sub id="tbkqf"></sub>