最強(qiáng)總結(jié),必會(huì)的四大統(tǒng)計(jì)檢驗(yàn)方法?。?!
大家好,我是小寒
統(tǒng)計(jì)檢驗(yàn)是分析數(shù)據(jù)和做出可靠決策的重要工具。它們幫助我們發(fā)現(xiàn)模式、比較組別并理解數(shù)據(jù)中的關(guān)系。
作為一名數(shù)據(jù)分析師,了解何時(shí)以及如何使用這些檢驗(yàn)可以讓你的工作更準(zhǔn)確、更有意義。
統(tǒng)計(jì)檢驗(yàn)的定義
統(tǒng)計(jì)檢驗(yàn)是一種統(tǒng)計(jì)學(xué)方法,用于判斷樣本數(shù)據(jù)是否支持關(guān)于總體參數(shù)的某一假設(shè)。通過對樣本數(shù)據(jù)的分析,統(tǒng)計(jì)檢驗(yàn)可以幫助我們做出科學(xué)推斷,以確定原假設(shè)是否成立或需要被拒絕。
統(tǒng)計(jì)檢驗(yàn)是統(tǒng)計(jì)學(xué)中最核心的內(nèi)容之一,廣泛應(yīng)用于科學(xué)研究、工程實(shí)踐、市場分析和醫(yī)療試驗(yàn)中,例如驗(yàn)證藥物的療效、比較不同教學(xué)方法的效果等。
統(tǒng)計(jì)檢驗(yàn)的基本框架
3.顯著性水平
顯著性水平是拒絕原假設(shè)時(shí)可能犯錯(cuò)誤的概率,通常取值為 0.05 或 0.01。
它衡量我們接受一定程度的不確定性來得出結(jié)論。
4.p值(p-value)
p 值是一個(gè)概率值,表示在原假設(shè)成立的條件下,觀察到樣本數(shù)據(jù)或更極端情況的概率。
如果p值小于顯著性水平,則拒絕原假設(shè)。
5.決策規(guī)則
如果檢驗(yàn)統(tǒng)計(jì)量的值落在顯著性水平下的臨界區(qū)間內(nèi)(或p值小于顯著性水平),則拒絕原假設(shè);否則,不能拒絕原假設(shè)。
統(tǒng)計(jì)檢驗(yàn)的流程
- 明確問題和設(shè)定假設(shè)
確定要驗(yàn)證的研究問題,提出原假設(shè)和備擇假設(shè)。 - 選擇統(tǒng)計(jì)檢驗(yàn)方法
根據(jù)數(shù)據(jù)的類型(如定量或定性)、分布特點(diǎn)和研究目的,選擇適當(dāng)?shù)臋z驗(yàn)方法。 - 計(jì)算檢驗(yàn)統(tǒng)計(jì)量
利用樣本數(shù)據(jù)計(jì)算對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。 - 計(jì)算p值或確定臨界值
根據(jù)顯著性水平計(jì)算p值,或使用統(tǒng)計(jì)分布確定臨界值。 - 做出統(tǒng)計(jì)決策
比較p值與顯著性水平或檢驗(yàn)統(tǒng)計(jì)量與臨界值,決定是否拒絕原假設(shè)。 - 解釋結(jié)果
根據(jù)檢驗(yàn)結(jié)果,結(jié)合實(shí)際問題給出明確的解釋。
常見統(tǒng)計(jì)檢驗(yàn)方法
統(tǒng)計(jì)檢驗(yàn)方法根據(jù)研究目標(biāo)、數(shù)據(jù)類型和分布假設(shè)的不同而有所差異。
以下是最常用的統(tǒng)計(jì)檢驗(yàn)方法及其適用場景的詳細(xì)介紹。
T 檢驗(yàn)
用于比較均值,適合樣本數(shù)據(jù)來自正態(tài)分布的總體,且樣本量不大(通常小于30)。
類型
- 單樣本 t 檢驗(yàn)
比較樣本均值與已知總體均值之間的差異。
例: 測試某城市居民的平均步數(shù)是否為10000步。 - 獨(dú)立樣本 t 檢驗(yàn)
比較兩個(gè)獨(dú)立樣本的均值是否顯著不同。
例: 比較男性和女性的平均身高。 - 配對樣本 t 檢驗(yàn)
比較兩個(gè)相關(guān)樣本(如同一組數(shù)據(jù)的前后測量)均值的差異。
例: 比較同一組學(xué)生考試前后成績。
假設(shè)
下面是一個(gè)單樣本 t 檢驗(yàn)的示例代碼,用于檢驗(yàn)樣本均值是否等于某個(gè)值。
from scipy.stats import ttest_1samp
import numpy as np
# 示例數(shù)據(jù)
data = np.array([99, 101, 100, 98, 102, 100, 101, 99, 98])
# 原假設(shè): 樣本均值為 100
t_stat, p_value = ttest_1samp(data, 100)
print("t-statistic:", t_stat)
print("p-value:", p_value)
if p_value < 0.05:
print("拒絕原假設(shè),樣本均值顯著不等于 100")
else:
print("不能拒絕原假設(shè),樣本均值不顯著不同于 100")
卡方檢驗(yàn)
用于分析分類數(shù)據(jù),檢驗(yàn)變量之間是否存在顯著關(guān)聯(lián)。
類型
- 獨(dú)立性檢驗(yàn)
測試兩個(gè)分類變量是否獨(dú)立。
例: 檢驗(yàn)性別與購車偏好是否相關(guān)。 - 擬合優(yōu)度檢驗(yàn)
測試樣本頻數(shù)分布是否與預(yù)期分布一致。
例: 檢驗(yàn)?zāi)称放剖袌龇蓊~是否符合預(yù)期比例。
假設(shè)
下面是一個(gè)用于檢驗(yàn)分類變量之間是否有顯著關(guān)聯(lián)的示例代碼。
from scipy.stats import chi2_contingency
import numpy as np
# 示例數(shù)據(jù)(列聯(lián)表)
# 行表示性別,列表示是否購買產(chǎn)品
data = np.array([[50, 30], [20, 40]])
# 卡方檢驗(yàn)
chi2, p_value, dof, expected = chi2_contingency(data)
print("Chi-squared:", chi2)
print("p-value:", p_value)
print("Degrees of freedom:", dof)
print("Expected frequencies:\n", expected)
if p_value < 0.05:
print("拒絕原假設(shè),性別與購買行為有顯著關(guān)聯(lián)")
else:
print("不能拒絕原假設(shè),性別與購買行為無顯著關(guān)聯(lián)")
方差分析
用于比較三個(gè)或更多樣本組的均值是否顯著不同。
類型
- 單因素方差分析
比較一個(gè)因子下多個(gè)組的均值差異。
例: 比較不同肥料對植物生長的影響。 - 雙因素方差分析
考慮兩個(gè)因子及其交互作用對結(jié)果的影響。
例: 比較肥料和水分對植物生長的聯(lián)合影響。
假設(shè)
下面是一個(gè)用于比較多個(gè)組的均值差異的示例代碼。
from scipy.stats import f_oneway
# 示例數(shù)據(jù)
group1 = [5.1, 5.2, 5.3, 5.0, 5.4]
group2 = [6.2, 6.3, 6.1, 6.4, 6.0]
group3 = [4.5, 4.4, 4.6, 4.5, 4.7]
# 單因素方差分析
f_stat, p_value = f_oneway(group1, group2, group3)
print("F-statistic:", f_stat)
print("p-value:", p_value)
if p_value < 0.05:
print("拒絕原假設(shè),至少兩組均值顯著不同")
else:
print("不能拒絕原假設(shè),各組均值沒有顯著差異")
z檢驗(yàn) (z-test)
用于均值或比例的檢驗(yàn),適合樣本量較大(通常n > 30),數(shù)據(jù)服從正態(tài)分布。
類型
- 單樣本z檢驗(yàn)
檢驗(yàn)樣本均值與總體均值是否有顯著差異。 - 兩樣本z檢驗(yàn)
檢驗(yàn)兩個(gè)獨(dú)立樣本均值或比例的差異。
假設(shè)
以下是單樣本 z 檢驗(yàn)的示例代碼,用于檢驗(yàn)樣本均值是否等于某已知總體均值。
from statsmodels.stats.weightstats import ztest
import numpy as np
# 示例數(shù)據(jù)
data = [102, 98, 100, 97, 103, 99, 101, 104, 98, 95]
# 原假設(shè): 樣本均值等于總體均值 100
z_stat, p_value = ztest(data, value=100)
print("z-statistic:", z_stat)
print("p-value:", p_value)
if p_value < 0.05:
print("拒絕原假設(shè),樣本均值顯著不同于總體均值")
else:
print("不能拒絕原假設(shè),樣本均值沒有顯著差異")