自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

談?wù)剺颖玖窟x擇背后的科學(xué)道理

大數(shù)據(jù)
樣本量選多少合適,對(duì)于調(diào)研本身而言或許不是個(gè)問題。但是當(dāng)我們想推動(dòng)調(diào)研結(jié)果的時(shí)候,樣本量卻很容易遭到對(duì)方質(zhì)疑。可能是幾百個(gè)人的答案看起來容易讓人覺得不靠譜,也可能因?yàn)闃颖玖渴亲钊菀踪|(zhì)疑的一個(gè)因素……

 

[[166116]]

總是說XX的樣本量就夠了,可是為什么呢?

如何決定樣本量,是一個(gè)老生常談的話題,也有很多相關(guān)文章。然而翻看相關(guān)文章,就會(huì)發(fā)現(xiàn)介紹選多少合適的比較多,而介紹為什么這么選就合適的卻比較少。

相信很多用研同學(xué)都聽過這句著名的話:

根據(jù)尼爾森關(guān)于可用性測(cè)試的經(jīng)典理論,6-8人便可以找到產(chǎn)品80%以上的可用性問題。

但是……為啥呢?當(dāng)有“無知的”地球人問:為什么6-8人就能發(fā)現(xiàn)80%以上的問題時(shí),難道我們要理直氣壯的說:因?yàn)槭悄釥柹f的么……

在樣本量選擇上似乎有一些“約定俗成”的規(guī)定。比如:可用性測(cè)試5-8人,問卷調(diào)研大約200-500份等等……但是,當(dāng)需要和地球人理論時(shí),單單的“約定俗成”卻沒有足夠的說服力。不如讓我們一起來看看這些“約定俗成”背后的科學(xué)道理,讓自己更有底氣。

1. 為什么說可用性測(cè)試5-8個(gè)人就夠?

俗話說“8個(gè)用戶可以發(fā)現(xiàn)80%的問題”。其實(shí)這句話并不完整,完整的說法應(yīng)該是:

8個(gè)人可以80%的概率發(fā)現(xiàn)發(fā)生可能性大于18%的問題。

這話太繞了,嘗試用人話解釋一下:如果某個(gè)APP中存在一個(gè)BUG,100個(gè)人用,50個(gè)人用都會(huì)遇到,那么我們至少有80%的可能性發(fā)現(xiàn)。只要可能遇到的人大于18個(gè)(發(fā)生可能性大于18%),我們都至少有80%的可能性發(fā)現(xiàn)。但如果這個(gè)BUG只有5個(gè)人可會(huì)遇到,那么能發(fā)現(xiàn)的概率就要低于80%了。

之所以這么說,背后的原理是這樣一個(gè)公式:

(P(X≥1)是在n次嘗試中事件至少發(fā)生1次的概率,p是某事件的概率)

前輩們根據(jù)這個(gè)公式總結(jié)出了下表:

資料來源:《用戶體驗(yàn)度量》Jeff Sauro,James R.Lewis著,機(jī)械工業(yè)出版社,P134-135

從表中可以看出,決定樣本量涉及到兩個(gè)因素:一個(gè)是確定程度,一個(gè)是問題發(fā)生的概率。

再來具體看一看我們常說的“8個(gè)人”。

當(dāng)選擇8個(gè)人進(jìn)行測(cè)試時(shí),可以100%發(fā)現(xiàn)發(fā)生概率大于50%的問題,90%的可能性發(fā)現(xiàn)發(fā)生概率大于25%的問題,73%的可能性發(fā)現(xiàn)發(fā)生概率大于15%的問題。

就好像天氣預(yù)報(bào)員說:100%的確定明天的降水概率大于50%,90%的確定明天的降水概率大于25%。

等等…這樣的話會(huì)不會(huì)被質(zhì)疑:8個(gè)人只能90%發(fā)現(xiàn)發(fā)生概率大于25%的問題,那發(fā)生概率低于25%的問題怎么辦?就不重要了么?

不如讓我們?cè)賮砜纯茨釥柹P(guān)于釣魚的比喻:

假設(shè)你有好多個(gè)池塘可以釣魚,一些魚比另一些魚更容易抓到。所以,如果你有10小時(shí),你會(huì)花10個(gè)小時(shí)都在一個(gè)池塘里釣魚,還是花5個(gè)小時(shí)在一個(gè)池塘上、花另外的5個(gè)小時(shí)在另一個(gè)池塘上呢? 為使抓到的魚數(shù)量***化,你應(yīng)該在兩個(gè)池塘上都花一些時(shí)間,以便從每個(gè)池塘里都釣到容易釣的魚。

一次何必找那么多用戶,少做幾個(gè)用戶先把發(fā)生率高的問題get了,版本更新以后再繼續(xù)找用戶去get發(fā)生率高的問題,省時(shí)省力效果佳。

這樣是不是就可以完整的證明我們可用性測(cè)試做5-8個(gè)人的觀點(diǎn)了呢。

2. 問卷調(diào)研,樣本量選多少?

在做問卷調(diào)研的時(shí)候,如何估計(jì)樣本量?眾所周知有一個(gè)公式:

但是這個(gè)公式存在一個(gè)問題:我要是連總體方差(CV2)都能知道,還做個(gè)毛線調(diào)研。

如果想估算總體方差,需要先選取一批人進(jìn)行測(cè)試,得到一個(gè)樣本方差,用樣本方差代替總體方差,這在現(xiàn)實(shí)工作中顯然難以實(shí)現(xiàn)。于是為了便于計(jì)算,偉大的前輩對(duì)公式進(jìn)行了轉(zhuǎn)換:

資料來源:《社會(huì)研究方法》仇立平著,重慶大學(xué)出版社,P137

作者說這一轉(zhuǎn)換是根據(jù)“推論總體比例或百分比的原理”進(jìn)行的。姑且不去管這個(gè)轉(zhuǎn)換原理是什么,這個(gè)公式我們可以這樣來理解:當(dāng)p=0.5的時(shí)候,總體的差異性***。因?yàn)閜=0.5表示兩種情況出現(xiàn)的概率是相等的。比如一個(gè)群體中男生和女生出現(xiàn)的概率都是0.5,說明男女人數(shù)相等。這種情況下,這個(gè)群體的性別差異是***的。

由于總體差異越大,需要的樣本量就越大。我們面對(duì)任何總體的時(shí)候,都可以假設(shè)“這是一個(gè)差異性***的總體”,來計(jì)算我們所需要的樣本量。因此,把p=0.5代入,就簡化出了一個(gè)可以供我們輕松計(jì)算樣本量的公式。

如果想看到總體不同差異所對(duì)應(yīng)的樣本量,前人還總結(jié)了這樣一個(gè)表:

資料來源:《社會(huì)研究方法》仇立平著,重慶大學(xué)出版社,P137

因此假設(shè)總體差異性***的情況下,在習(xí)慣使用的5%誤差檔,300多的樣本也就可以了。

當(dāng)然,在具體使用過程中,并不用查表那么麻煩。有一個(gè)著名的計(jì)算樣本量的網(wǎng)站,直接去算就OK了。

3.用戶量越大,需調(diào)研人數(shù)越多?

首先,總體規(guī)模會(huì)對(duì)樣本量有影響。當(dāng)總體規(guī)模比較小的時(shí)候,對(duì)樣本量影響較大。但是當(dāng)總體規(guī)模達(dá)到一定程度以后,對(duì)樣本量增加的需求是較小的。

我們往往調(diào)查所涉及到的總體不是***總體,產(chǎn)品的用戶人數(shù)都是一個(gè)有限的數(shù)量。因此在計(jì)算所需樣本量的時(shí)候,為了更精確可以加入變量“總體規(guī)模”,公式大概長成這個(gè)樣子:

然而這不是重點(diǎn),重點(diǎn)是通過這個(gè)公式可以計(jì)算出,不同總體規(guī)模所需要的樣本量大致如下:

由此可以看出,當(dāng)總體規(guī)模在1萬以下時(shí),隨著總體規(guī)模上升,所需樣本量增加比較大。但是當(dāng)總體規(guī)模在1萬以上時(shí),規(guī)模再變大,所需樣本人數(shù)的增長變得緩慢。

為了得到更準(zhǔn)確的答案,我們不妨用計(jì)算樣本量的網(wǎng)址自己來算一下。假設(shè)置信區(qū)間為±3個(gè)標(biāo)準(zhǔn)差。計(jì)算結(jié)果如下:

如果再有人說:我們是億級(jí)的產(chǎn)品,1000人怎么能代表我們的用戶?

就可以理直氣壯的告訴他:

總體規(guī)模10萬以上和10萬所需要的樣本量并沒有什么區(qū)別呢。

樣本量選多少合適,對(duì)于調(diào)研本身而言或許不是個(gè)問題。但是當(dāng)我們想推動(dòng)調(diào)研結(jié)果的時(shí)候,樣本量卻很容易遭到對(duì)方質(zhì)疑。可能是幾百個(gè)人的答案看起來容易讓人覺得不靠譜,也可能因?yàn)闃颖玖渴亲钊菀踪|(zhì)疑的一個(gè)因素……

無論如何,多了解一些背后的原因,讓自己更有底氣,或許才能更好地說服別人。

責(zé)任編輯:趙立京 來源: 199IT
相關(guān)推薦

2017-06-29 07:51:06

實(shí)習(xí)轉(zhuǎn)正公司

2012-08-20 10:48:09

2023-03-31 14:33:49

人工智能數(shù)據(jù)開發(fā)自然語言

2021-03-18 12:16:44

用戶分層業(yè)務(wù)

2021-07-06 10:39:52

AI 數(shù)據(jù)人工智能

2020-10-06 16:28:49

AI

2016-11-15 13:52:19

2012-08-20 09:35:37

DIP接口

2019-12-09 10:48:11

騰訊微信Exif信息

2010-12-21 11:09:12

百卓網(wǎng)絡(luò)上網(wǎng)行為管理Smart

2020-09-25 11:50:12

前后端分離架構(gòu)Web

2023-12-29 10:06:00

AI3D

2018-04-26 14:08:27

2023-02-20 16:29:45

開發(fā)AI

2021-07-15 10:11:56

IT流程設(shè)計(jì)流程流程文化

2012-05-17 09:43:53

實(shí)力

2013-09-27 09:51:03

Android安卓激活量碎片化

2009-05-26 15:15:17

ITSM運(yùn)維管理摩卡

2022-04-01 10:36:23

IT領(lǐng)導(dǎo)IT變革IT
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)