自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

隨機(jī)世界與大數(shù)法則中滲透出的概率的意義

大數(shù)據(jù)
在最終的分析中,所有知識皆為歷史;在抽象的意義下,所有科學(xué)皆為數(shù)學(xué);在理性的世界里,所有判斷皆為統(tǒng)計(jì)。

1987年,是印度傳奇數(shù)學(xué)家拉曼努揚(yáng)(SrinivasaRamanujan,1887-1920)的百年誕辰。為了紀(jì)念他,有一系列的活動(dòng)。當(dāng)代著名統(tǒng)計(jì)學(xué)者, 出生于印度的勞氏(C. Radhakrishna Rao,1920),也應(yīng)邀做了三場演講。之后,印度統(tǒng)計(jì)學(xué)研究所(IndianStatistical Institute)基于勞氏的演講稿,于1989年,為他出版了統(tǒng)計(jì)與真理一書。此書于1997年發(fā)行第二版。

概率的意義:隨機(jī)世界與大數(shù)法則

在第一版的序文中,勞氏提到:

學(xué)生時(shí)代,我主修數(shù)學(xué)一種從給定前提下演繹結(jié)果的邏輯。后來我念統(tǒng)計(jì)學(xué)一種從經(jīng)驗(yàn)中學(xué)習(xí)的理性方法,及從給定的結(jié)果驗(yàn)證前提的邏輯。我已認(rèn)識到數(shù)學(xué)及統(tǒng)計(jì),在人類為提昇自然知識,及有效管理日常事務(wù)所做的一切努力中,占有重要性。

我相信:

在最終的分析中,所有知識皆為歷史。

在抽象的意義下,所有科學(xué)皆為數(shù)學(xué)。

在理性的世界里,所有判斷皆為統(tǒng)計(jì)。

這一段話,大致說明數(shù)學(xué)及統(tǒng)計(jì)的重要性,及其各自的內(nèi)涵。

翻開統(tǒng)計(jì)史,信賴區(qū)間,是另一著名統(tǒng)計(jì)學(xué)者,出生于波蘭,1938年才移民至美國的奈曼(JerzyNeyman,1894-1981),于1934年演講中首度提出。他的演講結(jié)束后,大會主席包雷(Arthur Lyon Bowley, 1869-1957)于致詞中提到,“我不很確定此信心不是一信心戲法”。要知奈曼信賴區(qū)間的概念剛提出時(shí),大部分的統(tǒng)計(jì)學(xué)者,包括被視為是現(xiàn)代統(tǒng)計(jì)學(xué)之創(chuàng)始者,英國的費(fèi)雪(Sir Ronald Aylmer Fisher, 1890-1962,常以R.A.Fisher稱之)均難以接受。在所謂95%信賴區(qū)間中,那95%究竟是指什么?是概率嗎?如果是,那又是什么的概率?雖奈曼取巧地以信賴區(qū)間,來稱呼此一他創(chuàng)造出來的東西,而避用概率一詞。但包雷及其同行,當(dāng)然一眼便看穿這個(gè)手法。這段過程,可參考Salsburg(2001)Chapter12(但該書中的A.L.Bowley應(yīng)該是G.M.Bowley),及Sawilowsky(2003)一文。

歲月匆匆,七十多年過去了,今日統(tǒng)計(jì)學(xué)家,當(dāng)然已完全弄懂信賴區(qū)問的意義。對不同的參數(shù),不同的分布,可有不同的信賴區(qū)間;即使同一參數(shù)且同一分布,也可以不同的方法,得到不同的信賴區(qū)間。有時(shí)因條件不足,或計(jì)算復(fù)雜等原因,只好退而求其次,得到近似的信賴區(qū)間。當(dāng)然這時(shí)需要一些條件,及利用一些定理。信賴區(qū)間亦可比較優(yōu)劣。要知統(tǒng)計(jì)里有各種推論方法,但因處理的是隨機(jī)現(xiàn)象,少有“倚天既出,誰與爭鋒”的方法。而評比時(shí),也要訂出評比準(zhǔn)則。否則就像有個(gè)停止不動(dòng)的鐘,及一每日慢1分鐘的鐘,如何判定何者較準(zhǔn)?前者可是每日皆有完全準(zhǔn)確的時(shí)刻,后者卻是每1440天(一天有1440分),才有一完全準(zhǔn)確的時(shí)刻。不講清楚如何評比,將會各說各話。

追根究底,還是不少學(xué)習(xí)者,未能正確了解概率的涵意。

概率的意義

一骰子有6個(gè)面,一擲之下,會得到偶數(shù)之概率為何?骰子看起來沒有異樣,就假設(shè)每個(gè)面出現(xiàn)的概率皆相同,即均為1/6。而偶數(shù)面有2,4,及6等3個(gè)。因此所求之概率為3/6。這就是所謂古典的概率,基本假設(shè)是“相同的可能性”。先求出觀測的現(xiàn)象共有幾種可能,再求出其中有幾件是我們有興趣的。將后者除以前者,即為所要的概率。雖說是“古典”,這種概率的意義,至今仍處處可見。採用的范圍包含諸如抽簽、玩撲克牌,及玩樂透彩等。又如某項(xiàng)工作徵才,報(bào)名的有82人,錄取5人。若沒有什么特別的資訊,便只能假設(shè)每人被錄取的概率皆相同,即皆為5/82。

2009年7月底8月初,世界高爾夫球王老虎伍茲(TigerWoods),參加在美國密西根州舉行的別克公開賽(Buick Open)。第1輪打完,落后領(lǐng)先者多達(dá)8桿,排名并列95。引發(fā)他可能難逃職業(yè)生涯,首次連續(xù)2場比賽(前一場是英國公開賽(The Open Championship,在英國之外常稱為BritishOpen)),提前被淘汰的話題。不過老虎畢竟不能小覷,打完前3輪后,伍茲躍居首位。

這時(shí)大家看法丕變,一致認(rèn)為這座冠軍盃,幾乎可說是他的囊中物了。因過去的紀(jì)錄顯示,伍茲如能帶著54洞領(lǐng)先進(jìn)入決賽圈,戰(zhàn)績是35勝1敗。你要不要猜后來他贏了沒有?運(yùn)動(dòng)比賽,往往有過去資料可參考,此時(shí)相同的可能性便不宜用了。36次中成功35次,“相對頻率”為35/36(約0.972)。這種以相對頻率來解釋概率,是常有的作法。適用能重復(fù)觀測的現(xiàn)象。會不會有爆出冷門的時(shí)候?當(dāng)然有。只是對一特定事件,用過去多次同樣情況下,該事件發(fā)生的相對頻率,來估計(jì)下一次事件發(fā)生的概率,乃是在沒有更多資訊下,常被認(rèn)為一屬于客觀的辦法。

某君看上一女孩,驚為天人,覺得這是他今生的新娘。評估后信心滿滿,自認(rèn)追上的機(jī)會有8成。旁人卻都不看好,問他8成這一數(shù)字,是如何冒出來的?該君舉證歷歷,一個(gè)又一個(gè)的跡象,顯示那女孩對他很有好感。這個(gè)0.8的概率,就是所謂主觀概率。主觀概率當(dāng)然也可基于過認(rèn)識概率35去一些客觀的事實(shí)。只是即使面對同樣的資料,不同的人,可能有不同的判定,因而給出不同的主觀概率(看過他其實(shí)沒那么喜歡你(He’s Just Not That Into You)嗎?片中那個(gè)叫Gigi的女孩,便常誤解男生所透露的訊息)。有些現(xiàn)象就是不能重復(fù)觀測。如核能電廠的意外,及彗星撞地球等。以追女孩為例,大約少有女孩,會讓你做實(shí)驗(yàn),反覆地追,然后數(shù)一數(shù)其中成功幾次,來定下她會被你追上的概率。對這類無法重復(fù)觀測的現(xiàn)象,在談概率時(shí),主觀概率就常派上用場。每天早上出門,我們不是慣于抬頭看天,判斷一下今天下雨的概率有幾成?只是往往父母認(rèn)為的概率會大些,該帶傘,而小孩所認(rèn)為的下雨概率會小些。

雖說“主觀”,但仍要合理。例如,考試有及格與不及格。若認(rèn)為會及格的概率為0.9,這沒問題,人總要有點(diǎn)自信,但若又同時(shí)擔(dān)心有0.8的概率會不及格,那就不行了。各種可能性發(fā)生概率相加要為1。即使是主觀,可以獨(dú)排眾議,仍須自圓其說。不能說,既然是主觀,便可以任意自定各事件之概率。因此不論是那一種對概率的解釋,都自然地,或說必須要滿足一些共同的規(guī)則。這點(diǎn)大家應(yīng)能理解。

上述三種是常見對概率的解釋,大抵也就是人們評估事件發(fā)生可能性之大小的幾種思維。雖是針對不同的情況,但常能交互著運(yùn)用。大家都聽過曾參殺人的典故吧!有個(gè)與曾子同名的人殺人,好心者告訴曾母“曾參殺人”。曾母說“吾子不殺人”,繼續(xù)織布。過一會兒,又有人來說“曾參殺人”。曾母仍繼續(xù)織她的布,這么好的兒子怎可能殺人?但當(dāng)?shù)谌伺軄碚f“曾參殺人”,曾母就害怕了,丟掉織布器具翻墻而逃。所謂“其母懼,投杼踰墻而走”。這故事出自戰(zhàn)國策秦策二。因此當(dāng)拿到一銅板,可主觀地認(rèn)為,政府發(fā)行不該會有偏差,兩面出現(xiàn)的概率,應(yīng)皆為1/2(這也可以是基于相同可能性之想法)。若投擲10次,正面出現(xiàn)8次,可能覺得有些奇怪。若繼續(xù)投擲,結(jié)果100次中,出現(xiàn)80個(gè)正面,這時(shí)相對頻率的觀點(diǎn),很可能便將顯現(xiàn)。類如曾母,調(diào)整看法,不再認(rèn)為此銅板公正。

當(dāng)然,你可以不信邪,不論投擲的結(jié)果如何,皆認(rèn)為那只是短暫的情況,意志堅(jiān)定地認(rèn)為這是一公正的銅板。這并沒有不行,就像會有母親,即使再多的人證,只要她沒親眼看到,她就不信兒子會殺人。要知隨機(jī)現(xiàn)象,事件只要概率為正,不論概率值多小,便皆可能發(fā)生。畢竟銅板正面出現(xiàn)的概率為何,只有天曉得。但引進(jìn)概率與統(tǒng)計(jì),乃為了協(xié)助我們做決策可以更精準(zhǔn)。而決策可以與時(shí)推移,并非不能更改。有如氣象局對颱風(fēng)會帶來多少雨量,須密切掌握新的動(dòng)向,而隨時(shí)修正。要有隨機(jī)的思維,如前言中勞氏所說的,從給定的結(jié)果,驗(yàn)證前提。因此針對100次投擲,出現(xiàn)80個(gè)正面,多數(shù)人面對此結(jié)果,還是會認(rèn)為0.8的正面出現(xiàn)概率,較0.5的概率可信。稍后我們會再來看,10次中的8次,與100次中的80次,相對頻率同為0.8,但提供的資訊,是否有異?

雖然已有上述三種對概率的解釋,也涵蓋了不少實(shí)際生活中所遇到的情況,數(shù)學(xué)家當(dāng)然不會在此止步。他們喜歡抽象化,及一般化。像解方程式,會尋求公式,以表示出某類方程式的解,而非只滿足于求出一個(gè)個(gè)的特例之解。又如當(dāng)完全了解實(shí)數(shù)系統(tǒng)后,便會以公理化的方式,定義實(shí)數(shù)系統(tǒng)。即給一集合,沒說是數(shù)字的集合,對其中的元素定義二運(yùn)算,并給出10條遵循的公理(axiom,規(guī)則)。你好奇該二運(yùn)算是否一為加法,一為乘法?而怎么沒有減法與除法?名可名,非常名,數(shù)學(xué)家不認(rèn)為你提出的是重要的問題。但用心體會后,你終于發(fā)現(xiàn)原來二運(yùn)算,其一等同于加法,其二等同于乘法。也看出此集合中,有一元素根本就是0,而有一元素根本就是1。數(shù)學(xué)家對你的洞察力,仍不以為意,但同意你可以這樣想。

什么叫以公理化的方式,來引進(jìn)概率?先要有一個(gè)集合,稱做樣本空間,當(dāng)做某一觀測之所有可能結(jié)果的集合??梢哉娴挠羞@一觀測,或只是虛擬的。樣本空間的某些子集合,是我們有興趣的,這些就是一個(gè)個(gè)的事件。所有事件也構(gòu)成一集合。最后定出一概率函數(shù),即對每一事件,給一介于0,1間的值,為該事件之概率。樣本空間、事件的集合,及概率函數(shù),三者便構(gòu)成概率空間(probability space)。這其中對樣本空間沒有太大要求,但不可以是空集合。而事件的集合,要滿足若干條件。簡單講,就是你有興趣的事件不能太少。譬如說,不能只對某事件A發(fā)生有興趣,卻對A不發(fā)生沒興趣。因此事件的集合要夠大,至少該有的都得納入。這有點(diǎn)像婚宴前擬賓客名單??梢哉埡苌偃?,如只有雙方家長。而一旦多列了某人,與他同樣親近的人便也要一併請。所以每多列1人,將不只是增加1人而已,而會隨之增加幾位。又概率函數(shù),既然以概率之名,當(dāng)然要符合過去大家對概率的認(rèn)知,滿足一些基本的條件。

在概率空間的架構(gòu)下,不論采用何種方式解釋概率的人,都可各自表述,找到他所以為的概率意義。但因抽象化后,不再局限于銅板、骰子,及撲克牌等,便能討論較一般的問題,有夠多的理論可挖掘。

與數(shù)學(xué)的其他領(lǐng)域相比,概率論的發(fā)展是較晚的。但公理化后,概率論便快速地有了深而遠(yuǎn)的發(fā)展,并成為數(shù)學(xué)中一重要的領(lǐng)域。這都要?dú)w功于二十世紀(jì)那位重要的概率學(xué)家,俄國的科莫果洛夫(Andrey Nikolaevich Kolmogorov,1903-1987),于他1933年出版,那本不到100頁的小書概率論的基礎(chǔ)(Foundationsof the Theory of Probability)中所奠定。在此書中,他說:

概率論作為數(shù)學(xué)學(xué)科,可以而且應(yīng)該從公理開始發(fā)展,就如同幾何、代數(shù)一樣(Thetheory of probability as mathematical discipline can and shouldbe developed from axioms in exactly the same way as Geometry and Algebra)。

何處是概率天地

有法國牛頓之稱的拉普拉斯(Pierre-Simon,Marquis de Laplace, 1749-1827)曾說:

這門源自考慮賭博中的機(jī)運(yùn)之科學(xué),必將成為人類知識中最重要的一部分,生活中最重要的問題中的大部分,都將只是概率的問題(This science, which originated in the consideration of games ofchance, should have become the most important object of human knowledge. Themost important questions of life are, for the most part, really only problemsof probability)。

概率是針對隨機(jī)現(xiàn)象。但世上并非每件事都是隨機(jī)的,我們說過還有必然性。假設(shè)投擲一兩面皆是人頭的銅板,并觀察會得到那一面。你曉得這是一必然現(xiàn)象,但仍可說會出現(xiàn)人頭的概率為1,而其他情況出現(xiàn)的概率為0。也就是視此為一“退化的”隨機(jī)現(xiàn)象。

某些物理學(xué)家,說不定認(rèn)為對投擲銅板,由給定投擲的速度、角度、地面的彈性、銅板的形狀及重量等條件,可算出銅板落地后,會那一面朝上,因此這不是隨機(jī)。至于樂透彩的開獎(jiǎng),只要起始條件都能測出,則會開出那一號球,也能算出,因此這也不是隨機(jī)。但你大約也知道所謂蝴蝶效應(yīng)(butterfly effect)。量測極可能有誤差,而有時(shí)一些微小的改變,影響卻可能很大。因此我們寧可相信這些都是隨機(jī)現(xiàn)象。

某些神學(xué)家,可能認(rèn)為一切其實(shí)都是按照神的旨意在進(jìn)行,只是我們不知而已。說不定真是如此。你看過杰遜王子戰(zhàn)群妖(Jason and the Argonauts)嗎?這是一部基于希臘神話的電影,內(nèi)容與十二星座中的牡羊座有關(guān),1963出品。我雖是幼時(shí)看的,至今仍印象深刻。片中杰遜王子遭遇的各種突如其來的災(zāi)難,以及一次又一次英勇的逢兇化吉,不過是天后赫拉(Hera),與天神宙斯(Zeus)在較勁,分別作梗及協(xié)助。但若無從了解神的旨意,對于未來,也只好視為隨機(jī)。

隨著科技進(jìn)步,人們逐漸弄明白很多現(xiàn)象的來龍去脈。例如,我們知道女性一旦懷孕,嬰兒性別便已確定。但對一大腹便便的婦女,好事者由于不知,仍可猜測其生男生女之概率??荚嚽跋Γ瑢W(xué)生們雖認(rèn)真準(zhǔn)備,但還是絞盡腦汁猜題,各有其認(rèn)為考出概率很大的題目。老師獲知后,覺得好笑。課堂中已一再暗示明示,那些題會考,幾乎都該能確定了,何需再猜?實(shí)則試題早已印妥,而學(xué)生不知考題,且未體會老師的暗示及明示,所以仍可以大猜一通。另外,諸如門外有人敲門,你好奇是男是女?老師要你猜拿在背后的水果,是橘子或蘋果?同學(xué)蓋住落地的銅板,要你猜正面或反面朝上?這類明明已確定的事,本身其實(shí)并不隨機(jī),只是對你而言,卻有如惠子在秋水篇所說的“子非魚”,當(dāng)然可猜魚快樂的概率。

但對已命好題目的老師,去判斷那一題會考出的概率,就沒什么意義了。因?qū)λ?,每一題會考出的概率,只有1或0,不會是其他值。同樣地,對看到背后水果的人,水果會是橘子或蘋果的概率,將只能說1或0。隨機(jī)與隨意不同。我們說過了,概率中那套邏輯,是有夠大的彈性,讓人能揮灑,只是仍要合理,否則就是抬槓了。若你明明知道那是蘋果,硬要說它是橘子的概率為0.5;或明明已從醫(yī)生處掌握一切訊息的待產(chǎn)媽媽,還說生下來,是男是女的概率皆為0.5,那就不是在談概率了。

解釋概率

在第2節(jié)我們以概率空間的方式引進(jìn)概率。由于樣本空間可以是虛擬的,此時(shí)事件也就是虛擬的。但假設(shè)真的有一項(xiàng)觀測,如投擲一個(gè)4面體,4面分別標(biāo)示點(diǎn)數(shù)1,2,3,4,并觀測所得點(diǎn)數(shù)。則樣本空間為1,2,3,4之集合。事件的集合可以取那一個(gè)最大的,也就是包含樣本空間之所有子集所構(gòu)成的集合。你如果學(xué)過排列組合,便知此最大的事件集合中,共有16(2的4次方)個(gè)元素。至于概率函數(shù),假設(shè)點(diǎn)數(shù)1,2,3,4出現(xiàn)的概率,分別為0.1、0.2、0.3,及0.4,相加為1。至于任一事件的概率,就看該事件包含1,2,3,4中那幾個(gè)數(shù),再把對應(yīng)的概率相加便是。如一事件中恰包含2,4,則該事件的概率為0.2+0.4=0.6。馀此類推。這就建立了一概率空間。對同一樣本空間,可定義出很多不同的概率空間。

就算你已接受了概率空間的概念,反正數(shù)學(xué)家就是常給一些自得其樂的定義,仍可能會好奇,所謂點(diǎn)數(shù)1出現(xiàn)的概率0.1,究竟是什么意思?是每投10次,點(diǎn)數(shù)1恰出現(xiàn)1次嗎?非也!

有個(gè)修過概率論的數(shù)學(xué)系畢業(yè)生,好心地對你解釋如下:

假設(shè)投擲n次,點(diǎn)數(shù)1出現(xiàn)a次,則相對頻率a/n與0.1之差的絕對值,會大于一給定的正數(shù)(不管它多小)之概率,將隨著n的趨近至無限大,而趨近至0。

務(wù)實(shí)的你,很可能不覺得這樣的解釋很實(shí)際。先提出疑問“什么是趨近至無限大?”就是一直投擲,不可停止,日出日落,春去秋來,繼續(xù)投擲,即使夸父追日成功了,無限大也仍未達(dá)到,還得投擲。那位數(shù)學(xué)系畢業(yè)生,一聽到你問起無限大,如魚得水,這是他在數(shù)學(xué)系四年寒窗,學(xué)到的幾招獨(dú)門絕活之一。你不得不停止無限大這個(gè)話題,因連夸父追日,你也覺得豈有成功時(shí)?如何能接受解釋概率,還得涉及無限大?但還一點(diǎn)你不吐不快的是“我就是不了解概率值的意義,怎么卻用概率的概念來解釋給我聽?”

想解釋概率值的意義,將會在概率及無限大,一層又一層的打轉(zhuǎn)。這有如想去定義什么叫做點(diǎn),結(jié)果將如同陷在線團(tuán)中,學(xué)步維艱。最后只好說,點(diǎn)是無定義名詞。但無論如何,你應(yīng)可理解,對前述4面體,僅投擲1次,是無法顯示點(diǎn)數(shù)1出現(xiàn)概率0.1,那個(gè)0.1的意思。概率并非只看“少數(shù)幾次”的結(jié)果。概率是在大樣本(n很大)下,威力才顯現(xiàn)。概率值的意義,既然不能以一套可接受的邏輯來說明。那么退而求其次,可否讓人略微了解概率值的意思?或者說(除非是虛擬,只是在求一些概率值),你拿一4面體,且宣稱點(diǎn)數(shù)1出現(xiàn)的概率為0.1,怎么樣才知道你講的是真的,而非信口開河,或者說記錯(cuò)。

之前那位數(shù)學(xué)系畢業(yè)生的解釋,這時(shí)便能派上用場。此即大數(shù)法則(law of large numbers)之一簡單的版本。數(shù)學(xué)上的意思為,事件出現(xiàn)的相對頻率,會“概率收斂”至事件發(fā)生的概率。要知隨機(jī)世界中,仍有些法則要遵循,大數(shù)法則是其中很重要的一個(gè)。當(dāng)然我們已指出了,實(shí)際上并無法觀測事件無限多次。那是否可說,事件出現(xiàn)的相對頻率,當(dāng)觀測數(shù)夠大,須接近事件發(fā)生的概率?也非如此。事件只要概率為正,便都可能發(fā)生。所以,不論觀測數(shù)再大,都不能排除很偏頗(如觀測1,000,000次,點(diǎn)數(shù)1出現(xiàn)的次數(shù)為0,或1,000,000次)的事件發(fā)生。但是,這時(shí)統(tǒng)計(jì)學(xué)家跳出來了,可以做一檢定,檢定點(diǎn)數(shù)1出現(xiàn)的概率是否真為0.1,這是屬于統(tǒng)計(jì)學(xué)里假設(shè)檢定(testing hypothesis)的范疇。簡單講,是以在某一假設(shè)下,會觀測到這樣的結(jié)果,是否算不尋常?所謂不尋常,是指發(fā)生的概率很小,小于某一預(yù)設(shè)的值。若屬于不尋常,則當(dāng)初的假設(shè)就不宜接受。附帶一提,當(dāng)假設(shè)一銅板為公正,則投擲100次,出現(xiàn)至少80次正面,較投擲10次,出現(xiàn)至少8次正面,前者是更不尋常的,因它發(fā)生的概率,遠(yuǎn)比后者小。所以,在同樣獲得八成以上的正面數(shù)下,投擲數(shù)愈大,將會使我們更相信此銅板非公正,而接受它出現(xiàn)正面的概率,至少是0.8。這說明:

在統(tǒng)計(jì)里,樣本數(shù)愈大,將使我們的推論愈精準(zhǔn)。

在隨機(jī)世界,究竟何者為真,常屬未知。我們往往無法“證明”那件事是真實(shí)的。不過是一個(gè)個(gè)的假設(shè),端看你接受那一假設(shè)。四面體點(diǎn)數(shù)1出現(xiàn)的概率,是否真為0.1,即使投擲再多次,都無法證明其真?zhèn)?。只能說數(shù)據(jù)顯示“可以接受”,或“無法接受”概率為0.1。這里面有一套機(jī)制,以決定接受或不接受。

另外,對一四面體,也可估計(jì)點(diǎn)數(shù)1出現(xiàn)的概率,有一些不同的估計(jì)法,可以得到不同的估計(jì)量。在數(shù)學(xué)中,使用不同的方法,須導(dǎo)致相同的結(jié)果。所謂殊途同歸。但統(tǒng)計(jì)里,除非做些限制,否則常無定于一尊的方法。對不可測的未來,我們常要做估計(jì),統(tǒng)計(jì)在這方面,能扮演很好的角色。諸如銅板出現(xiàn)正面的概率,及病人的存活率等,皆能估計(jì)。但有時(shí)覺得以一個(gè)值估計(jì),雖然明確,但估計(jì)值很難恰好等于真實(shí)值,一翻兩瞪眼,常估計(jì)不準(zhǔn)。信賴區(qū)間的概念,因而產(chǎn)生。

信賴區(qū)間

我們常對某一未知的量做估計(jì)。未知的量可以是某事件發(fā)生的概率,某分布的參數(shù)(如期望值及變異數(shù)等),或某物件之壽命等。這些未知的量,可通稱為參數(shù)。有時(shí)會以一區(qū)間來估計(jì)參數(shù),并給出此區(qū)間會涵蓋該參數(shù)之概率。這就是所謂區(qū)間估計(jì),所得的區(qū)間,稱為信賴區(qū)間。而區(qū)間涵蓋參數(shù)之概率,則稱為此區(qū)間之信心水準(zhǔn)(confidence level)。與概率一樣,信心水準(zhǔn)是一介于0,1間的值,常事先給定,且以百分比表示。90%、95%、99%等,都是常取的值。

數(shù)據(jù)(data)是統(tǒng)計(jì)學(xué)家做決策之主要依據(jù)。若缺乏數(shù)據(jù),他們往往將一籌莫展。來看一簡單且常見的情況。假設(shè)欲估計(jì)一銅板出現(xiàn)正面之概率p。很自然地,便投擲若干次,譬如說n次,并觀測n次的結(jié)果。這個(gè)過程便稱為取樣。在本情況中,各次投擲的結(jié)果并不重要。總共得的正面數(shù),以a表之。知道a,就已掌握全部資訊[a稱為充分統(tǒng)計(jì)量(sufficient statistic)]。給定信心水準(zhǔn),并利用n及a,可得一信賴區(qū)間,但作法并不唯一。亦即對于p,有不同的信賴區(qū)間公式。但課綱的寫法,好像信賴區(qū)間的公式唯一。此處由于其中涉及二項(xiàng)分布,計(jì)算復(fù)雜些,如果n夠大(n太小則不行),我們常可藉助常態(tài)分布來近似。這要用到概率論里另一重要的法則—中央極限定理(Central limit theorem)。必須一提,只有以常態(tài)分布來近似時(shí),才需用到中央極限定理,并非求信賴區(qū)間皆要用到此定理。

對估計(jì)銅板出現(xiàn)正面之概率p,取樣前,信賴區(qū)間為一隨機(jī)區(qū)間,若信心水準(zhǔn)設(shè)定為95%,則有(或精準(zhǔn)地說“約有”,如果該信賴區(qū)間只是近似的)0.95的概率,信賴區(qū)間會包含p。取樣后,得到一固定區(qū)間。則p會屬于該區(qū)間的概率,將不是1便是0,而不再是p了。為何如此?很多人對此常感困惑。

我們先以下例來說明。假設(shè)某百貨公司周年慶,顧客購物達(dá)一定金額,便能自1至10號中抽1彩球。若抽中5號,今天在該公司的花費(fèi),可獲30%抵用券。在抽球之前,你知道有0.1的概率能獲抵用券,機(jī)會不算小。一旦抽出,一看是3號,獲抵用券的概率當(dāng)然便是0了。

這類例子很多。打擊手揮棒前,可以說打出安打之概率為0.341,打完不是安打就非安打,0.341已派不上用場了。再給一例。假設(shè)某銀行發(fā)行的樂透彩,每期自1至42號中,開出6碼為頭獎(jiǎng)號碼。你簽了一注6碼,開獎(jiǎng)前,你知道很容易“至少中1碼”,因概率約為0.629(見附注1)。等開獎(jiǎng)后,你的彩券會至少中1碼之概率,將是1(若至少中1碼),或是0(若1碼皆未中)。

責(zé)任編輯:Ophira 來源: 大數(shù)據(jù)文摘
相關(guān)推薦

2015-04-14 11:01:08

大數(shù)據(jù)速度與激情用車法則

2013-12-18 16:18:08

多核線程

2022-11-21 14:33:53

大數(shù)據(jù)數(shù)據(jù)存儲機(jī)器學(xué)習(xí)

2018-09-06 18:29:39

2023-12-13 10:46:27

2024-01-17 23:03:04

2016-03-24 13:57:59

JavaHttpURLConn

2014-05-30 09:41:16

2022-04-13 11:18:48

滲透測試Mock

2023-12-20 07:30:54

Goselect編程

2021-02-02 09:57:13

云安全物聯(lián)網(wǎng)IOT

2013-04-26 09:41:59

大數(shù)據(jù)全球技術(shù)峰會

2017-12-11 11:38:58

2010-09-17 16:25:58

2014-06-05 15:18:53

大數(shù)據(jù)

2015-03-31 14:39:38

2021-07-09 09:48:53

加密貨幣黑客預(yù)防數(shù)字貨幣

2017-02-09 09:25:43

2021-02-05 14:13:34

大數(shù)據(jù)數(shù)據(jù)中心技術(shù)

2020-10-13 14:38:50

機(jī)器學(xué)習(xí)數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號