資料來源:國資電子報第33期,http://www.lis.ntu.edu.tw/~pnhsieh/epapers/no33.htm

決定樣本大小要考慮兩個因素:信心水準和抽樣誤差。

信心水準(confidence level):信心水準是以百分比來表示,意思是有多大的信心可以樣本來推論母群。通常是設定在95%或99%,換包話說,通常是在95%的信心水準或是99%的信心水準下,由樣本推論到母群;而大部分的研究人員都選用95%的信心水準。

抽樣誤差(confidence interval):或稱為誤差容忍度,一般在媒體或是學術論文中都是以正負數值來表示,如:抽樣誤差在正負3個百分點以內。因為是由樣本推論到母群,勢必有誤差,研究者可以容忍多大的誤差,就是所謂的confidence interval。為脫離台灣的政治風暴,就犧牲布希總統吧!

「最新民意調查顯示,美國總統布希在紐約州的聲望,從先前的百分之三十三跌到最低點的百分之二十二。這項調查是以電話訪問一千一百五十四位合格選民,誤差率是正負百分之三。」這個意思是:抽樣1,154位合格選民的結果,布希的聲望是22%;要由這1,154位合格選民推論到全紐約州合格選民的話,布希的聲望會是19%到25%之間,因為抽樣誤差是3%,那麼推論到母群的話就要往上往下調整3%,即19%(22-3)和25%(22+3)。

決定好信心水準和抽樣誤差,接下來就要計算樣本數了。這件事就交給網路吧!

Sample Size Calculator是Creative Research Systems在網路上提供的服務,只要點選信心水準(95%或是99%),輸入抽樣誤差和母群人數,就可以算出樣本大小。

舉個例子來說明,如果想要調查台大學生的金錢觀,根據台灣大學2003統計年報台大共有29,830位學生,如果要針對台大學生進行抽樣,在95%信心水準和抽樣誤差在正負3個百分點以內時,必須抽取1,030位學生為樣本。

如果放寬抽樣誤差為5個百分點的話,只要抽取379位學生即可。如果提高信心水準為99%,抽樣誤差一樣是5個百分點的話,必須抽取651位學生;如果信心水準是99%,而抽樣誤差提高到3個百分點以內的話,則必須抽取1,741位學生為樣本。

當母群未知或母群很大時,Population一欄可以直接空白。
如果我想擴大範圍調查全台灣大學生的金錢觀,那我該抽取多少樣本呢?根據教育部網站94學年度大學本科生人數為938,648,在95%信心水準和抽樣誤差在正負3個百分點以內時,必須抽取1,066位學生為樣本;如果我把Population一欄空白,計算得到的樣本數是1,067。

在進行問卷調查時,別忘了還要考慮樣本回收率,再決定該寄發多少份問卷,不然回收率太低的話,還是沒有辦法滿足樣本規模的要求。

天下不如意事常十之十一、十二。所以呢,就算計算好樣本數再進行抽樣,可是回收率和訪問結果還是可能不能盡如人意,這時通常會根據實際回收結果重新計算抽樣誤差。

接續上面的例子,在95%信心水準和抽樣誤差在正負3個百分點以內時,必須抽取1,030位學生為樣本。如果實際回收的有效問卷是666份,很顯然的抽樣誤差就不可能維持在正負3%以內,所以必須重新計算抽樣誤差。

Sample Size Calculator的第二部分就是計算抽樣誤差,只要選取信心水準,再輸入樣本數和母群大小,就可以計算出新的抽樣誤差為3.75。其中Percentage一項的預設值是50,是要反映樣本的差異或離散情形;舉例來說,如果有99%的學生都回答「是」,只有1%回答「否」,表示樣本的一致性相當高,那麼與樣本大小就沒什麼關係;如果有52%的學生說「是」,而有48%的學生說「否」,那麼誤差的機會就大多了;所以Sample Size Calculator做最悲觀的假設,將Percentage預設為50。

這也就是為什麼我們經常看到媒體或學術論文所交代的抽樣誤差經常是「百分之三點四」或「百分之三點四五」,而不是整數的原因。

Posted by hueijen at 痞客邦 PIXNET 留言(0) 引用(0) 人氣()