樣本容量的確定
樣本容量的確定 分類:Statistics
在參數(shù)區(qū)間估計(jì)的討論中,估計(jì)值和總體的參數(shù)之間存在著一定的差異,這種差異是由樣本的隨機(jī)性產(chǎn)生的。在樣本容量不變的情況下,若要增加估計(jì)的可靠度,置信區(qū)間就會(huì)擴(kuò)大,估計(jì)的精度就降低了。若要在不降低可靠性的前提下,增加估計(jì)的精確度,就只有擴(kuò)大樣本容量。當(dāng)然,增大樣本容量要受到人力、物力和時(shí)間等條件的限制,所以需要在滿足一定精確度的條件下,盡可能恰當(dāng)?shù)卮_定樣本容量。 一、影響樣本容量的因素
(一)總體的變異程度(總體方差)
在其它條件相同的情況下,有較大方差的總體,樣本的容量應(yīng)該大一些,反之則應(yīng)該小一些。例如:在正態(tài)總體均值的估計(jì)中,抽樣平均誤差為它反映了樣本均值相對(duì)于總體均值的離散程度。所以,當(dāng)總體方差較大時(shí),樣本的容量也相應(yīng)要大,這樣才會(huì)使較
(二)允許誤差的大小
允許誤差指允許的抽樣誤差,記為
允許誤差可以表示為
能范圍,所以又稱為誤差。 ,例如,樣本均值與總體均值之間的小,以保證估計(jì)的精確度。 ,允許誤差以絕對(duì)值的形式表現(xiàn)了抽樣誤差的可
允許誤差說明了估計(jì)的精度,所以,在其他條件不變的情況下,如果要求估計(jì)的精度高,允許誤差就小,那么樣本容量就要大一些;如要求的精確度不高,允許誤差可以大些,則樣本容量可以小一些。
(三)概率保證度1-α的大小
概率保證度說明了估計(jì)的可靠程度。所以,在其他條件不變的情況下,如果要求較高的可靠度,就要增大樣本容量;反之,可以相應(yīng)減少樣本容量。
(四)抽樣方法不同
在相同的條件下,重復(fù)抽樣的抽樣平均誤差比不重復(fù)抽樣的抽樣平均誤差大,所需要的樣本容量也就不同。重復(fù)抽樣需要更大的`樣本容量,而不重復(fù)抽樣的樣本容量則可小一些。
此外,必要的抽樣數(shù)目還要受抽樣組織方式的影響,這也是因?yàn)椴煌某闃咏M織方式有不同的抽樣平均誤差。
二、樣本容量的確定
(一) 估計(jì)總體均值的樣本容量
在總體均值的區(qū)間估計(jì)里,置信區(qū)間是由下式確定的:
例如,對(duì)于正態(tài)總體以及非正態(tài)總體大樣本時(shí),都是以它為置信區(qū)間。
從圖6–1中可以看到,從估計(jì)量x的取值到點(diǎn)的距離實(shí)際上為置信區(qū)間長(zhǎng)度的。這段距離表示在一定置信水平1-α下,用樣本均值估計(jì)總體均值時(shí)所允許的最大絕對(duì)誤差即允許誤差Δ。顯然,若以x的取值為原點(diǎn),則允許誤差Δ可以表示為:
(6–15)
x=0
圖6–1 允許誤差示意圖
公式(6–15)反映了允許誤差Δ、可靠性系數(shù)、總體標(biāo)準(zhǔn)差與樣本容量之間的相互制約關(guān)系。只要這四個(gè)因素中的任意三個(gè)因素確定后,另一個(gè)因素也就確定了。
在重復(fù)抽樣條件下,把允許誤差Δ的計(jì)算公式
容量的計(jì)算公式: 變形整理,則得到樣本
(6–16)
在不重復(fù)抽樣的條件下,抽樣允許誤差為
形后得到不重復(fù)抽樣條件下的樣本容量公式為 , 因此變
n=(6–17)
例6–14 某食品廠要檢驗(yàn)本月生產(chǎn)的10 000袋某產(chǎn)品的第一文庫(kù)網(wǎng)重量,根據(jù)以往的資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。如果要求在95.45%的置信度下,平均每袋重量的誤差不超過5克,應(yīng)抽查多少袋產(chǎn)品?
解由題意可知N=10 000(原作者誤為20 000),
1–α=95.45%,有=2。在重復(fù)抽樣的條件下 =25克,=5克,根據(jù)置信度
n=(袋)
注:Excel中的計(jì)算方法:
利用標(biāo)準(zhǔn)正態(tài)分布函數(shù)的反函數(shù)NORMSINV計(jì)算在該置信度下的標(biāo)準(zhǔn)偏差度z=2; 題中要求平均每袋重量的誤差不超過5,即表明SD*z小于或者等于5;
那么倒推標(biāo)準(zhǔn)偏差應(yīng)該不超過2.5;在總體標(biāo)準(zhǔn)差為25克的前提下,那么取樣量應(yīng)該為99.96,當(dāng)然,取樣量應(yīng)該是整數(shù),即100。
在不重復(fù)抽樣條件下
n==99(袋)
由計(jì)算結(jié)果可知:在其它條件相同的情況下,重復(fù)抽樣所需要的樣本容量大于不重復(fù)抽樣所需要的樣本容量。
在計(jì)算樣本容量時(shí),必須知道總體的方差,而在實(shí)際抽樣調(diào)查前,往往總體的方差是未知的。在實(shí)際操作時(shí),可以用過去的資料,若過去曾有若干個(gè)方差,應(yīng)該選擇最大的,以保證抽樣估計(jì)的精確度;也可以進(jìn)行一次小規(guī)模的調(diào)查,用調(diào)查所得的樣本方差來(lái)替代總體的方差。
(二)估計(jì)總體成數(shù)時(shí)的樣本容量
估計(jì)總體成數(shù)時(shí)樣本容量的確定方法與估計(jì)總體均值是一樣的,設(shè)
允許誤差,在1—a的置信度下,重復(fù)抽樣條件下有 為
解上面的方程可得重復(fù)抽樣條件下樣本容量的公式為
同理可得不重復(fù)抽樣條件下的樣本容量公式為
(6–19)
在估計(jì)成數(shù)時(shí),計(jì)算樣本容量時(shí)需要總體的成數(shù),但是總體的成數(shù)通常是未知的,在實(shí)際的抽樣調(diào)查時(shí),可先進(jìn)行小規(guī)模的試調(diào)查求得樣本的成數(shù)來(lái)代替。也可用歷史的資料,如果有若干個(gè)成數(shù)可供選擇,則應(yīng)選擇最靠近50%的成數(shù),使樣本成數(shù)的方差最大,以保證估計(jì)的精確度。
例6–15 為了檢查某企業(yè)生產(chǎn)的10 000個(gè)顯像管的合格率,需要確定樣本的容量。根據(jù)以往經(jīng)驗(yàn)合格率為90%、91.7%。如果要求估計(jì)的允許誤差不超過0.0275,置信水平為95.45%。求應(yīng)該取多少只顯像管?
解根據(jù)資料,我們應(yīng)該選擇P=0.9計(jì)算樣本容量,根據(jù)置信水平0.9545,有
重復(fù)抽樣條件下,樣本容量
=2,
不重復(fù)抽樣條件樣本容量
從計(jì)算的結(jié)果可以看出,重復(fù)抽樣應(yīng)該抽477件件檢驗(yàn),而不重復(fù)抽樣應(yīng)該抽455件,可見,在相同條件下,重復(fù)抽樣需要的樣本容量更大。
注:Excel中的計(jì)算方法:
利用標(biāo)準(zhǔn)正態(tài)分布函數(shù)的反函數(shù)NORMSINV計(jì)算在該置信度下的標(biāo)準(zhǔn)偏差度z=2.
【樣本容量的確定】相關(guān)文章:
確定05-18
確定位置01-21
不確定的意思是什么不確定造句示例03-31
勞動(dòng)賠償怎么確定02-09
面試如何確定勝勢(shì)01-01
CPA檢查標(biāo)尺確定08-02
確定方向 努力向前07-13