抽样调查,习题答案
篇一:《抽样技术》第四版习题答案 第2章
2.1 解:?1? 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号
为1~的这些单元中每一个单元被抽到的概率都是 1 。 100
?2?这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中
的编号为1~35以及编号为的这36个单元中每个单元的入样概率都是抽中的编号为36~63的每个单元的入样概率都是 2
,而尚未被100 1。 100
?3?这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~
21 000中的每个单元的入样概率都是
1
1
,所以这种抽样是等概率的。 1000
2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 间为??z? _
E近似服从标准正态分布, Y的195%的置信区 _ z。 1 而V 1?f2
S中总体的方差S2是未知的,用样本方差s2来代替,置信区间 n 为 ,?_ 2
2
。 ?
由题意知道,y?9.5,s?206,而且样本量为n?300,N?50000,代入可以求得 v(y)? _
1?f21?50000
s??206?0.6825。将它们代入上面的式子可得该市居民n300 日用电量的95%置信区间为??7.8808,11.1192??。 下一步计算样本量。绝对误差限d和相对误差限r的关系为d?rY。 根据置信区间的求解方法可知 _ _
__PyYrY1P 1 _
2_rY
根据正态分布的分位数可以知道 P。?Z1??,所以V z?2? _
3
rY??11?
也就是S2nnNz?? 2? _ 2 2 2
_rY1?。 22
Nz/2S
把y?9.5,s?206,r?10%,N?50000代入上式可得,n?86以总体比例P的195%的置信区间n?1 可以写为 pz
p?z?,将p?0.35,n?200,N?10000代入可得置 信区间为??0.2844,0.4156??。
2.5 解:利用得到的样本,计算得到样本均值为?20/20?144.5,从而估计小
区的平均文化支出为144.5元。总体均值Y的195%的置信区间为 _
4
z?
z,用v1?fs2来估计样本均值的方差V??。 ?n 1?f21?0.12 s?
如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为 n?n070%?88.57?。
2.8 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关
系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为X?2135。利用去年的化肥总产量,今年的化肥 3
总产量的估计值为YR?RX? ^ yx _ _
X?2426.14吨。
1?f计值为v?yR??1.94。这个数值
5
比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的195%的置信区间为 Rz R?z? R? R?,
把具体的数值代入可得置信区间为?143.57,149.03?。 __VyRvyR 1.94?0.052,这是比估
接下来比较比估计和简单估计的效率, Vv37.17
计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。 2
2.10 解:利用简单估计量可得??yin?1630/10?163,样本方差为s?212.222,
N?120,样本均值的方差估计值为v 1?f21?10/120
s??212.222?19.4537。 n10
利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是
6
合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为??0.971,而且这种相关关系是稳定的,这里肉牛的原重量的体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对几种分层方法的判断如下:
(1)选择性别作为分层变量,是不合适的。首先,性别这个变量与研究最关心的变量(不同职务,职称的人对分配制度改革的态度)没有很大的相关性;其次,用性别作为分层变量后,层内之间的差异仍然很大,相反,层之间的差异不是很大,因为男性和女性各自内部的职务,职称也存在很大的差别;最后,选择性别作为分层变量后,需要首先得到男性和女性的抽样框,这样会更加麻烦,也会使抽样会变得更加复杂。 (2)按照教师、行政管理人员和职工进行分层,是合适的。这种分层的指标与抽样调查研究中最关心的变量高度相关,而且按照这种方法分层后,可以看出层内对于分配制度改革的态度差异比较小,因为他们属于相同的阶层,而层之间的态度的差异是比较大的。这样选取出来的样本具有很好的代表性。
(3)按照职称(正高、副高、中级、初级和其他)分层,也是合理的。理由与(2)相同,这样进行分层的变量选择与调查最关心的变量是高度相关的,分层后的层满足分层的要
7
求。所以,按照职称进行分层是合理的。
(4)按照部门进行分层,是合理的。因为学校有很多院、系或者所,直接进行简单随机抽样,有可能样本不能很好地代表各个院系,最关心的变量与部门也存在一定的相关性。这样分层后,每个层的总体数目和抽取的样本量都较小,最终的样本的分布比较均匀,比简单随机抽样更加方便实施。 3.2 解:设计的方案如下:
第一种方案:可以按照不同的专业进行分层,但是考虑到如果在每层都抽取,不能保证每个新生的入样概率相等,因为每个专业的人数比例未知,8个人的样本量无法在每个层之 5
篇二:抽样调查习题及答案
第四章习题 抽样调查 一、 填空题
1. 抽样调查是遵循随机的原则 抽选样本,通过对样本单位的调查来对研究对象的总体数量特征作出推断的。 2. 采用不重复抽样方法,从总体为N的单位中,抽取样本容量为n的可能样本个数为N(N-1)(N-2)??(N-N+1)。 3. 只要使用非全面调查的方法,即使遵守随机原则,抽样误差也不可避免会产生。 4. 参数估计有两种形式:一是点估计,二是区间估计。
5. 判别估计量优良性的三个准则是:无偏性 、一致性和
8
有效性。 6. 我们采用“抽样指标的标准差”,即所有抽样估计值的标准差,作为衡量抽样估计的抽样误差大小的尺度。 7. 常用的抽样方法有简单随机抽样、类型(分组)抽样、等距抽样、整群抽样和分阶段抽样。
8. 对于简单随机重复抽样,若其他条件不变,则当极限误差范围Δ缩小一半,抽样单位数必须为原来的4倍。若Δ扩大一倍,则抽样单位数为原来的1/4。
9. 如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是1000,极限抽样误差是40.82,抽样平均误差是20.41。
10. 在同样的精度要求下,不重复抽样比重复抽样需要的样本容量少,整群抽样比个体抽样需要的样本容量多。 二、判断题
1. 抽样误差是抽样调查中无法避免的误差。(√) 2. 抽样误差的产生是由于破坏了随机原则所造成的。(×) 3. 重复抽样条件下的抽样平均误差总是大于不重复抽样条件下的抽样平均误差。(√) 4. 在其他条件不变的情况下,抽样平均误差要减少为原来的1/3,则样本容量必须增大到9倍。(√)
5. 抽样调查所遵循的基本原则是可靠性原则。(×) 6. 样本指标是一个客观存在的常数。(×)
7. 全面调查只有登记性误差而没有代表性误差,抽样调查
9
只有代表性误差而没有登记性误差。(×)
8. 抽样平均误差就是抽样平均数的标准差。(×) 三、 单项选择题
1. 用简单随机抽样(重复)方法抽取样本单位,如果要使抽样平均误差降低50%,则样本容量需扩大为原来的(C) A. 2倍 B. 3倍 C. 4倍 D. 5倍
2. 事先将全及总体各单位按某一标志排列,然后依固定顺序和间隔来抽选调查单位的抽样组织方式叫做(D) A. 分层抽样 B. 简单随机抽样 C. 整群抽样 D. 等距抽样
3. 计算抽样平均误差时,若有多个样本标准差的资料,应选哪个来计算(B)A. 最小一个 B. 最大一个 C. 中间一个 D. 平均值 4. 抽样误差是指(D)
A. 计算过程中产生的误差 B. 调查中产生的登记性误差 C. 调查中产生的系统性误差 D. 随机性的代表性误差 5. 抽样成数是一个(A)
A. 结构相对数B. 比例相对数C. 比较相对数D. 强度相对数 6. 成数和成数方差的关系是(C)
A.成数越接近于0,成数方差越大 B.成数越接近于1,成数方差越大 C.成数越接近于0.5,成数方差越大D.成数越接近于0.25,成数方差越大 7. 整群抽样是对被抽中的群作全面调查,所以整群抽样是(B)
10
A. (转载于:www.XltkWJ.Com 小 龙文档 网:抽样调查,习题答案)全面调查B. 非全面调查C. 一次性调查D. 经常性调查
8. 对400名大学生抽取19%进行不重复抽样调查,其中优等生比重为20%,概率保证程度为95.45%,则优等生比重的极限抽样误差为(40%)A. 4% B. 4.13% C. 9.18% D. 8.26%
9. 根据5%抽样资料表明,甲产品合格率为60%,乙产品合格率为80%,在抽样产品数相等的条件下,合格率的抽样误差是(B)
A. 甲产品大 B. 乙产品大C. 相等 D. 无法判断 10. 抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知乙企业工人数比甲企业工人数多3倍,则随机抽样误差(B)
A. 甲企业较大B. 乙企业较大C. 不能作出结论 D. 相同 四、 多项选择题
抽样调查中的抽样误差是(ABCDE)
A. 是不可避免要产生的B. 是可以通过改进调查方法来避免的
C. 是可以计算出来的D. 只能在调查结果之后才能计算 E. 其大小是可以控制的 2. 重复抽样的特点是(AC) A. 各次抽选相互影响B. 各次抽选互不影响 C. 每次抽
11
选时,总体单位数始终不变 D 每次抽选时,总体单位数逐渐减少
E. 各单位被抽中的机会在各次抽选中相等 3. 抽样调查所需的样本容量取决于(ABE)
A. 总体中各单位标志间的变异程度 B. 允许误差 C. 样本个数 D. 置信度 E. 抽样方法
4. 分层抽样误差的大小取决于(BCD)
A. 各组样本容量占总体比重的分配状况 B. 各组间的标志变异程度
C. 样本容量的大小 D. 各组内标志值的变异程度E. 总体标志值的变异程度 5. 在抽样调查中(ACD)
A. 全及指标是唯一确定的 B. 样本指标是唯一确定的 C. 全及总体是唯一确定的 D. 样本指标是随机变量 E. 全及指标是随机变量 五、 名词解释 1.抽样推断 2.抽样误差 3.重复抽样与不重复抽样 4.区间估计 六、 计算题 1.某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下: (1)试以0.95的置信度估计该公司工人的月平均工资所在范围。
(2)试以0.9545的置信度估计月收入在1000元及以上工人所占比重。
2.对一批产品按不重复抽样方法抽选200件,其中废品8件。又知道抽样总体是成品总量的
12
x? xff 122300 2038.33 60 2 x? x?xf f
1626833.33 1.66 60? 27113. 21.2660 2 n 1.662 60
x?t?x?X?x?t?x
13
2038.33?1.96?21.26~2038.33?1.96?21.262038.33?41.67~2038.33?41.671996.66~2080.00
3.某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?
P=93% p(1-p)=0.93×(1-0.93)=0.0651 n? t2p(1?p) 2
32?0.06510.5859 66(件)2
0.0090.03 要求以95.45%的置信度估计该企业职工平均支出和总支出的置信区间。
样本平均数组间方差抽样平均误差区间估计 x? nx ii?1 k i 2
14
nni?i2 n
120?230?80?14038800 194
120?80200120?60?80?4010400 52 120?80200? 52
0.260.51200 ?x? i2n
x??x至x??x?194?2?0.51~194?2?0.51 192.98~195.02
在95.45%的把握程度保证下,该企业职工的平均支出在192.98元和195.02元之间.
5.有一连续生产企业,一昼夜中每小时抽5分钟产品进行全面调查,测得该产品的平均使用寿命为160小时,样本平均数的群间方差为62小时,试以95.45%的把握推断全天产品的平均使用寿命。 全样本平均数?x? x
15
i?1 r i 2x X?X? R r
160(小时) 2 或?2? x?x? r 2
62(小时) 2Rr r?R?1? 62?288?24?
(小时)2.5833?0.9197?1.54 24?288?1? 区间估计
x??x至x??x?160?2?1.54~160?2?1.54
16
156.92~163.04
在95.45%的把握程度的保证下,该批电子元件的平均使用寿命在156.92小时与163.04小时之间.
6.设“托福“的考分服从平均数580分,标准差为100分的正态分布,问当随机抽取20人进行调查,样本的平均数介于550分至610分的概率是多少?样本的平均分数等于和超过600分的概率是多少? t2?2n?2 xt 1002
当t?1.3416查概率表得到的概率为82%。也就是样本平均数介于550分至610分的概率为82%。
整个置信区间长度为60分,其概率为82%,由于考分平均数580分并成正态分布,因此我们可以
1这样考虑,超过600分的区间为(600—610)10分,是整个区间60分的,也就是 6 11
占82%的;这样我们可以判断超过600分的概率应该为82%?13.7%。 66 =
17
580?55022
20?580?550?.8?1.3416 20? t2?1002
篇三:《统计学》抽样调查习题和答案 六.计算题部分
1、对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%?
答案:解:n?100,p?4?4%,t?2?? p 100 p(1?p) n
0.04(1?0.04) 100 0.0196 ? p t p
18
20.01960.039 p?? p Ppp
0.04?0.039?P?0.04?0.039
0.1%------7.9% ∴废品率不超过6%
2、某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。 要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。(2)以同样概率估计全乡农户年纯收入总额的区间范围。 答案: 解: 2000?200 ?x?t?x?1.96?200?392 x n
x??x?X?x??x
12000?392?X?12000?392
11608-----12392(元) 5000×11608------5000×12392(元) 3、某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间。 答案:
解:n?100,?6000,??300,t?2300?30(小时) (小时) ?x?t?x?2?30?60x n
19
x?X?x6000?60?X?6000?60 5940-----6060(小时) 4、 从某年级学生中按简单随机抽样方式抽取50名学生,对理论课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(99.73%t=3、68.27%t=1)的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生? 答案:解:n?50,x?75.6,??10,t?2 ? x n 1050 1.4142 x
tx21.41422.8284 ?x?t?x?3?1.4142?4.2426 xx
xX?x?? 75.6?2.8284 X75.62.8284
75.6?4.2426?X?75.6?4.2426
72.77----78.43
71.3574---79.8426
20
74.1858---77.0142将允许误差缩小一半,应抽取的学生数为: n? t?(?x2
21