您的当前位置:首页正文

统计学重要例题

2024-03-01 来源:钮旅网
【例4.4】根据第三章表3-6中的数据,计算50名工人日加工零件数的众数 表3-6 某车间50名工人日加工零件数分组表 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 — M01201485123(个)

(148)(1410)表3-2 甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 甲城市 户数 (户) 24 108 93 45 30 300 累计频数 24 132 225 270 300 — 解:顺序数据本身就是排序的,根据中位数位置的确定公式:300+1÷2=150.5从累积频数看,中位数在―一般‖这一类中,即Me = 一般

【例4.5】根据第三章表3-5中的数据,计算50 名工人日加工零件数的中位数 表3-5 某车间50名工人日加工零件数分组表 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 — 50162Me5123.21(个) 12014107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139 【例4.6】根据9个家庭的收入调查数据,要求计算人均月收入的四分位数。 1500 750 780 1080 850 960 2000 1250 1630 解:

750 780 850 960 1080 1250 1500 1630 2000 根据公式

QL位置 =n/4=9/4=2.25QL= 780 + (850-780)*0.25 = 797.5(元)

QU位置 =3n/4=3×9/4=6.75 QU=1250 + (1500-1250) ×0.75 = 1437.5(元)

【例4.7】计算50 名工人日加工零件数的四分位数 表3-5 某车间50名工人日加工零件数分组表 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 QL位置=50/4=12.5

频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 — 508QL51154117.81(个)

8QU位置=3×50/4=37.5

350304QU5125128.75(个) 10【例4.8】计算第三章中50个工人日加工零件数的均值 X= (117+122+……121)/50 = 6149/50 = 122.98(个)

【例4.9】根据第三章表3-5中的数据,计算50 名工人日加工零件数的均值

表4-1 某车间50名工人日加工零件均值计算表 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 组中值(Mi) 频数(Fi) 3 5 8 14 10 6 4 50 频数(Fi) 3 5 8 14 10 6 4 50 MiFi — 组中值(Xi) 107.5 112.5 117.5 122.5 127.5 132.5 137.5 — XiFi 322.5 562.5 940.0 1715.0 1275.0 795.0 550.0 6160.0 表4-1 某车间50名工人日加工零件均值计算表

【例4.10】一位投资者持有一种股票,2001-2004年的收益率分别为4.5%,2.1%,25.5%,1.9%要求计算该投资者在这4年内的平均收益率。 解:设平均收益率为G

= 108.0787%

则G = GM –1 = 108.0787%-1 = 8.0787%

【例4.11】某水泥生产企业2001年的水泥产量为100万吨,2002年的产量比2001增长了9%,2003年比2002年增长了16%,2004年比2003增长20%。求该企业2002年、2003年、2004年这三年的平均增长率。 解:

= 114.91%

则年平均增长率为114.91%-100% = 14.91% 异众比率(算例)

表3-1 某城市居民关注广告类型的频数分布 广告类型 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 合计 人数(人) 112 51 9 16 210 2 频率(%) 56.0 25.5 4.5 N8.0 5.0 1.0

GMnx1x…x104.5%102.1%125.5%101.9%100 109%116%120%GMnx1200 x2…xN解:Vr = 200 – 112/200= 1 – 112/200= 0.44 = 44%

在所调查的200人当中,关注非商品广告的人数占44%,异众比率还是比较大。因此,用―商品广告‖来反映城市居民对广告关注的一般趋势,其代表性不是很好 计算甲城市家庭对住房满意状况评价的四分位差 表3-2 甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 甲城市 户数 (户) 24 108 93 45 30 300 累计频数 24 132 225 270 300 — 解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 QL = 不满意 = 2, QU = 一般 = 3

四分位差: QD = QU – QL=3-2=1

【例4.13】根据第三章表3-5中的数据,计算工人日加工零件数的平均差 表4-5 某车间50名工人日加工零件标准差计算表 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 组中值(Mi) 频数(fi) 3 5 8 14 10 6 4 | Mi- X | |Mi-X |Fi 合计 — 50 — 表4-5 某车间50名工人日加工零件标准差计算表 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 家庭编号 1 2 3 4 5 6 7 8 9 组中值(Xi) 107.5 112.5 117.5 122.5 127.5 132.5 137.5 — 频数(Fi) 3 5 8 14 10 6 4 50 | Xi- X | 15.7 10.7 5.7 0.7 4.3 9.3 14.3 — |Xi-X |Fi 47.1 53.5 45.6 9.8 43.0 55.8 57.2 312 标准分数 0.695 -1.042 -0.973 -0.278 -0.811 -0.556 1.853 0.116 0.996 【例4.13】计算9个家庭每个家庭人均月收入的标准分数

人均月收入(元) 1500 750 780 1080 850 960 2000 1250 1630

【例4.14】某管理局抽查了所属的8家企业,其产品销售 数据如表4.7。试比较产品销售额与销售利润的离散程度 表4-7 某管理局所属8家企业的产品销售数据 企业编号 1 2 3 4 5 6 7 8 产品销售额(万元) X1 170 220 390 430 480 650 950 1000 销售利润(万元) X2 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 X1=536.25(万元) X2=32.5215(万元) S1=309.19(万元) S2=23.09(万元) V1=309.19/536.25=0.577 V2=23.09/

32.5215

=0.710

结论: 计算结果表明,V1第六章

【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体

总体分布 的均值、方差及分布如下 .3 Xii1NN.2 2.5 .1 0 1 2 3 4 2(Xi1Ni)21.25

N现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表

所有可能的n = 2 的样本(共16个) 第一个 第二个观察值 观察值 1 2 3 1 2 3 4 1,1 2,1 3,1 4,1 1,2 2,2 3,2 4,2 1,3 2,3 3,3 4,3 4 1,4 2,4 3,4 4,4 计算出各样本的均值,如下表。并给出样本均值的抽样分布

16个样本的均值(x) 第一个 观察值 1 2 3 4 第二个观察值 1 1.0 1.5 2.0 2.5 2 1.5 2.0 2.5 3.0 3 2.0 2.5 3.0 3.5 4 2.5 3.0 3.5 4.0

.3

P ( x ) .2

.1

0

1.0 1.5 2.0 2.5 3.0 3.5 4.0 x

样本均值的抽样分布

所有样本均值的均值和方差

xxi1niMn1.01.54.02.5

16)22x(xii1xM(1.02.5)2(4.02.5)220.625

16n式中:M为样本均值的个数

【例】设从一个均值μ=8、标准差σ=0.7的总体中随机抽取容量为n=49的样本。要求: (1)计算样本均值小于7.9的近似概率 (2)计算样本均值超过7.9的近似概率 (3)计算样本均值在总体均值μ=8附近 0.1范围的近似概率

【例】某公司有400人,平均工龄为10年,标准差为3年。随机抽出49名组成一个简单随机样本, 试问样本中工作人员的平均年龄不低于9年的概率有多大。

解:虽然该总体的分布未知,但样本容量n=49较大由中心极限定理可知, 样本均值的抽样分布近似服从正态分布。则均值的期望均值的标准差

=1-Φ(-2.33)= Φ(2.33)=0.9901

【例】已知对某超市服务水平不满意的人数的比例为5%,现随机抽取475名顾客组成的简单随机样本,问这475名顾客中不满意的比例在0.03~0.075之间的概率有多大? 解:设475名顾客中不满意的比例为p,则

E(p)=0.05, D(p)=0.05×0.95/475=0.0001 p~N(0.05,0.0001)

【例】居民区甲有2000个家庭,平均居住时间为130个月,服从正态分布,标准差为30个月;居民区乙有3000个家庭,平均居住时间为120个月,也服从正态分布,标准差为35个月。从两个居民区中独立地各自抽取一个简单随机样本,样本容量为70和100。问居民区甲样本中的平均居住时间超过居民区乙样本中的居民平均居住时间的概率是多大。 【例】某厂甲、乙两个车间生产同一种产品,根据经验其产品的不合格率分别为3.5%和4%。从甲车间随机独立地抽取200个产品,从乙车间随机独立地抽取150个产品。问两个样本中产品不合格率相差不超过1%的概率。

【例】某类产品的抗拉强度服从正态分布,平均值为99.8公斤/平方厘米,标准差为5.48公斤/平方厘米,从这个总体抽出一个容量为12的样本,问这一样本的平均值介于98.8公斤/平方厘米和100.9公斤/平方厘米之间的概率有多大。

第7章 参数估计

【例】某厂成批生产某种金属棒,其长度服从 正态分布,标准差为0.06厘米,对一个由25

厘米,求这批金属棒平均长度p7.48 根棒组成的随机样本进行了测量,平均长度为μ的置信度

P(0.03p0.075)P 为95%的置信区间。 0.010.010.01解:总体服从正态分布,方差已知,置信度为95% 则z0.025=1.96,

0.99380.977210.971

在置信度为95%水平下,金属棒的平均长度在7.456~7.504厘米之间。

【例】一家保险公司收集到由36位投保人组成的随机样本,他们的平均年龄为40岁,标准差为5岁,求这家保险公司的所有投保人的平均年龄在90%的置信水平下的置信区间。

解:总体的分布未知,总体方差也未知,但所抽 样本容量36为大样本,因此,求总体均值的 置信区间可用样本标准差代替总体标准差置信区间为:

0.06

xZ的置信度下的置信区间为7.481.9638.63岁-41.377.480.0247.456则投保人平均年龄在90%岁。

n25【例】某时装店的管理人员想估计其顾客的平均 年龄,随机抽取了16位顾客进行了调查,得到

 样本均值为32岁,样本标准差为8岁,假定顾客的年龄近似服从正态分布,求该店全部顾客平均

年龄在置信度为95%的置信区间。

解:因为总体近似服从正态分布,方差未知,所抽样本为小样本,则总体均值的置信区间为

xZ0.067.481.967.480.0247.504n25

s536.262之间。 因此,有95%的把握估计全部顾客平均年龄在27.738至

xZn401.64536401.37【例】某城市想要估计下岗职工中女性所占的比例,随机抽取了100个下岗职工,其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间 解:已知n=100,zα/2 =1.96, p=65/100=0.65

该城市下岗职工中女性比例在95%置信度下的置信区间为0.56-0.74

【例】某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约 为120元,现要以95%的置信水平去估计每个顾客平均购物金额的置信区间,并要求边 际误差不超过20元,应抽取多少个顾客作为样本? 第8章 假设检验

p1p0.6510.65【例】1989年某地新生儿的平均体重为3190克,现从1990年的新生儿中随机抽取100个,测得其平均体重为3210pz/20.651.96n1989年相比,体重有无显著差异。100 克,问1990年的新生儿与

H0:μ= 3190(克) 90年新生儿的体重 与89年无显著差异 H1:μ≠3190(克) 90年新生儿的体重与89年有显著差异

【例】某品牌的洗涤剂在其产品说明书中声称:每瓶的―平均净含量不低于500克‖。从消费者的 利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈 述原假设和备择假设。

H0:μ≥500 (净含量符合说明书) H1:μ<500 (净含量不符合说明书)

【例】某种大量生产的袋装食品,按规定重量不得少于250克。今从一批该种食品中随机抽取50袋,发现有6袋重量低于250克。若规定不符合标准的比例达到5%,食品就不得出厂,则该批食品能否出厂?

H0:μ≤ 5% (次品率没有超过上限,可以出厂) H1:μ> 5% (次品率超过上限,不可以出厂) 【例】某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为0.025 。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05) 解:H0: μ= 0.081mm 没有明显差异

H1: μ 0.081mm 有显著差异 已知μ0 = 0.081mm,σ=0.025mm,

n = 200,因为是大样本,故选择Z统计量 α=0.05,z0.025=1.96

检验统计量:统计决策:

因为

,Z值位于拒绝域,

所以拒绝H0,可以认为新机床加工的零件的椭圆度与老机床有显著差异

【例】某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于1000小时。已知灯泡燃烧寿命服从正态分布,标准差为200小时。在总体中随机抽取了100个灯泡,得知样本均值为960小时,当显著性水平α=0.05时,批发商是否应该购买这批灯泡? 解:H0: μ≥1000小时 应购买灯泡

H1: μ<1000小时 拒绝购买灯泡

x0.0760.081Z2.831.96已知μ0 = 1000(小时),σ=200(小时),

n0.025200 n = 100,因为是大样本,故选择Z统计量

ZZ α=0.05,本题为左侧检验,因此zα= 1.645 x小时)检验统计量:统计决策:

因为

,Z值位于拒绝域,

所以应拒绝H0,检验表明这批灯泡的使用寿命低于1000小时,批发商不应购买这批灯泡。

【例】电视机显像管批量生产的质量标准为平均使用寿命1200小时,标准差为300小时。某电视机厂宣称其生产的显像管质量大大超过规定标准。为了进行验证,随机抽取了100件为样本,测得平均使用寿命为1245小时。能否说该厂的显像管质量显著高于规定标准?(α=0.05) 解:H0:μ≤1200 质量没有显著超过标准 H1:μ>1200 质量显著超过标准 x9601000z21.645本题为右侧检验,α=0.05,Zα =1.645

n200100已知n=100,σ=300,故采用Z统计量验证 

因为Z【例】某机器制造出的肥皂厚度为5cm,根据经验可知,该机器制造出的肥皂厚度服从正态分布。今欲了解机器性能是否良好,随机抽取10块肥皂为样本,测得平均厚度为5.3cm,标准差为0.3cm,试以0.05的显著性水平检验机器性能良好的假设。 解:H0: μ= 5cm H1: μ 5cm

x,是小样本,因此,应选择12451200μ0 = 5cm,σ未知,n=10t统计量。此题为双侧检验,α=0.05,t0.025(9)=2.262

Z/n300/1001.51.645检验统计量:统计决策:

因为

,样本统计量落入拒绝域,所以拒绝H0,可以认为该机器的性能不好

【例】某种大量生产的袋装食品,按规定重量不得少于250克。今从一批该种食品中随机抽取50袋,发现有6袋重量

低于250克。若规定不符合标准的比例达到5%,食品就不得出厂,则该批食品能否出厂? 解:H0: ≤ 5%H1: > 5%

本题为右侧检验,α=0.05,Zα =1.645 已知n=50, = 5% ,p=6/50 =0.12

x5.35t3.162.262sn0.310

因为Z>Zα,Z值落在拒绝域中,所以拒绝原假设,即不能说该批食品不能出厂。

tt255毫升,标准差为5毫升。为检验每罐容量是否符合要求,质

计算题:饮料采用自动生产线生产,每罐的容量是

检人员在某天生产的饮料中随机抽取40罐进行检验,测得每罐平均容量为255.8毫升。取显著性水平α=0.05,检验该天生产的饮料容量是否符合标准要求。

解:H0: μ= 255  H1: μ 255(毫升) p(毫升) 0.125%Z2.271.645已知μ0 = 255(毫升),σ=5(毫升),n = 40,选择Z统计量。α=0.05,z0.025=1.96

0(10)n5%(15%)50检验统计量:统计决策:

因为

,Z值位于接受域,

所以不能拒绝原假设,因此没有证据表明该天生产的饮料不符合标准要求。

因篇幅问题不能全部显示,请点此查看更多更全内容