成对数据的统计分析
同步测试(5)
姓名:____________ 班级:____________ 学号:____________
考试时间:120分钟
题号评分
*注意事项:
1、答题前填写好自己的姓名、班级、考号等信息2、请将答案正确填写在答题卡上
阅卷人得分
满分:150分
四
五
总分
一二三
一、选择题(共12题,共60分)
1. 已知
的取值如下表
02.2
14.3
,则
C. 2.2
34.8 ( )
D. 0
46.7
从散点图可以看出 与 线性相关,且回归方程为 A.
B. 2.6
2. 变量x,y具有线性相关关系,根据下表数据,利用最小二乘法可以得到其回归直线方程x24568y2040607080A. 1
B. 2
C. 1.5
D. 2.5
, 则( )
3. 对两个变量y和x进行回归分析,得到一组样本数据:,则下列说法中不正确的是( )
A. 由样本数据得到的回归方程必过样本中心
B. 残差平方和越小的模型,拟合的效果越好
C. 用相关指数来刻画回归效果,越小,说明模型的似合效果越好
D. 若变量y和x之间的相关系数为r=-0.9362,则变量y和x之间具有线性相关关系
4. 某地为了解居民的每日总用电量 (万度)与气温 ( :气温 ( )
19
13
9
)之间的关系,收集了四天的每日总用电量和气温的数据如表
-1
第 1 页 共 13 页
每日总用电量
24
(万度)
经分析,可用线性回归方程 A. 32
343864
时,该地当日总用电量 (万度)为( )
D. 28
如下,其中拟和效果最好的模型是( )为0.D. 模型4的相关指数
为0.
拟合 与 的关系. 据此气温是 B. 31
C. 29
5. 在两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数A. 模型1的相关指数
为0.B. 模型2的相关指数
为0.C. 模型3的相关指数
25509880
6. 甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如表:
甲
RM
0.82106
乙0.78115
丙0.69124
丁0.85103
则哪位同学的试验结果体现A、B两变量有更强的线性相关性( )A. 甲
B. 乙
C. 丙
D. 丁
7. 通过随机询问2016名性别不同的大学生是否爱好某项运动,得到K2=6.023,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )P(K2≥k)
kA. 90%
……
0.251.323
0.152.072
0.102.706
0.0255.024
0.0106.635
0.0057.879
……
D. 99.5%
, 下列说法正确的是( )
B. 95%C. 97.5%
8. 调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数
A. 花瓣长度和花萼长度没有相关性
B. 花瓣长度和花萼长度呈现负相关
C. 花瓣长度和花萼长度呈现正相关
D. 若从样本中抽取一部分,则这部分的相关系数一定是
9. 给出以下四个说法:
①在匀速传递的产品生产流水线上,质检员每间隔20分钟抽取一件产品进行某项指标的检测 ,这样的抽样是分层抽样;②在刻画回归模型的拟合效果时,相关指数R2的值越大,说明拟合的效果越好;
第 2 页 共 13 页
③在回归直线方程中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位;④对分类变量X与Y,若它们的随机变量K2的观测值K越小,则判断“X与Y有关系”的把握程度越大.其中正确的说法是A. ①④B. ②④C. ①③D. ②③10. 某单位为了解夏季用电量与月份的关系,对本单位2021年5月份到8月份的日平均用电量y(单位:千度)进行了统计分析,得出下表数据:月份(x)5678 , 则表中t的值为( )C. 5.4D. 5.2日平均用电量(y)1.93.4t7.1若y与x线性相关,且求得其线性回归方程A. 5.8B. 5.611. 观察如图所示的等高条形图,其中最有把握认为两个分类变量x,y之间有关系的是( )A. B. C. D. 12. 根据如下样本数据得到的回归方程为 = x+ ,若 =4.5,则x每增加1个单位,y就( )xy3442.55﹣0.560.57﹣2C. 增加0.72个单位D. 减少0.72个单位A. 增加0.9个单位阅卷人得分B. 减少0.9个单位二、填空题(共4题,共20分)13. 某产品的宣传费用x(万元)与销售额y(万元)的统计数据如下表所示:宣传费用x(万元)销售额y(万元)224330442550根据上表可得回归方程 ,则宣传费用为6万元时,销售额约为 万元.14. 已知变量 之间的一组数据如表:01132537则 与 的线性回归直线必过点 .15. 对于左边2×2列联表,在二维条形图中,两个比例的值 性 . 与 相差越大,H:“x 与 Y 有关系”的可能16. ①回归分析中,相关指数 ②对于相关系数 , ③有一组样本数据 的值越大,说明残差平方和越大; 越接近0,相关程度越小; ,那么直线 必经过点 ; 得到的回归直线方程为 越接近1,相关程度越大, ④ 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合;以上几种说法正确的序号是 .阅卷人得分三、解答题(共6题,共70分)第 3 页 共 13 页17. 指数是用体重公斤数除以身高米数的平方得出的数字,是国际上常用的衡量人体胖瘦程度以及是否健康的一个标准.对
数值小于20.5时,我们说体重较轻,身
于高中男体育特长生而言,当数值大于或等于20.5时,我们说体重较重,当高大于或等于我们说身高较高,身高小于170cm我们说身高较矮.
【参考公式】
,
,
,
,
.
【参考数据】
, 0.102.706
,
0.053.811
,
, 0.016.635
.0.0057.879
(1) 已知某高中共有32名男体育特长生,其身高与有
的把握认为男生的身高对
身高较矮身高较高合计
指数有影响.
指数的数据如散点图,请根据所得信息,完成下述列联表,并判断是否
体重较轻体重较重合计
(2) ①从上述32名男体育特长生中随机选取8名,其身高和体重的数据如表所示:编号身高体重
116657
216758
316053
417361
517866
616957
715850
;
866817366
根据最小二乘法的思想与公式求得线性回归方程为编号体重残差
1570.1
2580.3
3530.9
461
566
657
.利用已经求得的线性回归方程,请完善下列残差表,并求解
750
释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字)
②通过残差分析,对于残差的最大(绝对值)的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为程.
.请重新根据最最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方
18. 已知函数y=a+bx与 点
,交函数
,若对于任意一点 的图象于点
,定义:
,过点 作与X轴垂直的直线,交函数y=a+bx的图象于
,若
则用函数y=a+bx来
拟合Y与X之间的关系更合适,否则用函数 (附:对于一组数据
)
来拟合Y与X之间的关系 ,其回归直线方程
的斜率和截距的最小二乘估计分别为
(1) 给定一组变量P1(1,4),P2(2,5),p3(3,6),p4(4,5.5),p5(5,5.6),p6(6,5.8),对于函数 Q2的值,并判断哪一个更适合作为点PI(xi,yi)(i=1,2,3…6)中的Y与X之间的拟合函数;
第 4 页 共 13 页
与函数
,试利用定义求Q1,
(2) 若一组变量的散点图符合 为多少.
图象,试利用下表中的有关数据与公式求y对x的回归方程, 并预测当 时, 的值
表中的
19. 某公司在若干地区各投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.
附公式: , .
(1) 根据频率分布直方图,计算图中各小长方形的宽度;
(2) 根据频率分布直方图,估计投入4万元广告费用之后,销售收益的平均值(以各组的区间中点值代表该组的取值);(3) 按照类似的研究方法,测得另外一些数据,并整理得到下表:广告投入 (单位:万元)销售收益 (单位:百万元)
12
23
32
4
57
表中的数据显示, 与 之间存在线性相关关系,请将(2)的结果填入空白栏,并计算 关于 的回归方程.
20. 淮南二中体育教研组为研究学生的身体素质与课外体育锻炼时间的关系,对本校200名高二学生的课外体育锻炼平均每天运动的时间进行调查,如表:(平均每天锻炼的时间单位:分钟)平均每天锻炼的时间(分钟)[0,10[10,20[20,30
)
总人数
20
)36
)44
[30,40)50
[40,50)40
[50,60)10
将学生日均课外体育运动时间在[40,60)上的学生评价为“课外体育达标”.参考公式:k2= 参考数据:
P(K2≥k0)0.100.050.0250.0100.0050.001
k0
2.7063.8415.0246.6357.87910.828
,其中n=a+b+c+d.
(1) 请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?
课外体育不达标课外体育达标合计男女合计
(2) 将上述调查所得到的频率视为概率,现在从该校高三学生中,抽取3名学生,记被抽取的3名学生中的:“课外体育达标”学生人数为X,若每次抽取的结果是相互独立的,求X的数学期望和方差.
15
110
第 5 页 共 13 页
21. 为了调查“五一”小长假出游选择“有水的地方”是否与性别有关,现从该市“五一”出游旅客中随机抽取500人进行调查,得到如下2×2列联表:(单位:人)
选择“有水的地方”
男女合计
90210300
不选择“有水的地方”11090200
合计200300500
(Ⅰ)据此样本,有多大的把握认为选择“有水的地方”与性别有关;
(Ⅱ)若以样本中各事件的频率作为概率估计全市“五一”所有出游旅客情况,现从该市的全体出游旅客(人数众多)中随机抽取3人,设3人中选择“有水的地方”的人数为随机变量X,求随机变量X的数学期望和方差.附临界值表及参考公式:P(K2≥k0)k0
0.053.841
0.0255.024
0.0106.635
0.0057.879
0.00110.828
,n=a+b+c+d.
第 6 页 共 13 页
答案及解析部分
1.
2.
3.
4.
5.
6.
第 7 页 共 13 页
7.
8.
9.
10.
11.
第 8 页 共 13 页
12.
13.
14.
第 9 页 共 13 页
15.
16.
17.(1)
(2)
第 10 页 共 13 页
18.(1)
(2)
第 11 页 共 13 页
19.(1)
(2)
(3)
20.(1)
第 12 页 共 13 页
(2)
21.
第 13 页 共 13 页
因篇幅问题不能全部显示,请点此查看更多更全内容