格物学 第八章 成对数据的统计分析8.3 列联表与独立性检

独立性检验及其应用-8.3 列联表与独立性检知识点课后进阶选择题自测题解析-重庆市等高三数学选择必修,平均正确率57.99999999999999%

2025-05-29
独立性检验及其应用-8.3 列联表与独立性检知识点课后进阶选择题自测题解析-重庆市等高三数学选择必修,平均正确率57.99999999999999%
1、['独立性检验及其应用']

正确率60.0%已知$${{2}{×}{2}}$$列联表如下:

$${{X}}$$ $${{Y}}$$ 合计
$${{Y}{=}{0}}$$ ​ $${{Y}{=}{1}}$$ ​
$${{X}{=}{0}}$$ $${{m}}$$ $${{1}{2}{−}{m}}$$ $${{1}{2}}$$
$${{X}{=}{1}}$$ $${{1}{0}{−}{m}}$$ $${{2}{0}{+}{m}}$$ $${{3}{0}}$$
合计 $${{1}{0}}$$ $${{3}{2}}$$ $${{4}{2}}$$
其中$$m, ~ 1 2-m$$均为大于$${{4}}$$的整数,若在犯错误的概率不超过$${{0}{.}{0}{1}}$$的前提下认为$${{X}}$$和$${{Y}}$$之间有关联,则$${{m}{=}}$$(
附:$$\chi^{2}=\frac{n ( a d-b c )^{2}} {( a+b ) ( c+d ) ( a+c ) ( b+d )},$$其中$$n=a+b+c+d$$.
$${{α}}$$ $${{0}{.}{1}}$$ $${{0}{.}{0}{5}}$$ $${{0}{.}{0}{1}}$$ $$0. 0 0 5$$
$${{x}_{α}}$$ $$2. 7 0 6$$ $$3. 8 4 1$$ $$6. 6 3 5$$ $$7. 8 7 9$$

B

A.$${{6}}$$

B.$${{7}}$$

C.$${{8}}$$

D.$${{9}}$$

2、['独立性检验及其应用']

正确率80.0%在某一次行程中$${,{{5}{0}}}$$名男乘客中有$${{2}{5}}$$名晕车$${,{{3}{0}}}$$名女乘客中有$${{5}}$$名晕车.为调查乘客的晕车情况,在检验这些乘客是否晕车与性别的关系时,常采用的数据分析方法是(

B

A.回归分析

B.独立性检验

C.频率分布直方图

D.用样本估计总体

3、['独立性检验及其应用']

正确率60.0%针对时下的“抖音热”,某校团委对“学生性别和是否喜欢抖音”做了一次调查,其中被调查的男、女生人数相同,男生喜欢抖音的人数占男生人数的$$\frac{4} {5},$$女生喜欢抖音的人数占女生人数的$$\frac{3} {5},$$若有$${{9}{5}{%}}$$的把握认为是否喜欢抖音和性别有关,则被调查的学生中男生最少有(
附表:

$$\alpha=P ( \chi^{2} \geqslant k )$$ $${{0}{.}{0}{5}}$$ $${{0}{.}{0}{1}}$$
$${{k}}$$ $$3. 8 4 1$$ $$6. 6 3 5$$

B

A.$${{2}{5}}$$人

B.$${{4}{5}}$$人

C.$${{6}{0}}$$人

D.$${{7}{5}}$$人

4、['独立性检验及其应用']

正确率60.0%利用独立性检验来考虑两个分变量$${{X}}$$和$${{Y}}$$是否有关系时,通过查阅临界值表来确定推断$${{“}{X}}$$与$${{Y}}$$有关系$${{”}}$$的可信度,如果$$k > 7. 8 7 9$$,那么就推断$${{“}{X}}$$和$${{Y}}$$有关系$${{”}}$$,这种推断犯错误的概率不超过(

D

A.$$0. 0 2 5$$

B.$$0. 9 7 5$$

C.$$0. 9 9 5$$

D.$$0. 0 0 5$$

5、['独立性检验及其应用', '线性回归模型的最小二乘法', '残差']

正确率40.0%给出下列命题:
$${①}$$在吸烟与患肺病这两个分类变量的计算中,从独立性检验可知有$${{9}{9}{%}}$$的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有$${{9}{9}{%}}$$的可能患有肺病
$${②}$$由变量$${{x}}$$和$${{y}}$$的数据得到其回归直线方程$$l : \hat{y}=b x+a$$,则$${{l}}$$一定经过点$$P ( \bar{x}, \bar{y} )$$;
$${③}$$在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;
$${④}$$在回归直线方程$$\hat{y}=0. 1 x+1 0$$中,当解释变量$${{x}}$$每增加一个单位时,预报变量$${{y}{^}}$$增加$${{0}{.}{1}}$$个单位,其中真命题的有(

C

A.$${{1}}$$个

B.$${{2}}$$个

C.$${{3}}$$个

D.$${{4}}$$个

6、['独立性检验及其应用', '直线拟合', '线性相关与非线性相关', '一元线性回归模型']

正确率60.0%对两个变量进行回归分析,则下列说法中不正确的是(

B

A.有样本数据得到的回归方程$$\stackrel{\wedge} {y}=\stackrel{\wedge} {b} x+\stackrel{\wedge} {a}$$必经过样本中心$$( \, \dot{x}, \, \, \dot{y} )$$

B.残差平方和越大,模型的拟合效果越好

C.用$${{R}^{2}}$$来刻画回归效果,$${{R}^{2}}$$越大,说明模型的拟合效果越好

D.若散点图中的样本呈条状分布,则变量$${{y}}$$和$${{x}}$$之间具有线性相关关系

7、['独立性检验及其应用']

正确率60.0%某班主任对班级$${{9}{0}}$$名学生进行了作业量多少的调查,结合数据建立了如下列联表(单位:名):

电脑游戏
认为作业
合计
喜欢玩 $${{1}{0}}$$ $${{3}{5}}$$ $${{4}{5}}$$
不喜欢玩 $${{7}}$$ $${{3}{8}}$$ $${{4}{5}}$$
合计 $${{1}{7}}$$ $${{7}{3}}$$ $${{9}{0}}$$
利用独立性检验估计,可推断喜欢玩电脑游戏与认为作业多有关系的犯错误的概率介于(
(临界值表如下)
$${{α}}$$ $${{0}{.}{5}{0}}$$ $${{0}{.}{4}{0}}$$ $${{0}{.}{2}{5}}$$ $${{0}{.}{1}{5}}$$
$${{x}_{α}}$$ $$0. 4 5 5$$ $$0. 7 0 8$$ $$1. 3 2 3$$ $$2. 0 7 2$$

B

A.$$0. 1 5 \; 0. 2 5$$

B.$$0. 4 0 \ 0. 5 0$$

C.$$0. 5 0 \ 0. 6 0$$

D.$$0. 7 5 \ 0. 8 5$$

8、['线性回归模型的最小二乘法', '独立性检验及其应用', '残差', '一元线性回归模型']

正确率40.0%下列说法:
$${①}$$残差可用来判断模型拟合的效果;
$${②}$$设有一个回归方程$$\stackrel{\wedge} {y}=3-5 x,$$变量$${{x}}$$增加一个单位时,$${{y}}$$平均增加$${{5}}$$个单位;
$${③}$$线性回归方程$$\stackrel{\wedge} {y}=\stackrel{\wedge} {b} x+\stackrel{\wedge} {a}$$必过$$( \, \dot{x}, \, \, \dot{y} )$$;
$${④}$$在一个$${{2}{×}{2}}$$列联表中,由计算得$$k^{2}=1 3. 0 7 9$$,则有$${{9}{9}{%}}$$的把握确认这两个变量间有关系(其中$$P ~ ( ~ k^{2} \geqslant1 0. 8 2 8 ) ~=0. 0 0 1 )$$;
其中错误的个数是(

B

A.$${{0}}$$

B.$${{1}}$$

C.$${{2}}$$

D.$${{3}}$$.

9、['独立性检验及其应用']

正确率60.0%为了调查研究喝牛奶对身高(单位:$${{c}{m}{)}}$$的影响,现随机从五年级学生中抽取了$${{6}{0}}$$名学生,得到如下数据:



常喝牛奶

不常喝牛奶

总计

$${{1}{6}{0}{{c}{m}}}$$ 及其以上

$${{2}{2}}$$

$${{1}{0}}$$

$${{3}{2}}$$

$${{1}{6}{0}{{c}{m}}}$$ 以下

$${{8}}$$

$${{2}{0}}$$

$${{2}{8}}$$

总计

$${{3}{0}}$$

$${{3}{0}}$$

$${{6}{0}}$$

附:$$K^{2}=\frac{n ( a d-b c )^{2}} {( a+b ) ( c+d ) ( a+c ) ( b+d )}$$
$$P ( K^{2} \geqslant k_{0} )$$ $$0. 0 5 0$$ $$0. 0 2 5$$ $$0. 0 1 0$$ $$0. 0 0 5$$ $$\ 0. 0 0 1$$
$${{k}_{0}}$$ $$3. 8 4 1$$ $$5. 0 2 4$$ $$6. 6 3 5$$ $$7. 8 7 9$$ $$1 0. 8 2 8$$

根据公式计算得$${{K}^{2}{≈}{{9}{.}{6}{4}}}$$,则下列说法正确的是(

D

A.没有充足的理由认为喝牛奶与身高有关

B.有$${{0}{.}{5}{%}}$$的把握认为喝牛奶与身高有关

C.有$$9 9. 9 7_{0}$$的把握认为喝牛奶与身高有关

D.有$$9 9. 5 \%$$的把握认为喝牛奶与身高有关

10、['方差与标准差', '众数、中位数和平均数', '独立性检验及其应用', '频数与频率']

正确率60.0%$${{1}{0}}$$名学生在一次数学考试中的成绩分别为$$x_{1}, ~ ~ x_{2}, ~ ~ \dots, ~ ~ x_{1 0}$$,要研究这$${{1}{0}}$$名学生成绩的平均波动情况,则最能说明问题的是$${{(}{)}}$$

D

A.频率

B.平均数

C.独立性检验

D.方差

1. 根据题目给出的$$2 \times 2$$列联表,计算卡方统计量:

$$\chi^2 = \frac{42 \times [m(20+m) - (12-m)(10-m)]^2}{12 \times 30 \times 10 \times 32}$$

化简后得到:

$$\chi^2 = \frac{42 \times (32m - 120)^2}{115200}$$

要求在犯错误的概率不超过$$0.01$$时认为$$X$$和$$Y$$有关联,即$$\chi^2 > 6.635$$。

代入选项验证,当$$m=8$$时,$$\chi^2 \approx 7.35 > 6.635$$,故选$$C$$。

2. 题目要求检验晕车与性别的关系,属于两个分类变量的独立性检验,故选$$B$$。

3. 设男生人数为$$n$$,列联表如下:

$$\begin{array}{|c|c|c|c|} \hline & 喜欢抖音 & 不喜欢抖音 & 总计 \\ \hline 男生 & \frac{4}{5}n & \frac{1}{5}n & n \\ \hline 女生 & \frac{3}{5}n & \frac{2}{5}n & n \\ \hline 总计 & \frac{7}{5}n & \frac{3}{5}n & 2n \\ \hline \end{array}$$

计算卡方统计量:

$$\chi^2 = \frac{2n \times (\frac{8}{5}n - \frac{3}{5}n)^2}{\frac{7}{5}n \times \frac{3}{5}n \times n \times n} = \frac{2n}{21}$$

要求$$\chi^2 > 3.841$$,解得$$n > 40.33$$,最小整数为$$45$$,故选$$B$$。

4. 临界值$$k=7.879$$对应$$P(\chi^2 \geq 7.879)=0.005$$,故选$$D$$。

5. 分析各命题:

①错误,$$99\%$$的把握是统计结论,不能直接用于个体概率;

②正确,回归直线必过样本中心点;

③正确,残差平方和越小拟合效果越好;

④正确,回归系数解释正确。

共3个真命题,故选$$C$$。

6. 选项$$B$$错误,残差平方和越小模型拟合效果越好,故选$$B$$。

7. 计算卡方统计量:

$$\chi^2 = \frac{90 \times (10 \times 38 - 35 \times 7)^2}{45 \times 45 \times 17 \times 73} \approx 3.11$$

查表得$$P(\chi^2 \geq 2.072) \approx 0.15$$,$$P(\chi^2 \geq 3.841) \approx 0.05$$,故犯错误概率介于$$0.05$$和$$0.15$$之间,最接近$$A$$选项。

8. 分析各命题:

①正确;

②错误,应为减少5个单位;

③正确;

④正确。

共1个错误,故选$$B$$。

9. 计算得$$K^2 \approx 9.64$$,查表得$$P(\chi^2 \geq 7.879)=0.005$$,$$P(\chi^2 \geq 10.828)=0.001$$,故有$$99.5\%$$的把握,选$$D$$。

10. 研究成绩波动应使用方差,故选$$D$$。

题目来源于各渠道收集,若侵权请联系下方邮箱
高中知识点
其他知识点