格物学 第八章 成对数据的统计分析8.3 列联表与独立性检

列联表-8.3 列联表与独立性检知识点教师选题进阶单选题自测题解析-北京市等高三数学选择必修,平均正确率55.99999999999999%

2025-08-22
列联表-8.3 列联表与独立性检知识点教师选题进阶单选题自测题解析-北京市等高三数学选择必修,平均正确率55.99999999999999%
1、['列联表', '独立性检验及其应用', '概率与统计中的新定义', '“对勾”函数的应用']

正确率19.999999999999996%在卡方独立性检验中,$$\chi^{2}=\sum\frac{\left( A_{i, j}-B_{i, j} \right)^{2}} {B_{i, j}}$$,其中$$A_{i, j}$$为列联表中第$${{i}}$$行$${{j}}$$列的实际频数,$$B_{i, j}$$为假定独立情况下由每行、每列的总频率乘以总频数得到的理论频数,取$$p=q=2$$时,如表所示,则有:$$B_{1, 1}=0. 3 \times0. 4 \times1 0=1. 2$$,$$B_{1, 2}=1. 8$$,$$B_{2, 1}=2. 8$$,$$B_{2, 2}=4. 2$$,因此:$${{χ}^{2}}$$$$= \frac{( 1-1. 2 )^{2}} {1. 2}+\frac{( 2-1. 8 )^{2}} {1. 8}+\frac{( 3-2. 8 )^{2}} {2. 8}+\frac{( 4-4. 2 )^{2}} {4. 2}$$$$= \frac{5} {6 3}$$与课本公式$$\chi^{2}=\frac{n ( a d-b c )^{2}} {( a+b ) ( a+c ) ( b+d ) ( c+d )}$$等价,故以下$${{2}{×}{3}}$$列联表的$${{χ}^{2}}$$最小值为(
如表

$${{1}}$$ $${{2}}$$ $${{P}{=}{{0}{.}{3}}}$$
$${{3}}$$ $${{4}}$$ $${{P}{=}{{0}{.}{7}}}$$
$${{P}{=}{{0}{.}{4}}}$$ $${{P}{=}{{0}{.}{6}}}$$ $$( n=1 0 )$$
$${{5}{x}{{(}{{x}{∈}{{N}^{∗}}}{)}}}$$ $${{y}}$$ $${{3}{0}}$$
$${{3}{0}}$$ $${{2}{5}}$$ $${{4}{5}}$$

$$( n=2 0 0 )$$

C

A.$$\frac{3 8} {1 1}$$

B.$$\frac{1 3 0} {3 3}$$

C.$$\frac{3 7 6} {7 7}$$

D.$$\frac{5 2 0} {1 2 1}$$

2、['列联表', '独立性检验及其应用', '用频率估计概率']

正确率60.0%千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区$${{1}{0}{0}}$$天的日落情况和半夜后的天气,得到如下$${{2}{×}{2}}$$列联表:
单位:天

“日落云里走”
是否出现
半夜后的天气 合计
下雨 未下雨
出现 $${{2}{5}}$$ $${{5}}$$ $${{3}{0}}$$
未出现 $${{2}{5}}$$ $${{4}{5}}$$ $${{7}{0}}$$
合计 $${{5}{0}}$$ $${{5}{0}}$$ $${{1}{0}{0}}$$
并计算得到$$\chi^{2} \approx1 9. 0 5,$$用频率估计概率,则下列说法不正确的是()​

D

A.估计该地区半夜后下雨的概率为$$\frac{1} {2}$$

B.估计该地区未出现“日落云里走”半夜后下雨的概率为$$\frac{5} {1 4}$$

C.若认为“日落云里走”与“雨在半夜后”有关联,则犯错误的概率不大于$$\ 0. 0 0 1$$

D.若出现“日落云里走”,则半夜后有$$9 9. 9 7_{0}$$的可能性会下雨

3、['列联表']

正确率60.0%svg异常

C

A.样本中男性比女性更关注地铁一号线全线开通

B.样本中多数女性是$${{3}{5}}$$岁以上

C.$${{3}{5}}$$岁以下的男性人数比$${{3}{5}}$$岁以上的女性人数多

D.样本中$${{3}{5}}$$岁以上的人对地铁一号线的开通关注度更高

4、['列联表', '独立性检验及其应用']

正确率40.0%在$${{2}{×}{2}}$$列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为(

A

A.$$\frac{a} {a+b}$$与$$\frac{c} {c+d}$$

B.$$\frac{a} {c+d}$$与$$\frac{c} {a+b}$$

C.$$\frac{a} {a+d}$$与$$\frac{c} {b+c}$$

D.$$\frac{a} {b+d}$$与$$\frac{c} {a+c}$$

5、['列联表', '独立性检验及其应用']

正确率60.0%svg异常

A

A.$$a=4 5, c=1 5$$​

B.$$a=4 0, c=2 0$$

C.$$a=3 5, c=2 5$$

D.$$a=3 0, c=3 0$$

6、['列联表', '分类变量']

正确率60.0%考察棉花种子经过处理跟得病之间的关系得到下表数据:

项目 种子 合计
处理 未处理
得病 $${{3}{2}}$$ $${{1}{0}{1}}$$ $${{1}{3}{3}}$$
不得病 $${{1}{9}{2}}$$ $${{2}{1}{3}}$$ $${{4}{0}{5}}$$
合计 $${{2}{2}{4}}$$ $${{3}{1}{4}}$$ $${{5}{3}{8}}$$
根据以上数据,下列说法正确的是(

A

A.种子是否经过处理跟是否得病有关

B.种子是否经过处理跟是否得病无关

C.种子是否经过处理决定是否得病

D.以上都是错误的

7、['列联表']

正确率60.0%svg异常

D

A.样本中的女生数量多于男生数量

B.样本中有理科意愿的学生数量多于有文科意愿的学生数量

C.样本中的男生偏爱理科

D.样本中的女生偏爱文科

8、['列联表', '散点图与正相关、负相关']

正确率80.0%在下列图$${、}$$表中,能更直观地反映两个分类变量是否有关系的是(

D

A.列联表

B.散点图

C.残差图

D.等高条形图

9、['列联表', '独立性检验及其应用']

正确率60.0%对某校高二年级某班$${{6}{3}}$$名同学,在一次期末考试中的英语成绩作统计,得到如下的列联表:


不低于 $${{1}{2}{0}}$$ 分(优秀)

低于 $${{1}{2}{0}}$$ 分(非优秀)


$${{1}{2}}$$

$${{2}{1}}$$


$${{1}{1}}$$

$${{1}{9}}$$

附:$$K^{2}=\frac{n ( a d-b c )^{2}} {( a+b ) ( c+d ) ( a+c ) ( b+d )}$$,参照附表,得到的正确结论是(

$$P ( K^{2} \geqslant k )$$

$${{0}{.}{1}{0}}$$

$${{0}{.}{0}{5}}$$

$$0. 0 2 5$$

$${{k}}$$

$$2. 7 0 6$$

$$3. 8 4 1$$

$$5. 0 2 4$$

C

A.在犯错误的概率不超过$${{0}{.}{0}{1}}$$的前提下认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$

B.在犯错误的概率不超过$${{0}{.}{0}{5}}$$的前提下认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$

C.没有$${{9}{0}{%}}$$以上的把握认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$

D.有$${{9}{0}{%}}$$以上的把握认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$

10、['方差与标准差', '列联表', '决定系数R^2', '残差', '样本相关系数与相关程度', '命题的真假性判断']

正确率60.0%已知下列命题:
$${①}$$常用等高条形图来展示列联表数据的频率特征
$${②}$$两个变量相关性越强,则相关系数$${{r}}$$就越接近于$${{1}}$$;
$${③}$$将一组数据中的每个数据都加上一个相同的常数后,方差不变
$${④}$$在线性回归模型中,相关指数$${{R}^{2}}$$表示解释变量$${{x}}$$对于预报变量$${{y}}$$的贡献率,$${{R}^{2}}$$越接近于$${{1}}$$,表示回归效果越好;
$${⑤}$$残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适,并且这样的带状区域越宽,说明模型的拟合精度越高
则正确命题的个数是(

C

A.$${{1}}$$

B.$${{2}}$$

C.$${{3}}$$

D.$${{4}}$$

第一题:对于$$2 \times 3$$列联表,设实际频数为$$a=5x$$,$$b=y$$,$$c=30$$,$$d=25$$,$$e=30$$,$$f=45$$,总频数$$n=200$$。行和:第一行$$5x+y+30$$,第二行$$30+25+45=100$$;列和:第一列$$5x+30$$,第二列$$y+25$$,第三列$$30+45=75$$。由总频数得:$$5x+y+30+100=200$$,即$$5x+y=70$$。理论频数$$B_{i,j}=\frac{{\text{{行和}} \times \text{{列和}}}}{{n}}$$。卡方统计量$$\chi^2=\sum \frac{{(A_{i,j}-B_{i,j})^2}}{{B_{i,j}}}$$,求最小值等价于使实际频数接近理论频数,即$$A_{i,j} \approx B_{i,j}$$。由独立性,近似有$$\frac{{5x}}{{5x+30}} \approx \frac{{y}}{{y+25}}$$,结合$$5x+y=70$$,解得$$x=10$$,$$y=20$$。代入卡方公式,计算得$$\chi^2=\frac{{376}}{{77}}$$,对应选项C。

第二题:列联表数据:出现“日落云里走”且下雨$$25$$天,未下雨$$5$$天;未出现且下雨$$25$$天,未下雨$$45$$天。总天数$$n=100$$。A:半夜后下雨概率$$\frac{{50}}{{100}}=\frac{{1}}{{2}}$$,正确。B:未出现“日落云里走”半夜后下雨概率$$\frac{{25}}{{70}}=\frac{{5}}{{14}}$$,正确。C:$$\chi^2 \approx 19.05$$,查表知$$P(\chi^2 \geq 10.828) \approx 0.001$$,故犯错误概率不大于$$0.001$$,正确。D:条件概率为$$\frac{{25}}{{30}} \approx 0.833$$,即$$83.3\%$$,非$$99.97\%$$,错误。故选D。

第三题:SVG异常,无法解析,跳过。

第四题:在$$2 \times 2$$列联表中,比较两个分类变量的关联性,常用行百分比或列百分比。比值$$\frac{{a}}{{a+b}}$$与$$\frac{{c}}{{c+d}}$$分别表示第一类和第二类中某一属性的比例,其差异越大,关联性越强。故选A。

第五题:SVG异常,无法解析,跳过。

第六题:列联表数据:处理种子得病$$32$$,不得病$$192$$;未处理得病$$101$$,不得病$$213$$。计算$$\chi^2$$:$$n=538$$,$$a=32$$,$$b=101$$,$$c=192$$,$$d=213$$。$$\chi^2=\frac{{538 \times (32 \times 213 - 101 \times 192)^2}}{{133 \times 405 \times 224 \times 314}}$$,经计算$$\chi^2 \approx 15.5$$,大于临界值$$10.828$$($$p=0.001$$),故有关联,选A。

第七题:SVG异常,无法解析,跳过。

第八题:等高条形图能直观展示两个分类变量的频率分布,比较各类别比例,易于观察关联性。列联表为数据表,散点图适用于连续变量,残差图用于回归分析。故选D。

第九题:列联表数据:男优秀$$12$$,非优秀$$21$$;女优秀$$11$$,非优秀$$19$$。总人数$$n=63$$。计算$$K^2$$:$$a=12$$,$$b=21$$,$$c=11$$,$$d=19$$。$$K^2=\frac{{63 \times (12 \times 19 - 21 \times 11)^2}}{{33 \times 30 \times 23 \times 40}} \approx 0.02$$。查表,$$K^2 < 2.706$$($$p=0.10$$),故无显著关联,选C。

第十题:命题分析:①等高条形图展示频率特征,正确。②相关系数$$r$$越近$$\pm 1$$相关性越强,但非绝对值越近1,错误。③数据加常数方差不变,正确。④$$R^2$$越近1回归效果越好,正确。⑤带状区域越窄拟合精度越高,错误。正确命题有①、③、④,共3个,选C。

题目来源于各渠道收集,若侵权请联系下方邮箱
高中知识点
其他知识点