正确率19.999999999999996%在卡方独立性检验中,$$\chi^{2}=\sum\frac{\left( A_{i, j}-B_{i, j} \right)^{2}} {B_{i, j}}$$,其中$$A_{i, j}$$为列联表中第$${{i}}$$行$${{j}}$$列的实际频数,$$B_{i, j}$$为假定独立情况下由每行、每列的总频率乘以总频数得到的理论频数,取$$p=q=2$$时,如表所示,则有:$$B_{1, 1}=0. 3 \times0. 4 \times1 0=1. 2$$,$$B_{1, 2}=1. 8$$,$$B_{2, 1}=2. 8$$,$$B_{2, 2}=4. 2$$,因此:$${{χ}^{2}}$$$$= \frac{( 1-1. 2 )^{2}} {1. 2}+\frac{( 2-1. 8 )^{2}} {1. 8}+\frac{( 3-2. 8 )^{2}} {2. 8}+\frac{( 4-4. 2 )^{2}} {4. 2}$$$$= \frac{5} {6 3}$$与课本公式$$\chi^{2}=\frac{n ( a d-b c )^{2}} {( a+b ) ( a+c ) ( b+d ) ( c+d )}$$等价,故以下$${{2}{×}{3}}$$列联表的$${{χ}^{2}}$$最小值为()
如表
$${{1}}$$ | $${{2}}$$ | $${{P}{=}{{0}{.}{3}}}$$ |
$${{3}}$$ | $${{4}}$$ | $${{P}{=}{{0}{.}{7}}}$$ |
$${{P}{=}{{0}{.}{4}}}$$ | $${{P}{=}{{0}{.}{6}}}$$ | $$( n=1 0 )$$ |
$${{5}{x}{{(}{{x}{∈}{{N}^{∗}}}{)}}}$$ | $${{y}}$$ | $${{3}{0}}$$ |
$${{3}{0}}$$ | $${{2}{5}}$$ | $${{4}{5}}$$ |
$$( n=2 0 0 )$$
C
A.$$\frac{3 8} {1 1}$$
B.$$\frac{1 3 0} {3 3}$$
C.$$\frac{3 7 6} {7 7}$$
D.$$\frac{5 2 0} {1 2 1}$$
2、['列联表', '独立性检验及其应用', '用频率估计概率']正确率60.0%千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区$${{1}{0}{0}}$$天的日落情况和半夜后的天气,得到如下$${{2}{×}{2}}$$列联表:
单位:天
“日落云里走” 是否出现 | 半夜后的天气 | 合计 | |
下雨 | 未下雨 | ||
出现 | $${{2}{5}}$$ | $${{5}}$$ | $${{3}{0}}$$ |
未出现 | $${{2}{5}}$$ | $${{4}{5}}$$ | $${{7}{0}}$$ |
合计 | $${{5}{0}}$$ | $${{5}{0}}$$ | $${{1}{0}{0}}$$ |
D
A.估计该地区半夜后下雨的概率为$$\frac{1} {2}$$
B.估计该地区未出现“日落云里走”半夜后下雨的概率为$$\frac{5} {1 4}$$
C.若认为“日落云里走”与“雨在半夜后”有关联,则犯错误的概率不大于$$\ 0. 0 0 1$$
D.若出现“日落云里走”,则半夜后有$$9 9. 9 7_{0}$$的可能性会下雨
3、['列联表']正确率60.0%svg异常
C
A.样本中男性比女性更关注地铁一号线全线开通
B.样本中多数女性是$${{3}{5}}$$岁以上
C.$${{3}{5}}$$岁以下的男性人数比$${{3}{5}}$$岁以上的女性人数多
D.样本中$${{3}{5}}$$岁以上的人对地铁一号线的开通关注度更高
4、['列联表', '独立性检验及其应用']正确率40.0%在$${{2}{×}{2}}$$列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为()
A
A.$$\frac{a} {a+b}$$与$$\frac{c} {c+d}$$
B.$$\frac{a} {c+d}$$与$$\frac{c} {a+b}$$
C.$$\frac{a} {a+d}$$与$$\frac{c} {b+c}$$
D.$$\frac{a} {b+d}$$与$$\frac{c} {a+c}$$
5、['列联表', '独立性检验及其应用']正确率60.0%svg异常
A
A.$$a=4 5, c=1 5$$
B.$$a=4 0, c=2 0$$
C.$$a=3 5, c=2 5$$
D.$$a=3 0, c=3 0$$
6、['列联表', '分类变量']正确率60.0%考察棉花种子经过处理跟得病之间的关系得到下表数据:
项目 | 种子 | 合计 | |
处理 | 未处理 | ||
得病 | $${{3}{2}}$$ | $${{1}{0}{1}}$$ | $${{1}{3}{3}}$$ |
不得病 | $${{1}{9}{2}}$$ | $${{2}{1}{3}}$$ | $${{4}{0}{5}}$$ |
合计 | $${{2}{2}{4}}$$ | $${{3}{1}{4}}$$ | $${{5}{3}{8}}$$ |
A
A.种子是否经过处理跟是否得病有关
B.种子是否经过处理跟是否得病无关
C.种子是否经过处理决定是否得病
D.以上都是错误的
7、['列联表']正确率60.0%svg异常
D
A.样本中的女生数量多于男生数量
B.样本中有理科意愿的学生数量多于有文科意愿的学生数量
C.样本中的男生偏爱理科
D.样本中的女生偏爱文科
8、['列联表', '散点图与正相关、负相关']正确率80.0%在下列图$${、}$$表中,能更直观地反映两个分类变量是否有关系的是()
D
A.列联表
B.散点图
C.残差图
D.等高条形图
9、['列联表', '独立性检验及其应用']正确率60.0%对某校高二年级某班$${{6}{3}}$$名同学,在一次期末考试中的英语成绩作统计,得到如下的列联表:
| 不低于 $${{1}{2}{0}}$$ 分(优秀) | 低于 $${{1}{2}{0}}$$ 分(非优秀) |
男 | $${{1}{2}}$$ | $${{2}{1}}$$ |
女 | $${{1}{1}}$$ | $${{1}{9}}$$ |
附:$$K^{2}=\frac{n ( a d-b c )^{2}} {( a+b ) ( c+d ) ( a+c ) ( b+d )}$$,参照附表,得到的正确结论是()
$$P ( K^{2} \geqslant k )$$ | $${{0}{.}{1}{0}}$$ | $${{0}{.}{0}{5}}$$ | $$0. 0 2 5$$ |
$${{k}}$$ | $$2. 7 0 6$$ | $$3. 8 4 1$$ | $$5. 0 2 4$$ |
C
A.在犯错误的概率不超过$${{0}{.}{0}{1}}$$的前提下认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$
B.在犯错误的概率不超过$${{0}{.}{0}{5}}$$的前提下认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$
C.没有$${{9}{0}{%}}$$以上的把握认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$
D.有$${{9}{0}{%}}$$以上的把握认为$${{“}}$$该班学生英语成绩优秀与性别有关$${{”}}$$
10、['方差与标准差', '列联表', '决定系数R^2', '残差', '样本相关系数与相关程度', '命题的真假性判断']正确率60.0%已知下列命题:
$${①}$$常用等高条形图来展示列联表数据的频率特征
$${②}$$两个变量相关性越强,则相关系数$${{r}}$$就越接近于$${{1}}$$;
$${③}$$将一组数据中的每个数据都加上一个相同的常数后,方差不变
$${④}$$在线性回归模型中,相关指数$${{R}^{2}}$$表示解释变量$${{x}}$$对于预报变量$${{y}}$$的贡献率,$${{R}^{2}}$$越接近于$${{1}}$$,表示回归效果越好;
$${⑤}$$残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适,并且这样的带状区域越宽,说明模型的拟合精度越高
则正确命题的个数是()
C
A.$${{1}}$$
B.$${{2}}$$
C.$${{3}}$$
D.$${{4}}$$
第一题:对于$$2 \times 3$$列联表,设实际频数为$$a=5x$$,$$b=y$$,$$c=30$$,$$d=25$$,$$e=30$$,$$f=45$$,总频数$$n=200$$。行和:第一行$$5x+y+30$$,第二行$$30+25+45=100$$;列和:第一列$$5x+30$$,第二列$$y+25$$,第三列$$30+45=75$$。由总频数得:$$5x+y+30+100=200$$,即$$5x+y=70$$。理论频数$$B_{i,j}=\frac{{\text{{行和}} \times \text{{列和}}}}{{n}}$$。卡方统计量$$\chi^2=\sum \frac{{(A_{i,j}-B_{i,j})^2}}{{B_{i,j}}}$$,求最小值等价于使实际频数接近理论频数,即$$A_{i,j} \approx B_{i,j}$$。由独立性,近似有$$\frac{{5x}}{{5x+30}} \approx \frac{{y}}{{y+25}}$$,结合$$5x+y=70$$,解得$$x=10$$,$$y=20$$。代入卡方公式,计算得$$\chi^2=\frac{{376}}{{77}}$$,对应选项C。
第二题:列联表数据:出现“日落云里走”且下雨$$25$$天,未下雨$$5$$天;未出现且下雨$$25$$天,未下雨$$45$$天。总天数$$n=100$$。A:半夜后下雨概率$$\frac{{50}}{{100}}=\frac{{1}}{{2}}$$,正确。B:未出现“日落云里走”半夜后下雨概率$$\frac{{25}}{{70}}=\frac{{5}}{{14}}$$,正确。C:$$\chi^2 \approx 19.05$$,查表知$$P(\chi^2 \geq 10.828) \approx 0.001$$,故犯错误概率不大于$$0.001$$,正确。D:条件概率为$$\frac{{25}}{{30}} \approx 0.833$$,即$$83.3\%$$,非$$99.97\%$$,错误。故选D。
第三题:SVG异常,无法解析,跳过。
第四题:在$$2 \times 2$$列联表中,比较两个分类变量的关联性,常用行百分比或列百分比。比值$$\frac{{a}}{{a+b}}$$与$$\frac{{c}}{{c+d}}$$分别表示第一类和第二类中某一属性的比例,其差异越大,关联性越强。故选A。
第五题:SVG异常,无法解析,跳过。
第六题:列联表数据:处理种子得病$$32$$,不得病$$192$$;未处理得病$$101$$,不得病$$213$$。计算$$\chi^2$$:$$n=538$$,$$a=32$$,$$b=101$$,$$c=192$$,$$d=213$$。$$\chi^2=\frac{{538 \times (32 \times 213 - 101 \times 192)^2}}{{133 \times 405 \times 224 \times 314}}$$,经计算$$\chi^2 \approx 15.5$$,大于临界值$$10.828$$($$p=0.001$$),故有关联,选A。
第七题:SVG异常,无法解析,跳过。
第八题:等高条形图能直观展示两个分类变量的频率分布,比较各类别比例,易于观察关联性。列联表为数据表,散点图适用于连续变量,残差图用于回归分析。故选D。
第九题:列联表数据:男优秀$$12$$,非优秀$$21$$;女优秀$$11$$,非优秀$$19$$。总人数$$n=63$$。计算$$K^2$$:$$a=12$$,$$b=21$$,$$c=11$$,$$d=19$$。$$K^2=\frac{{63 \times (12 \times 19 - 21 \times 11)^2}}{{33 \times 30 \times 23 \times 40}} \approx 0.02$$。查表,$$K^2 < 2.706$$($$p=0.10$$),故无显著关联,选C。
第十题:命题分析:①等高条形图展示频率特征,正确。②相关系数$$r$$越近$$\pm 1$$相关性越强,但非绝对值越近1,错误。③数据加常数方差不变,正确。④$$R^2$$越近1回归效果越好,正确。⑤带状区域越窄拟合精度越高,错误。正确命题有①、③、④,共3个,选C。