格物学 第八章 成对数据的统计分析8.1 成对数据的统计相关性

样本相关系数与相关程度-8.1 成对数据的统计相关性知识点月考进阶选择题自测题答案-甘肃省等高三数学选择必修,平均正确率57.99999999999999%

2025-06-23
样本相关系数与相关程度-8.1 成对数据的统计相关性知识点月考进阶选择题自测题答案-甘肃省等高三数学选择必修,平均正确率57.99999999999999%
1、['散点图与正相关、负相关', '样本相关系数与相关程度']

正确率60.0%已知相关变量$${{x}}$$和$${{y}}$$的散点图如图所示,若用$$y=b_{1} \cdot\operatorname{l n} {( k_{1} x )}$$经过变换得到线性回归模型进行拟合,与用$${{y}{=}{k}{{x}_{2}}}$$$${{+}{{b}_{2}}}$$拟合时的相关系数分别为$${{r}_{1}}$$,$${{r}_{2}}$$则$${{r}_{1}}$$,$${{r}_{2}}$$的大小关系为 (
全品教育云平台:http://www.canpoint.cn

C

A.$${{r}_{1}}$$$${{>}{{r}_{2}}}$$

B.$${{r}_{1}}$$$${{=}{{r}_{2}}}$$

C.$${{r}_{1}}$$$${{<}{{r}_{2}}}$$

D.不确定

2、['样本相关系数与相关程度', '一元线性回归模型']

正确率60.0%下列命题中:
$${①}$$线性回归方程$$\hat{y}=\hat{b} x+\hat{a}$$必过点$$( \overline{{x}}, \overline{{y}} )$$;
$${②}$$在回归方程$$y=3-5 x$$中,当变量$${{x}}$$增加一个单位时,$${{y}}$$平均增加$${{5}}$$个单位;
$${③}$$在回归分析中,相关指数$${{R}^{2}}$$为$${{0}{.}{8}{0}}$$的模型比相关指数$${{R}^{2}}$$为$${{0}{.}{9}{8}}$$的模型拟合的效果要好;
$${④}$$在回归直线$$\hat{y}=0. 5 x-8$$中,变量$${{x}{=}{2}}$$时,变量$${{y}}$$的值一定是$${{−}{7}}$$.
其中假命题的个数是$${{(}{)}}$$

C

A.$${{1}}$$

B.$${{2}}$$

C.$${{3}}$$

D.$${{4}}$$

3、['方差与标准差', '样本相关系数r的计算', '样本相关系数与相关程度', '频率分布直方图中的众数、中位数和平均数']

正确率60.0%下列$${{4}}$$种说法:$${①}$$在频率分布直方图中,众数的左边和右边的直方图的面积相等;$${②}$$标准差越小,样本数据的波动也越小;$${③}$$两个随机变量相关性越强,则相关系数越接近$${{1}{;}{④}}$$对分类变量$${{X}}$$和$${{Y}}$$,它们的随机变量$${{K}^{2}}$$的观测值$${{k}}$$来说,$${{k}}$$越小,$${{“}{X}}$$与$${{Y}}$$有关系$${{”}}$$的把握程度越大,其中说法正确的是(

B

A.$${①{②}}$$

B.$${②{③}}$$

C.$${②{④}}$$

D.$${③{④}}$$

4、['样本相关系数r的计算', '样本相关系数与相关程度']

正确率60.0%对于样本相关系数$${{r}{,}}$$下列叙述正确的是(

B

A.$$| r | \leqslant1, ~ | r |$$越接近于$${{1}{,}}$$相关程度越弱$${,{|}{r}{|}}$$越接近于$${{0}{,}}$$相关程度越强

B.$$| r | \leqslant1, ~ | r |$$越接近于$${{1}{,}}$$相关程度越强$${,{|}{r}{|}}$$越接近于$${{0}{,}}$$相关程度越弱

C.$$| r | \in( 0,+\infty), \; | r |$$越大,相关程度越强$${,{|}{r}{|}}$$越小,相关程度越弱

D.$$| r | \in( 0,+\infty), \; | r |$$越大,相关程度越弱$${,{|}{r}{|}}$$越小,相关程度越强

5、['决定系数R^2', '残差', '样本相关系数与相关程度']

正确率60.0%下列关于回归分析的说法中错误的是

C

A.两个模型中残差平方和越小的模型拟合的效果越好

B.残差图中残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适

C.在一组样本数据的散点图中,若所有样本点都落在直线$$y=\frac{1} {2} x+1$$上,则这组样本数据 的样本相关系数是$$\frac{1} {2}$$

D.甲$${、}$$乙两个模型的$${{R}^{2}}$$分别约为$${{0}{.}{9}{8}}$$和$${{0}{.}{8}{0}}$$,则模型甲的拟合效果更好

6、['样本相关系数与相关程度']

正确率60.0%在一组样本数据$$( x_{1}, y_{1} ), \, \, \, ( x_{2}, y_{2} ), \, \, \, \ldots, \, \, \, ( x_{n}, y_{n} ) ( n \geqslant2, x_{1}, x_{2}, \ldots, x_{n} )$$互不相等)的散点图中,若所有样本点$$( x_{i}, y_{i} ) ( i=1, 2, \dots, n )$$都在直线,$$y=-2 x+1 0 0$$上,则这组样本数据的样本相关系数为

A

A.$${{−}{1}}$$

B.$${{0}}$$

C.$$\frac{1} {2}$$

D.$${{1}}$$

7、['分层随机抽样的概念', '离散型随机变量的方差、标准差', '样本相关系数与相关程度', '一元线性回归模型']

正确率40.0%下列说法中正确的是(

A

A.若一组数据$$1, ~ a, ~ 3$$的平均数是$${{2}}$$,则该组数据的方差是$$\begin{array} {l l} {\frac{2} {3}} \\ \end{array}$$

B.线性回归直线不一定过样本中心点$$( \overline{{x}}, \ \overline{{y}} )$$

C.若两个随机变量的线性相关性越强,则相关系数$${{r}}$$的值越接近于$${{1}}$$

D.先把高三年级的$${{2}{0}{0}{0}}$$名学生编号:$${{1}}$$到$${{2}{0}{0}{0}}$$,再从编号为$${{1}}$$到$${{5}{0}}$$的$${{5}{0}}$$名学生中随机抽取$${{1}}$$名学生,其编号为$${{m}}$$,然后抽取编号为的学生,这样的抽样方法是分层抽样

8、['分层随机抽样的概念', '样本相关系数与相关程度']

正确率60.0%以下四个命题中:
$${①}$$从匀速传递的产品生产流水线上,质检员每$${{1}{0}}$$分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;
$${②}$$若数据$$x_{1}, ~ x_{2}, ~ x_{3}, ~ \dots x_{n}$$的方差为$${{1}}$$,则$$2 x_{1}, \ 2 x_{2}, \ 2 x_{3}, \ \ldots, \ 2 x_{n}$$的方差为$${{2}}$$;
$${③}$$两个随机变量的线性相关性越强,相关系数的绝对值越接近于$${{1}}$$;
$${④}$$对分类变量$${{x}}$$与$${{y}}$$的随机变量$${{K}^{2}}$$的观测值$${{k}}$$来说,$${{k}}$$越小,判断$${{“}{x}}$$与$${{y}}$$有关$${{”}}$$的把握越大.
其中真命题的个数为(

A

A.$${{1}}$$

B.$${{2}}$$

C.$${{3}}$$

D.$${{4}}$$

9、['决定系数R^2', '直线拟合', '样本相关系数与相关程度', '命题的真假性判断']

正确率60.0%下列四个命题:
$${①}$$残差平方和越小的模型,拟合的效果越好;
$${②}$$用相关指数$${{R}^{2}}$$来刻画回归效果,$${{R}^{2}}$$越小,说明模型拟合的效果越好;
$${③}$$散点图中所有点都在回归直线附近;
$${④}$$随机误差$${{e}}$$满足$${{E}{{(}{e}{)}}{=}{0}}$$,其方差$${{D}{{(}{e}{)}}}$$的大小可用来衡量预报精确度.
其中正确命题的个数是$${{(}{)}}$$

B

A.$${{1}}$$

B.$${{2}}$$

C.$${{3}}$$

D.$${{4}}$$

10、['独立性检验及其应用', '样本相关系数r的计算', '样本相关系数与相关程度']

正确率60.0%以下结论不正确的是$${{(}{)}}$$

D

A.根据$${{2}{×}{2}}$$列联表中的数据计算得出,而,则至少有$${{9}{9}{%}}$$

B.在线性回归分析中相关系数为$$r, ~ | r |$$越接近于$${{1}}$$,相关程度越大;$${{|}{r}{|}}$$越小,相关程度越小

C.在回归分析中,相关指数$${{R}^{2}}$$越大,说明残差平方和越小,回归效果越好

D.在回归直线$$y=0. 5 x-8 5$$中,变量$${{x}{=}{{2}{0}{0}}}$$时,变量$${{y}}$$的值一定为$${{1}{5}}$$

1. 题目给出两个回归模型:$$y = b_1 \ln(k_1 x)$$ 和 $$y = k_2 x + b_2$$,要求比较它们的相关系数 $$r_1$$ 和 $$r_2$$ 的大小关系。由于散点图未提供,但通常对数模型适用于数据增长缓慢的情况,而线性模型适用于数据呈直线分布的情况。若数据更接近对数趋势,则 $$r_1 > r_2$$;反之则 $$r_1 < r_2$$。但题目未明确数据分布,故无法确定,选 D。

2. 分析各命题: $$①$$ 线性回归方程必过样本中心点 $$(\overline{x}, \overline{y})$$,正确。 $$②$$ 回归方程 $$y = 3 - 5x$$ 中,$$x$$ 增加 1 单位时,$$y$$ 平均减少 5 单位,命题描述错误。 $$③$$ $$R^2$$ 越接近 1 拟合效果越好,故 $$R^2=0.80$$ 的模型比 $$R^2=0.98$$ 的差,命题错误。 $$④$$ 回归直线给出的是预测值,实际值可能偏离,命题错误。 假命题为 $$②③④$$,共 3 个,选 C。

3. 分析各说法: $$①$$ 众数左右面积相等仅在对称分布时成立,一般不一定正确。 $$②$$ 标准差越小,数据波动越小,正确。 $$③$$ 相关系数绝对值越接近 1,相关性越强,但可能是正或负相关,命题表述不严谨。 $$④$$ $$K^2$$ 的观测值 $$k$$ 越小,$$X$$ 与 $$Y$$ 有关系的把握越小,命题错误。 只有 $$②$$ 正确,但选项无单独 $$②$$,最接近的是 A($$①②$$),但 $$①$$ 不完全正确,可能题目有误。

4. 样本相关系数 $$r$$ 的性质: - $$|r| \leq 1$$,越接近 1 相关性越强,越接近 0 相关性越弱。 B 选项描述正确,选 B。

5. 回归分析说法辨析: A. 残差平方和越小拟合效果越好,正确。 B. 残差均匀分布在水平带状区域说明模型合适,正确。 C. 所有样本点在直线上时相关系数为 $$1$$ 或 $$-1$$,而非斜率,错误。 D. $$R^2$$ 越大拟合效果越好,正确。 错误的说法是 C,选 C。

6. 所有样本点在直线 $$y = -2x + 100$$ 上,说明完全线性负相关,相关系数为 $$-1$$,选 A。

7. 说法辨析: A. 数据 $$1, a, 3$$ 的平均数为 2,则 $$a=2$$,方差为 $$\frac{(1-2)^2 + (2-2)^2 + (3-2)^2}{3} = \frac{2}{3}$$,正确。 B. 线性回归直线必过样本中心点 $$(\overline{x}, \overline{y})$$,错误。 C. 相关系数 $$r$$ 的绝对值越接近 1 相关性越强,但可能是负值,表述不严谨。 D. 描述的是系统抽样,非分层抽样,错误。 只有 A 正确,但选项无单独 A,可能题目有误。

8. 命题分析: $$①$$ 是系统抽样,非分层抽样,错误。 $$②$$ 数据乘以 2 后方差为 $$2^2 \times 1 = 4$$,错误。 $$③$$ 相关系数绝对值越接近 1 相关性越强,正确。 $$④$$ $$K^2$$ 的观测值 $$k$$ 越大,判断“$$x$$ 与 $$y$$ 有关”的把握越大,错误。 真命题仅 $$③$$,选 A。

9. 命题辨析: $$①$$ 残差平方和越小拟合效果越好,正确。 $$②$$ $$R^2$$ 越大拟合效果越好,命题错误。 $$③$$ 散点图点不一定全部在回归直线附近,命题错误。 $$④$$ 随机误差的方差衡量预报精度,正确。 正确命题为 $$①④$$,共 2 个,选 B。

10. 结论辨析: A. $$K^2 \geq 6.635$$ 对应 $$P(K^2 \geq 6.635) \approx 0.01$$,说明有 99% 把握认为相关,正确。 B. $$|r|$$ 越接近 1 相关程度越大,正确。 C. $$R^2$$ 越大残差平方和越小,回归效果越好,正确。 D. 回归直线给出预测值,实际值不一定为 15,错误。 不正确的是 D,选 D。
题目来源于各渠道收集,若侵权请联系下方邮箱
高中知识点
其他知识点