格物学 第八章 成对数据的统计分析8.2 一元线性回归模型及其应用

残差-8.2 一元线性回归模型及其应用知识点教师选题进阶单选题自测题答案-广西壮族自治区等高三数学选择必修,平均正确率54.0%

2025-06-24
残差-8.2 一元线性回归模型及其应用知识点教师选题进阶单选题自测题答案-广西壮族自治区等高三数学选择必修,平均正确率54.0%
1、['残差', '一元线性回归模型']

正确率60.0%根据一组样本数据$$( x_{1}, ~ y_{1} ), ~ ( x_{2}, ~ y_{2} ), ~ \dots, ~ ( x_{n}, ~ y_{n} ),$$求得经验回归方程为$$\hat{y}=1. 2 x+0. 4,$$且$$\overline{{x}}=3$$.现发现这组样本数据中有两个样本点$$( 1. 2, ~ 0. 5 )$$和$$( 4. 8, ~ 7. 5 )$$误差较大,去除后重新求得的经验回归直线的斜率为$${{1}{.}{1}{,}}$$则(

C

A.去除两个误差较大的样本点后$${,{y}}$$的估计值增加速度变快

B.去除两个误差较大的样本点后,重新求得的经验回归方程对应的直线一定过点$$( 3, \ 5 )$$

C.去除两个误差较大的样本点后,重新求得的经验回归方程为$$\hat{y}=1. 1 x+0. 7$$

D.去除两个误差较大的样本点后,相应于样本点$$( 2, ~ 2. 7 )$$的残差为$${{0}{.}{1}}$$

2、['线性回归模型的最小二乘法', '残差', '散点图与正相关、负相关']

正确率60.0%为了表示散点图中$${{n}}$$个点与某一条直线在整体上的接近程度,我们常用下面四个量中的(

C

A.$$\sum_{i=1}^{n} ( y_{i}-\hat{y}_{i} )$$

B.$$\sum_{i=1}^{n} ( \hat{y}_{i}-y_{i} )$$

C.$$\sum_{i=1}^{n} \left( \begin{array} {c} {y_{i}} \\ \end{array} \right) \sum_{i=1}^{2}$$

D.$$\sum_{i=1}^{n} \left( \hat{y}_{i}-y_{i} \right)^{2}$$

3、['残差', '散点图与正相关、负相关']

正确率60.0%$$a, ~ b, ~ c, ~ d$$四位同学各自对甲$${、}$$乙两变量做回归分析,分别得到散点图与残差平方和$$\sum_{i=1}^{n} ( y_{i}-\hat{y}_{i} )^{2}$$如下表:

$${{a}}$$ $${{b}}$$ $${{c}}$$ $${{d}}$$
散点图
残差平方和 $${{1}{1}{5}}$$ $${{1}{0}{6}}$$ $${{1}{2}{4}}$$ $${{1}{0}{3}}$$
哪位同学的实验结果体现拟合甲$${、}$$乙两变量关系的模型拟合精度高?$${{(}{)}}$$

D

A.$${{a}}$$

B.$${{b}}$$

C.$${{c}}$$

D.$${{d}}$$

4、['直线拟合', '残差', '相关关系', '线性相关与非线性相关', '命题的真假性判断', '一元线性回归模型']

正确率40.0%下列说法错误的是$${{(}{)}}$$

B

A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系

B.线性回归方程对应的直线$$\hat{y}=\hat{b} x+\hat{a},$$至少经过其样本数据点$$( x_{1}, y_{1} ), ~ ( x_{2}, y_{2} ), ~ \dots, ~ ( x_{n}, y_{n} )$$中的一个点

C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高

D.在回归分析中,$${{R}^{2}}$$为$${{0}{.}{9}{8}}$$的模型比$${{R}^{2}}$$为$${{0}{.}{8}{0}}$$的模型拟合的效果好

5、['直线拟合', '残差', '一元线性回归模型']

正确率60.0%某产品的广告费支出$${{x}}$$与销售额$${{y}{(}}$$单位:万元)之间的关系如表,由此得到$${{y}}$$与$${{x}}$$的线性回归方程为$$\hat{y}=6 x+a,$$由此可得:当广告支出$${{5}}$$万元时,随机误差的效应(残差)为$${{(}{)}}$$

$${{x}}$$ $${{2}}$$ $${{4}}$$ $${{5}}$$ $${{6}}$$ $${{8}}$$
$${{y}}$$ $${{3}{0}}$$ $${{4}{0}}$$ $${{6}{0}}$$ $${{5}{0}}$$ $${{7}{0}}$$

C

A.$${{−}{{1}{0}}}$$

B.$${{0}}$$

C.$${{1}{0}}$$

D.$${{2}{0}}$$

6、['残差', '一元线性回归模型']

正确率60.0%已知方程$$y=0. 8 5 x-8 5. 7$$是根据女大学生的身高预报体重的回归方程,其中$${{x}{,}{y}}$$的单位分别是$$\mathit{c m,} \ k g$$,则该方程在样本$$( 1 6 5, 5 7 )$$处的残差是$${{(}{)}}$$

B

A.$$5 4. 5 5$$

B.$${{2}{.}{4}{5}}$$

C.$${{3}{.}{4}{5}}$$

D.$$1 1 1. 5 5$$

7、['列联表', '独立性检验及其应用', '直线拟合', '残差', '命题的真假性判断']

正确率40.0%下列说法正确的有()个
$${①}$$在刻画回归模型的拟合效果时,$${{R}^{2}}$$越大,说明拟合的效果越好.
$${②}$$在回归分析中残差图的纵坐标为残差.
$${③}$$独立性检测中,等高条形图可以粗略地判断两个分类变量是否相关.
$${④}$$在列联表中,$$\frac{a} {a+b}$$与$$\frac{c} {c+d}$$相差越大,两个分类变量之间的关系越强.

D

A.$${{1}}$$

B.$${{2}}$$

C.$${{3}}$$

D.$${{4}}$$

8、['独立性检验及其应用', '残差', '复数的有关概念', '一元线性回归模型']

正确率40.0%在下列命题中,真命题的个数是$${{(}{)}}$$
$${①}$$若$${{K}^{2}}$$的观测值为$$k=6. 6 3 5$$,我们有$${{9}{9}{%}}$$的把握认为吸烟与患肺病有关系,那么在$${{1}{0}{0}}$$个吸烟的人中必有$${{9}{9}}$$人患有肺病;
$${②}$$ 由样本数据得到的回归直线$$\hat{y}=\hat{b} x+\widehat{a}$$ 必过样本点的中心$$( \overline{{x}}, \overline{{y}} )$$
$${③}$$ 残差平方和越小的模型,拟合的效果越好;
$${④}$$ 若复数 $${{z}{=}{m}}$$$${^{2}}$$ $$- 1+( m+1 ) i$$ 为纯虚数,则实数 $${{m}{=}{±}{1}}$$ 。

C

A.$${{0}}$$

B.$${{1}}$$

C.$${{2}}$$

D.$${{3}}$$

9、['残差', '样本相关系数r的计算', '样本相关系数与相关程度', '散点图与正相关、负相关']

正确率60.0%如图所示,$${{5}}$$组数据$$( x, y )$$中去掉$$D ( 3, 1 0 )$$后,下列说法错误的是(

B

A.相关系数$${{r}}$$变大

B.残差平方和变大

C.相关指数$${{R}^{2}}$$变大

D.解释变量$${{x}}$$与预报变量$${{y}}$$的相关性变强

10、['方差与标准差', '独立性检验及其应用', '残差', '样本相关系数与相关程度']

正确率60.0%下列说法正确的是(

B

A.若残差平方和越小,则相关指数$${{R}^{2}}$$越小

B.将一组数据中每一个数据都加上或减去同一常数,方差不变

C.若$${{K}^{2}}$$的观测值越大,则判断两个分类变量有关系的把握程度越小

D.若所有样本点均落在回归直线上,则相关系数$${{r}{=}{1}}$$

1、首先计算原始回归直线的截距。已知$$\overline{x}=3$$,代入回归方程$$\hat{y}=1.2x+0.4$$,得到$$\overline{y}=1.2 \times 3 + 0.4 = 4$$。去除两个异常点后,斜率变为1.1,新的回归直线形式为$$\hat{y}=1.1x + a$$。由于回归直线必过样本均值点$$(3, \overline{y'})$$,需要重新计算$$\overline{y'}$$。原始样本总和为$$n \times 4$$,去除两个点后总和为$$4n - (0.5 + 7.5) = 4n - 8$$,样本数变为$$n-2$$,因此$$\overline{y'} = \frac{4n - 8}{n-2} = 4$$。代入$$(3, 4)$$到新回归直线,得$$4 = 1.1 \times 3 + a$$,解得$$a = 0.7$$,所以新方程为$$\hat{y}=1.1x + 0.7$$。验证选项:

A. 斜率从1.2降到1.1,估计值增加速度变慢,错误。

B. 新直线过$$(3, 4)$$而非$$(3, 5)$$,错误。

C. 计算正确,符合新方程。

D. 对于点$$(2, 2.7)$$,预测值为$$1.1 \times 2 + 0.7 = 2.9$$,残差为$$2.7 - 2.9 = -0.2$$,错误。

答案:$$C$$

2、衡量整体接近程度的量是残差平方和,即选项$$D$$。其他选项:

A和B为残差和,可能正负抵消。

C表达式无意义。

答案:$$D$$

3、拟合精度由残差平方和衡量,越小越好。表中$$d$$的残差平方和最小(103),因此拟合效果最好。

答案:$$D$$

4、错误说法分析:

A. 正确,相关关系定义。

B. 错误,回归直线不一定经过任何样本点。

C. 正确,带状区域越窄精度越高。

D. 正确,$$R^2$$越大拟合越好。

答案:$$B$$

5、先计算回归方程参数。均值$$\overline{x}=5$$,$$\overline{y}=50$$,代入$$\hat{y}=6x+a$$得$$50=6 \times 5 + a$$,解得$$a=20$$。当$$x=5$$时,预测值$$\hat{y}=6 \times 5 + 20 = 50$$,实际值$$y=60$$,残差为$$60 - 50 = 10$$。

答案:$$C$$

6、残差计算:预测值$$\hat{y}=0.85 \times 165 - 85.7 = 54.55$$,残差为$$57 - 54.55 = 2.45$$。

答案:$$B$$

7、判断各命题:

①正确,$$R^2$$越大拟合越好。

②正确,残差图纵坐标为残差。

③正确,等高条形图可直观判断相关性。

④正确,比例差异越大关系越强。

答案:$$D$$

8、真命题判断:

①错误,$$K^2$$只说明关联性,非必然性。

②正确,回归直线必过样本中心。

③正确,残差平方和越小拟合越好。

④错误,纯虚数要求实部为0且虚部非0,解得$$m=1$$。

答案:$$C$$(②③正确)

9、去掉离群点$$D(3,10)$$后:

A. 数据更集中,相关系数$$r$$变大,正确。

B. 残差平方和应减小,错误。

C. 拟合效果改善,$$R^2$$变大,正确。

D. 相关性增强,正确。

答案:$$B$$

10、正确选项分析:

A. 残差平方和越小,$$R^2$$越大,错误。

B. 数据加减常数不改变方差,正确。

C. $$K^2$$越大把握程度越大,错误。

D. 完全线性相关时$$r=1$$,正确。

答案:$$B$$和$$D$$均正确,但题目可能单选,需根据选项设计判断。

注:原题可能存在选项设计问题,建议确认是否为多选题。

题目来源于各渠道收集,若侵权请联系下方邮箱
高中知识点
其他知识点