格物学 第八章 成对数据的统计分析8.2 一元线性回归模型及其应用

线性回归模型的最小二乘法-8.2 一元线性回归模型及其应用知识点专题基础单选题自测题解析-江西省等高三数学选择必修,平均正确率60.0%

2025-06-06
线性回归模型的最小二乘法-8.2 一元线性回归模型及其应用知识点专题基础单选题自测题解析-江西省等高三数学选择必修,平均正确率60.0%
1、['线性回归模型的最小二乘法']

正确率60.0%某同学在研究性学习中,收集到某制药厂今年前$${{5}}$$个月甲胶囊的产量(单位:万盒)的数据如下表所示:

月份 $${{x}}$$ $${{1}}$$ $${{2}}$$ $${{3}}$$ $${{4}}$$ $${{5}}$$
产量 $${{y}}$$ (万盒) $${{5}}$$ $${{5}}$$ $${{6}}$$ $${{6}}$$ $${{8}}$$
通过上面五组数据得到$${{y}}$$关于$${{x}}$$的回归直线方程为$$\hat{y}=0. 7 x+\hat{a}$$,​预测该制药厂今年$${{7}}$$月份甲胶囊的产量为(

D

A.$${{7}{.}{3}}$$万盒

B.$${{7}{.}{8}}$$万盒

C.$${{8}{.}{3}}$$万盒

D.$${{8}{.}{8}}$$万盒

2、['线性回归模型的最小二乘法', '独立性检验及其应用', '样本相关系数与相关程度', '一元线性回归模型']

正确率40.0%下列说法中正确的序号是(
①在经验回归方程$$\hat{y}=0. 8 x-1 2$$中,当变量$${{x}}$$每增加一个单位时,预测值$${{y}{ˆ}}$$平均增加$${{0}{.}{8}}$$个单位;
②利用最小二乘法求经验回归方程,就是使得$$\sum_{i=1}^{n} ( y_{i}-b x_{i}-a )^{2}$$最小的原理;
③已知$${{X}{,}{Y}}$$是两个分类变量,若它们的随机变量$${{χ}^{2}}$$的取值越小,则得到“$${{X}}$$与$${{Y}}$$有关联”犯错误的概率越小;
④在一组样本数据$$( x_{1}, ~ y_{1} ), ~ ( x_{2}, ~ y_{2} ), ~ \dots, ~ ( x_{n}, ~ y_{n} )$$$$( n \in\mathbf{N}^{*}, \, \, n \geqslant2, \, \, x_{1}, \, \, x_{2}, \, \, \, \ldots, \, \, x_{n}$$不全相等)的散点图中,若所有样本点$$( x_{i}, ~ y_{i} ) ( i=1, ~ 2, ~ \dots n )$$都在直线$$\hat{y}=-\frac{1} {2} x+1$$上,则这组样本数据的样本相关系数为$$- \frac{1} {2}$$.

B

A.①③

B.①②

C.②④

D.③④

3、['线性回归模型的最小二乘法']

正确率60.0%根据如下样本数据:

$${{x}}$$ $${{3}}$$ $${{4}}$$ $${{5}}$$ $${{6}}$$ $${{7}}$$ $${{8}}$$
$${{y}}$$ $${{4}{.}{0}}$$ $${{2}{.}{5}}$$ $${{−}{{0}{.}{5}}}$$ $${{0}{.}{5}}$$ $${{−}{{2}{.}{0}}}$$ $${{−}{{3}{.}{0}}}$$
得到了回归方程$$\hat{y}=\hat{b} x+\widehat{a}$$​,则(

A

A.$$\widehat{a} > 0, \widehat{b} < 0$$​​​​

B.$$\widehat{a} > 0, \widehat{b} > 0$$

C.$$\widehat{a} < 0, \widehat{b} < 0$$

D.$$\widehat{a} < 0, \widehat{b} > 0$$

5、['线性回归模型的最小二乘法', '直线拟合', '一元线性回归模型']

正确率60.0%某单位为了落实$${{“}}$$绿水青山就是金山银山$${{”}}$$理念,制定节能减排的目标,先调查了用电量$${{y}{(}}$$单位:度)与气温$${{x}{(}}$$单位:$${^{∘}{C}{)}}$$之间的关系,随机选取了$${{4}}$$天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程:$$\overset{\wedge} {y}=-2 x+\overset{\wedge} {a}$$,则由此估计:当气温为$${{2}^{∘}{C}}$$时,用电量约为(

$${{x}{(}}$$ 单位: $${^{∘}{C}{)}}$$ $${{1}{7}}$$ $${{1}{4}}$$ $${{1}{0}}$$ $${{−}{1}}$$
$${{y}{(}}$$ 单位:度) $${{2}{4}}$$ $${{3}{4}}$$ $${{3}{8}}$$ $${{6}{4}}$$

A

A.$${{5}{6}}$$度

B.$${{6}{2}}$$度

C.$${{6}{4}}$$度

D.$${{6}{8}}$$度

6、['线性回归模型的最小二乘法', '散点图与正相关、负相关', '一元线性回归模型']

正确率60.0%呈线性相关关系的两个变量建立的回归直线方程为$$\hat{y}=\hat{b} x+\hat{a},$$下列说法不正确的是(

C

A.$${{a}{^}}$$可能等于$${{0}}$$

B.$${{a}{^}}$$可能大于$${{0}}$$

C.若$${{a}{>}{0}}$$,则$${{x}{,}{y}}$$正相关

D.直线恒过点$$( \overline{{x}}, \ \overline{{y}} )$$

7、['古典概型的概率计算公式', '线性回归模型的最小二乘法', '样本平均数与总体平均数', '列举法']

正确率40.0%某研究机构在对具有线性相关的两个变量$${{x}{,}{y}}$$进行统计分析时,得到如下数据,由表中数据求得$${{y}}$$关于$${{x}}$$的回归方程为$$y=0. 7 x+a.$$则在这些样本中任取一点,该点落在回归直线下方的概率为

$${{x}}$$ $${{3}}$$ $${{5}}$$ $${{7}}$$ $${{9}}$$
$${{y}}$$ $${{1}}$$ $${{2}}$$ $${{4}}$$ $${{5}}$$
$${{(}{)}}$$

B

A.$$\frac{1} {4}$$

B.$$\frac{1} {2}$$

C.$$\frac{3} {4}$$

D.$${{0}}$$

8、['线性回归模型的最小二乘法', '残差', '样本相关系数与相关程度', '总体和样本']

正确率60.0%下列命题中正确的命题是(

C

A.用样本频率分布估计总体频率分布的过程中,总体容量越大,估计越精确

B.对于两个变量之间的相关系数$${{r}}$$,若相关程度越强,则$${{r}}$$越接近于$${{1}}$$

C.最小二乘法所求得的回归直线方程一定过样本的中心点$$( \bar{x}, \bar{y} )$$

D.在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越宽,说明模型的拟合精度越高,回归方程的预报精度越高

9、['线性回归模型的最小二乘法', '决定系数R^2', '残差', '样本相关系数r的计算', '样本相关系数与相关程度']

正确率60.0%有下列说法:
$${①}$$若某商品的销售量$${{y}{(}}$$件)关于销售价格$${{x}{(}}$$元$${{/}}$$件)的线性回归方程为$$\hat{y}=-5 x+3 5 0$$,当销售价格为$${{1}{0}}$$元时,销售量一定为$${{3}{0}{0}}$$件;
$${②}$$线性回归直线$$\hat{y}=\hat{b} x+\hat{a}$$一定过样本点中心$$( \bar{x}, \bar{y} )$$;
$${③}$$若两个随机变量的线性相关性越强,则相关系数$${{r}}$$的值越接近于$${{1}}$$;
$${④}$$在残差图中,残差点比较均匀落在水平的带状区域中即可说明选用的模型比较合适,与带状区域的宽度无关;
$${⑤}$$在线性回归模型中,相关指数$${{R}^{2}}$$表示解释变量对于预报变量变化的贡献率,$${{R}^{2}}$$越接近于$${{1}}$$,表示回归的效果越好.
其中正确的结论的个数是(

B

A.$${{1}}$$

B.$${{2}}$$

C.$${{3}}$$

D.$${{4}}$$

1. 首先计算回归直线方程中的截距项 $$\hat{a}$$。根据题目给出的数据,计算平均值:

$$\bar{x} = \frac{1+2+3+4+5}{5} = 3$$
$$\bar{y} = \frac{5+5+6+6+8}{5} = 6$$

将 $$(\bar{x}, \bar{y})$$ 代入回归方程 $$\hat{y} = 0.7x + \hat{a}$$,得到:

$$6 = 0.7 \times 3 + \hat{a} \Rightarrow \hat{a} = 6 - 2.1 = 3.9$$

因此回归方程为 $$\hat{y} = 0.7x + 3.9$$。预测7月份的产量:

$$\hat{y} = 0.7 \times 7 + 3.9 = 4.9 + 3.9 = 8.8$$

答案为 D

2. 逐项分析:

① 正确,回归系数0.8表示x每增加1单位,$$\hat{y}$$平均增加0.8单位。
② 正确,最小二乘法目标是最小化残差平方和。
③ 错误,$$\chi^2$$越小,犯错误的概率越大。
④ 错误,样本相关系数应为1或-1(完全线性相关),而不是斜率。

正确的序号是①②,答案为 B

3. 观察样本数据趋势:x增加时y总体减小,故斜率 $$\hat{b} < 0$$;当x较小时y为正,说明截距 $$\hat{a} > 0$$。答案为 A

5. 计算平均值:

$$\bar{x} = \frac{17+14+10-1}{4} = 10$$
$$\bar{y} = \frac{24+34+38+64}{4} = 40$$

将 $$(\bar{x}, \bar{y})$$ 代入回归方程 $$\hat{y} = -2x + \hat{a}$$,得:

$$40 = -2 \times 10 + \hat{a} \Rightarrow \hat{a} = 60$$

回归方程为 $$\hat{y} = -2x + 60$$。预测气温为2°C时的用电量:

$$\hat{y} = -2 \times 2 + 60 = 56$$

答案为 A

6. 选项分析:

A、B正确,截距 $$\hat{a}$$ 可为任意实数。
C错误,$$\hat{a}$$的正负与相关性无关,相关性由斜率 $$\hat{b}$$ 决定。
D正确,回归直线必过样本中心点。

不正确的是 C

7. 计算回归方程:

$$\bar{x} = \frac{3+5+7+9}{4} = 6$$
$$\bar{y} = \frac{1+2+4+5}{4} = 3$$

代入回归方程 $$y = 0.7x + a$$,得:

$$3 = 0.7 \times 6 + a \Rightarrow a = -1.2$$

回归方程为 $$y = 0.7x - 1.2$$。计算各点残差:

$$(3,1): 1 - (0.7 \times 3 - 1.2) = -0.1$$(下方)
$$(5,2): 2 - (0.7 \times 5 - 1.2) = -0.3$$(下方)
$$(7,4): 4 - (0.7 \times 7 - 1.2) = 0.3$$(上方)
$$(9,5): 5 - (0.7 \times 9 - 1.2) = -0.1$$(下方)

3个点在下方,概率为 $$\frac{3}{4}$$,答案为 C

8. 选项分析:

A错误,估计精度与样本容量有关,而非总体容量。
B错误,$$r$$接近1或-1表示强相关。
C正确,回归直线必过样本中心点。
D错误,带状区域宽度越窄说明拟合越好。

正确的命题是 C

9. 逐项分析:

① 错误,回归方程给出的是预测值,非确定值。
② 正确,回归直线过样本中心点。
③ 错误,$$r$$接近1或-1表示强相关。
④ 错误,带状区域宽度也影响模型评价。
⑤ 正确,$$R^2$$越接近1说明解释力越强。

正确的结论有②⑤,共2个,答案为 B

题目来源于各渠道收集,若侵权请联系下方邮箱
高中知识点
其他知识点