正确率80.0%某工厂为研究某种产品的产量$${{x}}$$(单位:吨)与所需某种原材料的质量$${{y}}$$(单位:吨)的相关性,在生产过程中收集了$${{4}}$$组样本数据,如下表所示:
$${{x}}$$ | $${{3}}$$ | $${{4}}$$ | $${{5}}$$ | $${{6}}$$ |
$${{y}}$$ | $${{2}{.}{5}}$$ | $${{3}}$$ | $${{4}}$$ | $${{m}}$$ |
C
A.$${{−}{{0}{.}{5}}}$$
B.$${{3}{.}{1}{5}}$$
C.$${{4}{.}{5}}$$
D.$${{0}{.}{3}{5}}$$
2、['残差', '一元线性回归模型']正确率60.0%根据一组样本数据$${{(}{{x}_{1}}{,}{{y}_{1}}{)}{,}{(}{{x}_{2}}{,}{{y}_{2}}{)}{,}{…}{,}{(}{{x}_{n}}{,}{{y}_{n}}{)}{,}}$$求得经验回归方程为$${{y}{ˆ}{=}{{1}{.}{2}}{x}{+}{{0}{.}{4}}{,}}$$且$$\overline{{x}}=3$$.现发现这组样本数据中有两个样本点$${{(}{{1}{.}{2}}{,}{{0}{.}{5}}{)}}$$和$${{(}{{4}{.}{8}}{,}{{7}{.}{5}}{)}}$$误差较大,去除后重新求得的经验回归直线的斜率为$${{1}{.}{1}{,}}$$则()
C
A.去除两个误差较大的样本点后$${,{y}}$$的估计值增加速度变快
B.去除两个误差较大的样本点后,重新求得的经验回归方程对应的直线一定过点$${{(}{3}{,}{5}{)}}$$
C.去除两个误差较大的样本点后,重新求得的经验回归方程为$${{y}{ˆ}{=}{{1}{.}{1}}{x}{+}{{0}{.}{7}}}$$
D.去除两个误差较大的样本点后,相应于样本点$${{(}{2}{,}{{2}{.}{7}}{)}}$$的残差为$${{0}{.}{1}}$$
3、['残差', '一元线性回归模型']正确率60.0%某种产品的广告支出费用$${{x}}$$(单位:万元)与销售额$${{y}}$$(单位:万元)之间有如下关系:
$${{x}}$$ | $${{2}}$$ | $${{4}}$$ | $${{5}}$$ | $${{6}}$$ | $${{8}}$$ |
$${{y}}$$ | $${{3}{0}}$$ | $${{4}{0}}$$ | $${{6}{0}}$$ | $${{5}{0}}$$ | $${{7}{0}}$$ |
C
A.$${{5}{0}}$$
B.$${{2}{0}}$$
C.$${{1}{0}}$$
D.$${{5}}$$
4、['残差', '样本相关系数r的计算', '相关关系', '样本相关系数与相关程度']正确率60.0%下列四种说法中,错误的是$${{(}{)}}$$
B
A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在线性回归分析中,相关系数$${{r}}$$的值越大,变量间的相关性越强
C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高
D.在回归分析中,$${{R}^{2}}$$为$${{0}{.}{9}{8}}$$的模型比$${{R}^{2}}$$为$${{0}{.}{8}{0}}$$的模型拟合的效果好.
5、['决定系数R^2', '残差', '离散型随机变量的方差的性质', '一元线性回归模型']正确率60.0%下列说法不正确的是()
C
A.随机变量$${{ξ}{,}{η}}$$满足$${{η}{=}{2}{ξ}{+}{3}{,}}$$则其方差的关系为$${{D}{(}{η}{)}{=}{4}{D}{(}{ξ}{)}}$$
B.回归分析中,$${{R}^{2}}$$的值越大,说明残差平方和越小
C.画残差图时,纵坐标一定为残差,横坐标一定为编号
D.回归直线一定过样本点中心
6、['统计与概率的应用', '线性回归模型的最小二乘法', '独立性检验及其应用', '残差', '样本相关系数r的计算', '样本相关系数与相关程度']正确率60.0%下列说法错误的个数是()
$${①}$$在线性回归模型$${{y}{=}{b}{x}{+}{a}{+}{e}}$$中,预报变量$${{y}}$$除了受解释变量$${{x}}$$的影响外,可能还受到其它因素的影响,这些因素会导致随机误差$${{e}}$$的产生
$${②}$$在线性回归模型$${{y}{=}{b}{x}{+}{a}{+}{e}}$$中,随机误差$${{e}}$$是由于计算不准确造成的,可以通过精确计算避免随机误差$${{e}}$$的产生
$${③}$$在吸烟与患肺病这两个分类变量的计算中,从独立性检验可知有$${{9}{9}{%}}$$的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有$${{9}{9}{%}}$$的可能患有肺病
$${④}$$在吸烟与患肺病这两个分类变量的计算中,若$${{K}^{2}}$$从统计量中求出有$${{9}{9}{%}}$$的把握认为吸烟与患肺病有关系,是指有$${{1}{%}}$$的可能性使得判断出现错误
$${⑤}$$在吸烟与患肺病这两个分类变量的计算中,若$${{K}^{2}}$$的观测值$${{k}{>}{{6}{.}{6}{3}{5}}}$$,我们有$${{9}{9}{%}}$$的把握认为吸烟与患肺病有关系,那么在$${{1}{0}{0}}$$个吸烟的人中必有$${{9}{9}}$$人患有肺病.
B
A.$${{2}}$$
B.$${{3}}$$
C.$${{4}}$$
D.$${{5}}$$
7、['残差', '样本相关系数与相关程度', '一元线性回归模型']正确率60.0%下列有关线性回归分析的六个命题:
$${①}$$线性回归直线必过样本数据的中心点$$( \overline{{x}}, \ \overline{{y}} )$$;
$${②}$$回归直线就是散点图中经过样本数据点最多的那条直线;
$${③}$$当相关性系数$${{r}{>}{0}}$$时,两个变量正相关;
$${④}$$如果两个变量的相关性越强,则相关性系数$${{r}}$$就越接近于$${{1}}$$;
$${⑤}$$残差图中残差点所在的水平带状区域越宽,则回归方程的预报精确度越高;
$${⑥}$$甲$${、}$$乙两个模型的$${{R}^{2}}$$分别约为$${{0}{.}{8}{8}}$$和$${{0}{.}{8}{0}}$$,则模型乙的拟合效果更好.
其中真命题的个数为()
C
A.$${{1}}$$个
B.$${{2}}$$个
C.$${{3}}$$个
D.$${{4}}$$个
8、['残差', '样本相关系数与相关程度']正确率60.0%已知一组样本点$${({{x}_{i}}{,}{{y}_{i}}{)}}$$,其中$${{i}{=}{1}{,}{2}{,}{3}{,}{…}{,}{{3}{0}}}$$,根据最小二乘法求得的回归方程是$${{y}{ˆ}{=}{{b}^{ˆ}}{x}{+}{{a}{ˆ}}{,}}$$则下列说法正确的是()
D
A.至少有一个样本点落在回归直线$${{y}{ˆ}{=}{{b}^{ˆ}}{x}{+}{{a}{ˆ}}}$$上
B.若所有样本点都在$${{y}{ˆ}{=}{{b}^{ˆ}}{x}{+}{{a}{ˆ}}}$$上,则变量间的相关系数为$${{1}}$$
C.对所有的预报变量$${{x}_{i}{(}{i}{=}{1}{,}{2}{,}{3}{,}{…}{,}{{3}{0}}{)}{,}{{b}^{ˆ}}{{x}_{i}}{+}{{a}{ˆ}}}$$的值一定与$${{y}_{i}}$$有误差
D.若$${{y}{ˆ}{=}{{b}^{ˆ}}{x}{+}{{a}{ˆ}}}$$斜率$${{b}^{ˆ}{>}{0}}$$,则变量$${{x}}$$与$${{y}}$$正相关
9、['残差', '直线拟合', '命题的真假性判断']正确率40.0%有下列说法:
$${①}$$在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合适;
$${②}$$用相关指数$${{R}^{2}}$$来刻画回归的效果,$${{R}^{2}}$$值越大,说明模型的拟合效果越好;
$${③}$$比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好.
$${④}$$在研究气温和热茶销售杯数的关系时,若求得相关指数$${{R}^{2}{≈}{{0}{.}{8}{5}}}$$,则表明气温解释了$${{1}{5}{%}}$$的热茶销售杯数变化.
其中正确命题的个数是()
C
A.$${{1}}$$
B.$${{2}}$$
C.$${{3}}$$
D.$${{4}}$$
10、['线性回归模型的最小二乘法', '残差', '样本相关系数与相关程度', '总体和样本']正确率60.0%下列命题中正确的命题是()
C
A.用样本频率分布估计总体频率分布的过程中,总体容量越大,估计越精确
B.对于两个变量之间的相关系数$${{r}}$$,若相关程度越强,则$${{r}}$$越接近于$${{1}}$$
C.最小二乘法所求得的回归直线方程一定过样本的中心点$${{(}{{x}{¯}}{,}{{y}{¯}}{)}}$$
D.在残差图中,残差点比较均匀地落在水平带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越宽,说明模型的拟合精度越高,回归方程的预报精度越高
1. 首先根据样本点$$(4, 3)$$的残差为$$-0.15$$,计算预测值:$$3 = 0.7 \times 4 + a^ \Rightarrow a^ = 3 - 2.8 = 0.2$$。回归方程为$$y^ = 0.7x + 0.2$$。计算样本均值:$$\overline{x} = \frac{3+4+5+6}{4} = 4.5$$,$$\overline{y} = \frac{2.5+3+4+m}{4} = \frac{9.5 + m}{4}$$。回归直线过$$(\overline{x}, \overline{y})$$,代入得$$\frac{9.5 + m}{4} = 0.7 \times 4.5 + 0.2 = 3.35$$,解得$$m = 4.5$$。答案为$$C$$。
2. 原始回归方程为$$y^ = 1.2x + 0.4$$,且$$\overline{x} = 3$$,代入得$$\overline{y} = 1.2 \times 3 + 0.4 = 4$$。去除两个点后,剩余$$n-2$$个点,重新计算$$\overline{x}'$$和$$\overline{y}'$$。由于去除的点$$(1.2, 0.5)$$和$$(4.8, 7.5)$$的均值为$$(3, 4)$$,新的均值仍为$$(3, 4)$$。新斜率为$$1.1$$,回归方程为$$y^ = 1.1x + a^$$,过$$(3, 4)$$,解得$$a^ = 4 - 3.3 = 0.7$$,方程为$$y^ = 1.1x + 0.7$$。验证选项:$$C$$正确;$$D$$中残差为$$2.7 - (1.1 \times 2 + 0.7) = -0.2$$,错误。答案为$$C$$。
3. 当$$x=5$$时,预测值为$$6.5 \times 5 + 17.5 = 50$$,实际值为$$60$$,残差为$$60 - 50 = 10$$。答案为$$C$$。
4. 选项$$B$$错误,因为相关系数$$r$$的绝对值越大,相关性越强,但$$r$$的正负只表示方向。其他选项均正确。答案为$$B$$。
5. 选项$$C$$错误,因为残差图的横坐标可以是解释变量或编号。其他选项均正确。答案为$$C$$。
6. 错误说法:$$②$$(随机误差不可完全避免)、$$③$$(99%把握是统计意义,非个人概率)、$$⑤$$(100人中未必有99人患病)。共$$3$$个错误。答案为$$B$$。
7. 真命题:$$①$$(回归直线过中心点)、$$③$$($$r>0$$正相关)、$$⑥$$($$R^2$$越大拟合越好,甲优于乙)。$$②$$(回归直线不一定经过最多点)、$$④$$($$r$$接近$$1$$或$$-1$$表示强相关)、$$⑤$$(带状区域越宽精度越低)错误。共$$3$$个真命题。答案为$$C$$。
8. 选项$$D$$正确,斜率$$b^>0$$表示正相关。$$A$$(样本点不一定在直线上)、$$B$$(相关系数为$$1$$或$$-1$$)、$$C$$(可能有零误差)均不完全正确。答案为$$D$$。
9. 正确命题:$$①$$(残差分布均匀说明模型合适)、$$②$$($$R^2$$越大拟合越好)、$$③$$(残差平方和越小越好)。$$④$$错误,$$R^2=0.85$$表示气温解释了85%的变化。共$$3$$个正确。答案为$$C$$。
10. 选项$$C$$正确,回归直线必过样本中心点。$$A$$(样本容量越大越精确,非总体容量)、$$B$$($$r$$接近$$1$$或$$-1$$表示强相关)、$$D$$(带状区域越窄精度越高)错误。答案为$$C$$。