【综合文库】
一只药用昆虫的产卵数y与一定范围内的温度x有关, 现收集了该种药用昆虫的6组观测数据如下表: 温度x/?C 产卵数y/个
21 6 23 11 24 20 27 27 29 57 32 77 1616经计算得:x??xi?26,y??yi?33,
6i?16i?1??x?x?(y?y)?557iii?16,
??x?x?ii?1662?84,
6?(y?y)ii?12?i)2?236.64,e8.0605≈3167,其?3930,线性回归模型的残差平方和?(yi?yi?1中xi, yi分别为观测数据中的温度和产卵数,i=1, 2, 3, 4, 5, 6.
?x+a?(精确到0.1)?=b(Ⅰ)若用线性回归模型,求y关于x的回归方程y;
?=0.06e0.2303x,且相关指数R2=0.9522. (Ⅱ)若用非线性回归模型求得y关于x的回归方程为y( i )试与(Ⅰ)中的回归模型相比,用R2说明哪种模型的拟合效果更好.
(ii)用拟合效果好的模型预测温度为35?C时该种药用昆虫的产卵数(结果取整数).
?x+a?的斜率和截距的最小二乘估计为 ?=b附:一组数据(x1,y1), (x2,y2), ...,(xn,yn), 其回归直线y??b
?i?1?xi?x?(yi?y)??x?x?i?1in2n?;相关指数R=1???=y?bx,a?2
2?(y?y)iii?1ni?1n(yi?y)2.
?xi?x?(yi?y)557?i?1?(Ⅰ)由题意得,b???6.6, 6284?i?1?xi?x???33?6.6?26=?138.6, ∴a?=6.6x?138.6. ∴y关于x的线性回归方程为y?=6.6x?138.6,相关指数为 (Ⅱ) ( i )由所给数据求得的线性回归方程为y6?R=1??2
2?(y?y)iii?12(y?y)ii?166?1?236.64?1?0.0602?0.9398.
3930因为0.9398<0.9522,
?=0.06e0.2303x比线性回归方程y?=6.6x?138.6拟合效果更好. 所以回归方程y?=0.06e0.2303?35=0.06?e8.0605. (ii)由( i )得当温度x=35?C时,y?≈0.06?3167≈190(个)又∵e8.0605≈3167,∴y.
即当温度x=35?C时,该种药用昆虫的产卵数估计为190个.
已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x(单位:℃),对某种鸡的时段产蛋量y(单位:t)和时段投入成本z(单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度xi和产蛋量对数据初步处理后得yi(i?1,???2,的数据,,到了如图所示的散点图和表中的统计量的值.
y(产蛋量)
. 200 . 150 . 100 50 . o . .
. . . .
.... ... 12 1416 1920 22 24
.
x(温度)
x 1y k ?(xi?17i?x) 2?(ki?17i?k) 2?(xi?17i?x)(yi?y) ?(x?x)(kii?17i?k) 82.30 3.6 7.40 140 9.7 2935.1 35.0 17其中ki?lnyi,k??ki.
7i?1(1)根据散点图判断,y?bx?a与y?c1ec2x哪一个更适宜作为该种鸡的时段产蛋量
y关于鸡舍时段控制温度x的回归方程类型?(给判断即可,不必说明理由)
(2)若用y?c1ec2x作为回归方程模型,根据表中数据,建立y关于x的回归方程; (3)已知时段投入成本z与x,y的关系为z?e?2.5y?0.1x?10,当时段控制温度为
28℃时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?
i?1,2,3,Ln,,其回归直线)附:①对于一组具有有线性相关关系的数据(?i,?i)(μ????u??的斜率和截距的最小二乘估计分别为?(u-u)(??ii?1ni?(u?u)ii?1科§网Z§X§X§K]n-?)?u?????,?[来源:学§2
②
e?2.5 0.08
e?0.75 0.47 e 2.72 e3 20.09 e7 1096.63 (1)y?C1ec2x适宜??????2分
(2)由y?C1ec2x得lny?C2x?lnC1??????3分 令lny?k,C2??,??lnC1
??由图表中的数据可知????k13x?44[来源学+科+网]3513?????????6分 ?,?14044
x3?44?y关于x的回归方程为y?e(3)
?0.47e??????8分
x4??0.47?1096.63?515.4,x?28时,由回归方程得y??0.08?515.4?2.8?10?48.432 z即鸡舍的温度为28℃时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432。
某地一商场记录了12月份某5天当中某商品的销售量y(单位:kg)与该地当日最高气温
x(单位:?C)的相关数据,如下表:
x y 11 9 8 5 2 12 7 8 8 10 ??a?; (1)试求y与x的回归方程?y?bx(2)判断y与x之间是正相关还是负相关;若该地12月某日的最高气温是6?C,试用所求回归方程预测这天该商品的销售量;
(3)假定该地12月份的日最高气温X?N(?,?2),其中?近似取样本平均数x,?2近似取样本方差s2,试求P(3.8?X?13.4).
nn?xiyi?nxy?(xi?x)(yi?y)???i?1??i?1n?b?n2附:参考公式和有关数据?,10?3.2,3.2?1.8,22x?nx(x?x)??ii?i?1i?1?????a?y?bx若X?N(?,?2),则P(????X????)?0.6826,且
P(??2??X???2?)?0.9544.
(1)由题意,x?7,y?9,
?xy?nxy?287?5?7?9??28,
iii?1n222???28??0.56,a??y?bx??9?(?0.56)?7?12.92. b?295?5?7?50,x?nx?i50i?1n所以所求回归直线方程为?y??0.56x?12.92.
???0.56?0知,y与x负相关.将x?6代入回归方程可得, (2)由b?y??0.56?6?12.92?9.56,
即可预测当日销售量为9.56kg. (3)由(1)知??x?7,??S2?3.2,所以P(3.8?X?13.4)?P(????X???2?)?11P(????X????)?P(??2??X???2?)22?0.8185.
共享单车是指由企业在校园、公交站点、商业区、公共服务区等场所提供的自行车单车共享服务,由于其依托“互联网+”,符合“低碳出行”的理念,已越来越多地引起了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了50人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这50人根据其满意度评分值(百分制)按照[50,60),[60,70),?,[90,100]分成5组,请根据下面尚未完成并有局部污损的频率分布表和频率分布直方图(如图所示)的解决下列问题:
(I)求出a,b,x的值;
(II)若在满意度评分值为[80,100]的人中随机抽取2人进行座谈,设所抽取的2人中来自第5组的人数记为?,求?的分布列和数学期望.
(Ⅰ)由题意可知,
80.16?,解得b=0.04;?????????3分 2b∴[80,90)内的频数为2×2=4,
8?50,a=50﹣8﹣20﹣4﹣2=16; 0.16160.32?0.32,∴x??0.032;???????????6又[60,70)内的频率为5010∴样本容量n?分
(Ⅱ)由题意可知,第4组共有4人,第5组共有2人,
∴随机变量ξ的可能取值为0,1,2,
2112C4C2C48C221,P(??2)?2?.??????9分 P(??0)?2?,P(??1)?2?C65C615C615
∴?的分布列为:
? P 0 1 2 281 515152812∴E(?)?0??1??2????????????????12分
515153
(Ⅰ)由甲班同学成绩的中位数为74,
所以7x?75?2?74,得x?3?????3分
由茎叶图知,乙班同学成绩的众数为78,83?????6分
2甲班乙班合计优秀人数不优秀人数合计6344013274019618080?(6?27?13?34)2?3.382?2.706(表格2分,K2计算4分) (Ⅱ)依题意知K?40?40?19?61有90%以上的把握认为“数学成绩优秀与教学改革有关”,学校可以扩大教学改革面.?12分
某市教育局对该市普通高中学生进行学业水平测试,试卷满分120分,现从全市学生中随机抽查了10名学生的成绩,其茎叶图如下图所示:
(1)已知10名学生的平均成绩为88,计算其中位数和方差;
(2)已知全市学生学习成绩分布服从正态分布N(?,?),某校实验班学生30人. ①依据(1)的结果,试估计该班学业水平测试成绩在(94,100)的学生人数(结果四舍五入取整数);
②为参加学校举行的数学知识竞赛,该班决定推荐成绩在(94,100)的学生参加预选赛若
2每个学生通过预选赛的概率为数学期望.
正态分布参考数据:
2,用随机变量X表示通过预选赛的人数,求X的分布列和3P(????X????)?0.6828,P(??2??X???2?)?0.9544
(1)由茎叶图可知这10个数据依次为78,81,81,86,86,87,92,96,97, 中位数为
86?87?86.5, 21[(?10)2?(?7)2?(?4)2?(?2)2?(?2)2?(?1)2?12?52?82?92]?36. 10由平均数为
x?88s2?(2)①由(1)知??88,??6,
P(91?X?100)?P(????X???2?)?
P(??2??X???2?)?P(????X????)2?0.9544?06828?0.1359,
2该班学生成绩在(94,100)的人数为30?0.1359?4.05?4. ②随机变量X?0,1,2,3,4,显然X服从二项分布B(4,),
kk4?k其分布列为P(X?k)?C4()(1?),其中k?0,1,2,3,4,
232323E?X??4?28?. 33
(Ⅰ)由以上统计数据填写2?2列联表如下:
优质品 非优质品 合计 2甲基地 420 80 500 乙基地 390 110 500 合计 810 190 1000
?????(2分)
21000?(420?110?390?80)1000K???5.848?3.841,
500?500?810?190171所以,有95%的异”.?????(4分)
把握认为:“两个基地采摘的水果直径有差
(Ⅱ)甲基地水果的优质品率为
420220?84%,甲基地水果的优质品率为?78%, 500500所以,甲基地水果的优质品率较高,?????(5分) 甲基地的500个桔柚直
x?1(62?10?68?30?74?120?80?175?86?125?92?35?98?5)(6分) 500?????(8分)
?1.24?4.08?17.76?28.0?21.5?6.44?0.98?80(Ⅲ)由(Ⅱ)可知,甲基地的桔柚直径X~N(80,6.78)????(9分)
2P(80?6.78?X?80?6.78)?P(73.22?X?86.78)?0.6826,??(10分)
?P(X?86.78)?1?P(73.22?X?86.78)1?0.6826??0.1587??(11分)
22所以,估计甲基地采摘的桔柚中,直径不低于86.78毫米的桔柚在总体中所占的比例大约为15.87%.????(12分)
查看全文
false