统计学复习重点
第一章
统计数据信息处理的方法:1.描述统计方法;2.推断统计方法
统计的含义:统计工作、统计资料、统计学
政治算数学派:威廉。配第;国势学派:康令;数理统计学派:凯特勒
统计研究的对象具有如下特点:1.数量性2.具体性3.总体性4.社会性
统计工作的基本任务:服务与监督
基本方法:1.大量观察法 2.综合指标法 3.统计分组法
总体:即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体
总体单位:构成统计总体的个别单位
标志:表明总体单位特征的名称
品质标志:说明总体单位质的特征,用属性表示
数量标志:说明总体单位量的特征,用数量表示,数量标志的具体体现:标志值
指标:说明总体的综合数量特征。1.按结构分:指标名称、指标数值
2.按内容分:数量指标(绝对数)、质量指标(相对数、平均数)
标志与指标的联系和区别:
区别:1.标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定
经过汇总才能取得。
2.标志一般不具备时间、地点等条件;但完整的统计指标一定要讲明时间、地点、范围
联系:1.有些数量标志值汇总可以得到指标的数值。既可指总体各单位标志量的总和,也可指总体单位数的总和
2.数量标志与指标之间存在变换关系。随着统计目的的改变,如果原来的总体单位变成了统计总体,则与之相对应的数量标志就成了统计指标
变异:是标志在各总体单位具体表现的差异 —— 一般意义上的变异;严格说,变异指品质
标志的不同表现
变量:指可变的数量标志。变量的具体数值表现即变量值(离散变量、连续变量)
统计指标体系:研究社会经济现象的一系列相互联系的统计指标为统计指标体系
流量:即一定时期内生产的产品和劳务而取得的收入或支出的总量。是时期指标。
存量:即某一时点上过去生产与积累起来的产品、货物、存储、资产负债的结存数。是时
点的指标。
流量之比、存量之比及流量与存量之比既不是流量也不是存量。
第二章
统计调查:按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集资料的
过程
统计调查的基本要求:准确性、及时性
统计调查设计步骤:1.确定调查目的;2.确定调查对象和调查单位;3.拟定调查提纲和制定调查表;4.确定调查时间;5.制定调查的组织实施计划。
调查对象:就是我们需要进行研究的总体单位,即调查总体。
调查单位:进行登记的标志表现的直接承担者。
拟定调查项目注意的原则:
1) 调查项目要少而精
2) 调查项目含义要明确
3) 尽可能做到各个调查项目之间有一定的联系
调查表(调查问卷)分为:一览表和单一表
特点:经济性、广泛性、匿名性、客观性、灵活性
调查时间:指调查资料所属的时间
调查期限:指调查工作的起讫时间
统计调查的具体方法:直接观察法、报告法、采访法、网上调查法(另外:电话调查、座谈会、个别深入访谈等)
统计调查的分类:
1) 按调查范围:全面调查和非全面调查
2) 按登记事物的连续性:经常调查和一时调查
3) 按组织形式:统计报表和专门调查
统计分组:把同质总体中的具有不同特点的单位分开,从而正确地认识事物的本质及其规律性。
作用:
1) (类型分组)揭露社会经济现象的类型,反映各类型的特点。
2) (结构分组)说明社会经济现象的内部结构
3) (分析分组)研究经济现象之间的依存关系
原则:
1) 根据研究问题的目的来选择
2) 要选择最能反映被研究现象本质特征的标志
3) 要结合现象所处的具体历史条件或经济条件来选择
分组标志的总类
1) 按分组标志的特征不同分:品质标志分组(分为简单分组和复杂分组)
数量标志分组(分单项式数量分组和组距式分组)
2) 按总体所选择标志的个数分:简单分组(按一个标志分组)和复合分组(两个以上)
分配数列:统计总体按照某一标志分组以后,用以反映总体各单位分配情况的统计数列,称为分配数列,又可称次数分配或次数分布
种类:按分组标志特征分:品质数列和变量数列
上组限不在内:适用于越大越好的变量
下组限不在内:适用于越小越好的变量
对于不连续变量,组与组间是间断的
以下累计次数(上限)——即较小制累计。每一组的累计次数表示小于该组上限(变量)值的次数共有多少。
以上累计次数(下限)——即较大制累计。每一组的累计次数表示大于该组下限(变量)值的次数共有多少。
统计表:
1) 从形式上看:统计表由总标题、横行标题、纵栏标题、指标数值构成
2) 从内容上看:统计表由主词(说明总体或总体分组)和宾词(用那些指标数值来说明总体或总体的分组)两部分构成
分类:
1) 简单表:总体未分组
2) 分组表:总体按一个标志进行分组
3) 复合表:总体按二个或二个以上标志进行复合分组
统计表的编制原则:
1. 总标题须简明扼要表达出全表的内容;
2. 各标题要确切反映表的内容,且表格安排合理;
3. 指标数值要位数对齐,合计或总计一般放在表的尾部;
4. 对指标内容作必要说明时,可加注在表的下方;
5. 表的上下边线(基线)用粗实线或双线,表的两边是开口式;
6. 纵栏较多时编栏号,指标数值栏要注明计量单位和资料表示的时间。
总原则:合理、科学、实用、简练、美观。
第三章
综合指标:绝对指标、相对指标、平均指标
总量指标:反映社会经济现象一定时间、地点、条件下总的规模、水平的统计指标。
变现形式是绝对数,也可以是绝对差数
作用:
1) 总量指标能反映一个国家的基本国情和国力,反映某部门、单位等人、财、物的基本数据
2) 总量指标是进行决策和科学管理的依据之一
3) 总量指标是计算相对指标和平均指标的基础
总量指标的分类:
1) 按反映内容的不同分:总体单位总量(说明总体的单位数数量);标志总量(说明总体中某个标志值总和的量)
2) 反映的时间状况不同分:时期指标:反映现象在某一时期发展过程的总数量;时点指标:反映现象在某一时刻的状况
计算原则:1.现象的同类性;2.明确的统计含义;3.计量单位必须一致
计量单位:1.实物单位;2.价值单位;3.劳动单位(不同企业的劳动量指标不具可比性,劳动量指标只限于企业内部使用)
相对指标:两个有联系的绝对指标之比
表现形式:有名数和无名数(系数或倍数、成数、百分数、千分数)
强度相对数的数值有两种方法:1.一般用复名数;2.也有少数用百分数或千分数(产值利润率、资金利润率)
运用相对指标的原则:
1) 注意二个对比指标的可比性
2) 相对指标要和总量指标结合起来运用
3) 多种相对数结合运用
4) 在比较二个相对数时,是否适宜相除再求一个相对数,应视情况而定。若除出来有实际意义,则除;若不宜相除,只宜相减求差数,用百分点表示之。(百分点 —即百分比中相当于百分之一的单位)
平均指标:平均指标是指在同质总体内将各单位某一数量标志的差异抽象化,用以反映总体在具体条件下的一般水平
特点:1.数量抽象性;2.集中趋势代表性
作用:
1) 比较作用:同类现象在不同空间的对比;同一总体在不同时间上的比较
2) 利用平均指标可以分析现象之间的依存关系
3) 利用平均指标可以进行数量上的推算,还可以作为论断事物的一种数量标准或参考
加权算数平均数与简单算术平均数不同点:
加权算术平均数受两因素影响:
1) 变量值大小的影响
2) 次数多少的影响
简单算术平均数只反映变量值大小这一因素的影响
加权平均数的特点:
1) 算术平均数适合用代数方法运算,因此运用比较广泛;
2) 易受极端变量值的影响,使的代表性变小;受极大值的影响大于受极小值的影响;
3) 当组距数列为开口组时,由于组中点不易确定,使的代表性也不很可靠。
众数存在的条件:
1) 只有总体单位数比较多,而又有明显的集中趋势才存在众数
2) 在单位数很少,或单位数虽多但无明显集中趋势时,计算众数是没有意义的
中位数的特点:
1) 中位数不受极端值及开口组的影响,具有稳健性
2) 各单位标志值与中位数离差的绝对值之和是个最小值
3) 对某些不具数学特点或不能用数字测定的现象,可用中位数求其一般水平
平均指标的运用原则:
1) 平均指标只能适用于同质总体
2) 用组平均数补充说明总平均数
3) 用分配数列补充说明平均数
标志变动度:标志变动度是指总体中各单位标志值差别大小的程度,又称离散程度或离中程度
作用:
1) 标志变动度是评价平均数代表性的依据
2) 标志变动度可用来反映社会生产和其他社会经济活动过程中的均衡性或协调性,以及产品质量的稳定性
种类:全矩、四分位差、平均差、标准差、离散系数
标准差的作用:
1) 度量差异程度
2) 测定分布偏度
3) 计算标准分
离散系数:是各种变异指标与平均数的比率。反映总体各单位标志值的相对离散程度,最常用的是标准差系数。
第四章:
动态数列:又称时间数列。它是将某种统计指标,或在不同时间上的不同数值,按时间先后顺序排列起来,以便于研究其发展变化的水平和速度,并以此来预测未来的一种统计方法。
两个基本要素构成:1.时间,即现象所属的时间;2.不同时间上的统计指标数值,即不同时间上该现象的发展水平
种类:指标数值的不同分:1.绝对数动态数列(时期数列、时点数列)2.相对数动态数列3.平均数动态数列
时期数列特点:
1) 数列中各个指标值是可加的
2) 数列中每个指标值的大小随着时期的长短而变动
3) 数列中每个指标值通常是连续不断的登记取得的
时点指标特点:
1) 数列中各个指标是不能相加的
2) 数列中每个指标值的大小与时间间隔的长短没有直接关系
3) 数列中的每个指标值通常是按期登记一次取得的
动态数列的编制原则:(遵守可比性)
1) 注意时间的长短应统一
2) 总体范围应一致
3) 指标的经济内容应相同
4) 指标的计算方法和计量单位应一致
发展水平:在动态数列中,每个绝对数指标数值叫做发展水平或动态数列水平
平均发展水平:是对不同时期的发展水平求平均数,统计上又叫序时平均数
序时平均数与一般平均数的异同点:
相同点:二者都是将现象的个别数量差异抽象化,概括地反映现象的一般水平
不同点:1.计算方法不同;2.差异抽象化不同;3.序时平均数还可解决某些可比性问题
平均增长量:说明社会现象在一段时期内平均每期增加的绝对数量
长期趋势:就是指某一现象在一个相当长的时期内持续发展变化的趋势。(向上或向下变化)
测定长期趋势的目的:
1) 把握现象的趋势变化
2) 从数量方面研究现象发展的规律性,探求合适趋势线
3) 测定季节变动的需要
长期趋势的类型:直线趋势和非直线趋势
方法:间隔扩大法、移动平均法、最小平方法
测定季节变动的方法:
1) 按月平均法,不考虑长期趋势的影响(假定不存在长期趋势),直接利用原始动态数列来计算
2) 移动平均趋势剔除法,即考虑长期趋势的存在,剔除其影响后再进行计算,故常用此法
第五章
广义的指数:指一切说明社会经济现象数量或差异程度的相对数,如动态相对数、比较相对数、计划完成相对数等都可称为指数。
狭义指数:是一种特殊的相对数,也即专指不能直接相加和对比的复杂社会经济现象综合变动程度的相对数。特点:1.综合性,2.平均性
指数的作用:
1) 综合反映事物变动方向和变动程度
2) 分析多因素影响现象的总变动中,各个因素的影响大小和影响程度
3) 研究事物在长时间内的变动趋势
4) 对多指标的变动进行综合测评
指数的种类:
1) 说明现象的范围:个体指数和总指数(总体指数是个体指数的平均数)
2) 统计指标的内容:数量指标指数和质量指标指数
a) 数量指标指数:说明总体规模变动情况的指数
b) 质量指标指数:说明总体内涵数量变动情况的指数
3) 指数表现形式:综合指数、平均指标指数和平均指标对比指数
4) 指数所说明的因素多少:两因素指数和多因素指数
5) 所采用基期不同:定基指数和环比指数
总指数的计算形式:综合指数和平均指标指数
同度量因素的作用:1.同度量作用2.权数作用
总变动指数=因素指数的乘积
总量动态指标=数量指标指数*质量指标指数
第六章
抽样调查的意义:按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体做出数量上的推断分析。
抽样调查的适用范围:
1) 实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物
2) 虽可进行全面调查观察,但比较困难或并不必要
3) 对普查或全面调查统计资料的质量进行检查和修正
4) 抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况
5) 利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍
抽样调查与全面调查不能相互替代
全及总体:所要调查观察的全部事物。总体单位数用N表示。
抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n表示。
全及指标:全及总体的那些目标
抽样指标:抽样总体的那些目标
抽样框:即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。
样本数:指从总体中可能抽取的样本的数量
样本容量:指一个样本所包括的单位数
类型抽样类型的划分:
1) 必须有清楚的划类界限
2) 必须知道各类中的单位数目和比例
3) 分类型的数目不宜过多
类型抽样的好处:样本代表性高,抽样误差小,抽样调查成本低。如果误差要求相同的话,抽样数目可以减少
机械抽样按样本单位抽选的方法分:1.随机起点等距抽样2.半距起点等距抽样3.对称等距抽样
机械抽样的好处:1.抽样过程大大简化,减轻抽样的工作量;2.如果按有关标志排队,可以缩小抽样误差,提高抽样推断的效果
整群抽样的好处:组织工作比较方便,使用于一些特殊的研究对象。不足:一般比其他抽样方式的抽样误差大(都采用不重复抽样)
整群抽样的作用:1.当总体缺乏包括全部总体单位的抽样框,无法进行抽选时必须采用整群抽样2.比较方便和节约费用
抽样误差的影响因素:
1) 全及总体标志变异程度
2) 抽样单位数目的多少
3) 不同的抽样方式
4) 不同的抽样组织形式
抽样误差:是所有可能出现的样本指标的标准差,它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差
取得σ的途径有:
1) 用过去全面调查或抽样调查的资料,若同时有n个σ的资料,应选用数值较大的那个
2) 用样本标准差S代替全及标准差σ
3) 在大规模调查前,先搞个小规模的试验性的调查来确定S,代替σ
4) 用估计的方法。
点估计:就是由样本指标直接代替全及指标,不考虑任何抽样误差因素。
区间估计:是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确度和把握程度
全及平均数(成数)=抽样平均数(成数)
影响必要抽样单位数的确定:
1) 总体各单位的标志变异程度
2) 允许误差的大小
3) 概率度t的数值
4) 抽样方式和组织形式
抽样方式设计的基本原则:
1) 保证实现抽样随机性原则
2) 保证实现最大的抽样效果原则
第七章
函数关系:它反映着现象之间存在着严格的依存关系,也就是具有确定性的对应关系,这种关系可用一个数学表达式反映出来
相关关系:它反映着现象之间的数量上不严格的依存关系,也就是说两者之间不具有确定性的对应关系,这种关系有二个明显特点: 1.现象之间确实存在数量上的依存关系,即某一社会经济现象变化要引起另一社会经济现象的变化;2.现象之间的这种依存关系是不严格的,即无法用数学公式表示。
分类:
1. 按相关关系涉及的因素多少来分,可分为:单相关和复相关
2. 按相关关系的性质来分,可分为:正相关和负相关
3. 按相关关系的形式来分,可分为:直线相关和曲线相关
4. 按相关程度分,可分为:完全相关、不完全相关和不相关
相关分析的主要任务:一方面,研究现象之间关系的密切程度,即相关分析;另一方面,研究自变量与因变量之间的变动关系,即回归分析。
相关分析的主要内容:
1. 判断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这是相关分析的出发点;
2. 确定相关关系的密切程度;
3. 测定两个变量之间的一般关系值;
4. 测定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;
5. 相关系数的显著性检验。
相关系数:是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综合性指标。一般用符号r表示
对r的解释:
1. r取正值或负值决定于分子协方差
2. r的绝对值,在0与1之间
3. r的绝对值大小,可说明现象之间相关关系的紧密程度。
简单线性相关分析的特点:
1. 相关关系中,两个变量不必定出哪个是自变量,哪个是因变量,因此,相关的两个变量都是随机变量
2. 相关关系中只能计算出一个相关系数r
简单直线回归方程建立的步骤:
1. 确定自变量x和因变量y
2. 计算x2、xy、Σx、Σy、Σx2、Σxy
3. 代入公式,先求b,再求a
简单直线回归分析的主要特点:
1. 直线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量
2. 在两个现象互为根据的情况下,可以有两个回归方程
判定系数 的特性:
1. 具有非负性
2. 取值范围为
3. 是样本观测值的函数,它也是一个统计量
4. 在一元线性回归模型中,判定系数是单相关系数的平方
估计标准误差:就是用来说明回归方程推算结果的准确程度的统计分析指标,以绝对值表示,其数值越小,说明推算结果的准确程度越高,回归直线的代表性也越大。
Sy和r的异同点:
1. 相同点:都具有说明相关关系密切程度的作用;
2. 不同点:(1)r越大越好,而Sy越小越好;
(2)r用相对数表现,密切程度的概念比较明确
Sy用绝对数表现,关系密切的程度表示得
不那么明显;
(3)r能说明正、负相关,Sy不能说明。
查看全文
false