书城教材教辅社会调查研究方法
42842900000050

第50章 统计分析(1)

第一节统计分析概述

一、统计分析的作用

统计分析就是运用统计学方法对调查得到的数据资料进行定量分析,以揭示事物内在的数量关系、规律和发展趋势的一种资料分析方法。

任何事物总有质和量两个方面,社会现象也不例外。以往的调查研究往往只注重定性分析,而忽视定量分析。近年来,由于定量分析方法表现出无可否认的优越性,促使社会科学加速朝着定量化的方向发展,统计分析方法已成为人们认识社会现象的一种重要分析手段。今天,使用定性、定量相结合的方法已成为社会调查中大势所趋的潮流,人们更加注意搜集和分析社会现象数量方面的资料,利用各种数学模型揭示数据后面隐藏的关系、规律和发展趋势。统计分析的作用主要表现在以下三个方面。

1.统计分析的方法可以为我们的研究提供一种清晰、精确的形式化语言,对资料进行简化和描述

例如,对人们在一胎化政策实行前的行为进行研究,可以发现生育行为受文化程度的影响。从总体上看,文化程度高的妇女其子女数量少于文化程度低的妇女。用定性分析方法只能得出这样一个概略的认识。如果采用定量方法进行分析就可以把这种关系提炼成一个数学方程式:Y=4.38-0.16X。Y代表任何一个妇女生育子女的数量,X代表文化程度。从这个方程式可以看出,每提高一组文化程度,就可以少生0.16个孩子。定量分析不仅可以使问题分析变得清晰、简洁,而且使问题的分析准确、深刻。

2.统计分析是进行科学预测、探索未来的重要方法

人们对社会现象进行调查,首先要了解社会现象是什么状态,接着要回答为什么会出现这种状态,找出其中的规律,然后再根据过去和现在的实际资料,运用科学知识,探索今后的发展趋势,并作出估计和判断,这就是预测的思路。人们把根据事实,运用经验和判断能力,以逻辑思维方法进行的预测称之为定性预测;把根据数据、统计资料,运用统计分析方法进行的预测称为定量预测。统计分析方法不仅是对客观现象数量关系描述的工具,还是进行科学抽象的思维方法。它使人们能够发现靠直觉不能悟察到的规律,进行准确的科学预测,这样的例子在经济学和人口学中已经不胜枚举了。

3.对变量关系进行深入分析,通过样本推论总体

近年来社会调查中比较广泛地采用了抽样调查和问卷调查方法,这些方法搜集来的资料绝大多数是数据资料。对这些资料的描述和分析需要采用与事实性的文字资料不同的技术,这就是统计分析技术。统计分析为深入描述和分析变量间关系,进而达到理论解释提供了十分有力的手段。在社会研究中,大量的社会调查是抽样调查,如何由样本资料推论到总体,成为抽样调查必须解决的一个问题。统计分析就提供了参数估计、假设检验等手段将样本推论到总体的方法,从而提高了社会研究的效率。因此,新的社会调查方法和技术都迫切要求运用统计分析的方法。

二、统计分析的特点

1.统计分析要以定性分析为基础

在定性分析的基础上进行统计分析是保证正确使用统计分析的必要条件。

这是因为:(1)统计分析是根据数据资料进行的,而社会调查中的数据不是抽象的数字而是反映了事物属性的统计指标。定性分析要为定量分析规定方向,划分范畴。(2)统计分析是依据一定公式计算的,公式的选择依赖于一定的理论知识、专业知识和必要的经验。事实上,在定量分析开始之前已经通过定性分析,从理论和经验上判明了事物之间的联系,决定了要采用的公式。

2.统计分析方法必须和其他分析方法结合运用

统计分析方法还必须和其他分析方法结合运用才能更好地发挥作用。其原因是:(1)数量关系只是客观事物存在的诸种关系中的一种,而不是全部。统计分析方法不是万能的,它有自身独特的长处,也有无法克服的局限性,它不能代替其他分析方法。(2)统计分析方法能够帮助发现社会现象中不易察觉的规律,但对规律的解释要借助于有关学科的理论。

3.统计分析有一套专门的方法和技术

统计分析有一套独特的方法和技术。统计学是对社会现象作定量研究和分析的科学武器;计算机技术是进行统计研究的技术工具;统计分析的数字成果是运用数字模型来描述、解释、预测社会现象。模型就是把实际问题提炼为数学问题,用适当的数字方程式表达出来。统计分析所使用的公式不是很复杂,但计算量很大,只有借助于计算机技术才能完成,所以进行统计分析要求掌握计算机技术①。

三、计算机技术的运用

1.计算机在社会研究中的作用

在社会调查研究中,定性分析与定量分析相结合的必要性和重要性越来越受到了人们的重视。电子计算机的产生及其在社会科学研究中的应用为定量分析开辟了广阔的前景。

电子计算机技术在社会科学研究和社会调查研究中得到日益广泛的运用这一事实说明,计算机在社会调查研究中已经或者正逐渐占据十分重要的地位,它已经或者正在成为社会调查研究的不可缺少的精确而有效的工具。

(1)对统计分析的作用

电子计算机对统计分析的作用主要体现在三个方面:第一,它能使复杂的定量分析得以实现。在手工操作的条件下,只能进行一些最简单的数据处理;较复杂的数据处理,如回归分析、聚类分析、因子分析等等,手工方式就无能为力。

而现代的社会调查,定量分析越来越趋复杂化,规模也越来越大,这只有在运用电子计算机技术的条件下才能实现。第二,它能极大地提高统计分析的效率。

电子计算机处理数据的效率是手工方式所无法比拟的。据我们对使用电子计算机和人工计算这两种方法对数量相同的用一种问卷所做的数据处理的效率的比较,即使是最简单的资料的频数分布的计算,使用电脑也要比手工操作至少快10倍以上。越是复杂,规模越大的数据处理,则计算机处理的效率越是明显。

第三,它能极大地提高统计分析的精确度。由于计算机处理数据都有经过精心设计的严格的程序,所以使用计算机处理数据能达到极高的精度。只要在使用过程中严格按照规定的程序执行,一般都能得到准确无误的统计结果。这在人工方式的条件下是难以做到的。

当然,电子计算机在社会调查中的上述作用也是相对的。它作为数据处理的工具是十分有效的,但它并不能对事物本身的性质作出判断。它并不能代替定性分析和人的思维加工。在调查研究过程中,只有将定性分析和思维加工与计算机的运用有机地结合起来,才能真正提高调查研究的效率和质量。

(2)对调查研究过程的影响

电子计算机在调查研究中的运用会对社会研究的过程产生很大的影响。这种影响不仅体现在运用电子计算机进行统计分析方面,而且体现在社会研究的整个过程中。电子计算机在社会研究中的运用对社会研究过程的各个环节提出了一些新要求。

第一,必须制定完整的指标和指标体系。电子计算机作为一种数据处理的工具,它不可能处理那些抽象的概念。所以,在社会调查的设计阶段必须将那些反映事物和现象的抽象概念转化为可进行测量的经验性指标和指标体系。因此,在使用计算机的条件下,调查指标的设计就成为必不可少的关键工作。

第二,一般应采用问卷调查法。在具体搜集材料的过程中,一般应使用问卷或类似问卷的调查表,而且问卷与调查表的设计应采取闭合式问题和先编码的形式。使用问卷和设计编码的形式可以将调查资料标准化与数字化,从而适宜于计算机处理。

第三,与以问卷搜集资料的形式相适应,调查方式主要是抽样调查。因为只有抽样调查,才能取得足够数量的数据资料,才能使对数据资料的处理具有统计学上的意义,从而才能使计算机的运用成为必要并且显示出它的优越性。

计算机的使用对社会研究过程的影响是多方面的。除了上面这些影响,在资料的整理过程中,使用计算机可以将数据资料直接输入计算机,从而可以省却繁琐的手工汇总工作;在使用计算机对数据资料进行统计分析的过程中,一些统计软件不仅能将统计结果快速地运算出来,而且能以统计表与统计图的形式显示出来,这就有利于调查资料的分析和调查成果的形成。也正因为计算机的使用,社会研究从设计到资料的搜集和整理整个过程,其规范性的要求也就更为严格。

(3)计算机运用的一般步骤

电子计算机在社会研究过程中的实际运用,主要体现在资料的统计分析方面。

在正式使用计算机对资料进行统计分析前,必须学会统计软件或软件包的使用方法。

用计算机进行数据处理有四个步骤。

第一步,是在计算机进入了统计程序的资料输入准备状态以后,将调查中所搜集到的原始资料输入计算机。输入的内容只能是各种资料的数字代码。如,在某份问卷的性别一栏中选择了“①男,②女”,于是就在计算机中输入代号“1”或“2”即可。输入的形式,必须将各份问卷的同一个资料的数字代码置于同一个纵行内,上下必须对齐。根据上述要求,将所有的资料都输入计算机,存入计算机的存储器内,等待调用。

第二步,将所输入的原始资料格式化。将各种原始资料的代号存储在数据文件中准确位置输入计算机,目的是便于计算机在执行统计指令时能够在特定的位置找到特定的资料的代号从而使数据的处理得以准确无误地进行。原始资料的格式化一般由两部分内容组成:一是变量名称,一般用简略的文字符号表示;二是该变量在数据文件中的位置,一般用数字表示。

第三步,解释变量。在对原始资料进行格式化的过程中,变量只是用简略的文字符号表示,为防止错误地理解或者看不懂简略的文字符号所代表的变量的意思,需对这些文字符号所代表的变量加以明确的说明,即将对所有主要变量的解释输入计算机。

第四步,在正确无误地完成了以上各步以后,就可以让计算机执行各种统计指令了。在执行其他统计指令之前,一般先要获得资料的频数分布,在此基础上再让计算机执行相关分析、回归分析等指令,从而获得大量精确的统计分析资料①。

2.SPSS/Win软件的运用

(1)SPSS简介

SPSS(StatisticalPackagefortheSocialScience——社会科学统计软件包)、SAS(StatisticalAnalysisSystem)和BMDP(BiomedicalComputerPrograms)号称世界上最着名的三大统计分析软件。SPSS虽然名为“社会科学统计软件包”,但适用于社会科学、自然科学的各个领域。该软件可以应用于经济学、管理学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域,尤其是在市场调查应用中。可以说,SPSS是数据处理和分析的利器。

自从1966年SPSS公司创建以来,SPSS软件至今已发展到SPSS18.0forWindows(以下简称SPSS/Win),目前的SPSS/Win是一个集数据整理、分析功能于一身的组合式软件包,它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项。由于它清晰、直观、易学易用,用户不需要精通统计分析的各种方法,就可以得到较满意的分析结果。因此,SPSS用户已遍布全球,在国内也逐渐流行起来。

(2)SPSS运作原理

虽然SPSS有多种不同的版本,操作方法亦不尽相同,但是在处理量化数据方面,均有着类似的程序与原则,包括数据定义、数据转换与数据分析三个主要的部分。兹说明如后:

①数据定义

数据定义(datadefinition)的目的,在使计算机能够正确辨认量化的数据,并对数据赋予正确的意义。主要的工作包含变量名称的指定(变量标签)、变量数值标签、变量的格式类型、遗漏值的设定。在视窗版SPSS中,数据的定义是以窗口对话框的方式来界定数据,使用者亦可利用语法文件来撰写SPSS数据定义语法,在一个档案中便可以界定所有的变量。

SPSS数据窗口中,数据定义的部分是以单独的工作表的形式呈现,性质与EXCEL数据库管理系统相似,将变量的各种属性的设定与修改,以类似“储存格”的方式来处理,增加了许多弹性与软件间的可兼容性。另一个优点是SPSS的数据定义与其他常用软件包的兼容性大幅增加,例如Excel工作表与Word文档当中的文字,可以直接复制、粘贴SPSS数据窗口当中变量的卷标与数值卷标,操作上更加简便。

在执行上,数据定义必须与编码表配合,将变量的名称与数据的意义加以适当的标注,并设定数据遗漏时的处理方式,方能使后续的数据处理与分析正确有效地进行。

此外,SPSS软件数据窗口所提供的各项编辑功能,可以将SPSS的数据库进行调整与编修,例如可将数据进行排序、切割、重组、合并,使得研究者辛苦获得的研究数据可以恰当地得以保存。不过在进行这些整理动作时,需注意各步骤是否正确操作,否则很可能产生错误,造成数据的损毁。