对于调查问卷的评估主要从信度和效度两个方面着手:
一、问卷的信度
信度即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。具体评价方法有:
1、重复检验法。同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间进行两次测量。两次测量相距一般在两到四周之内。用两次测量结果间的相关分析或差异的显著性检验方法,评价量表信度的高低。
2、交错法。用两个不同形式的等价问卷,对同一组受访者在不同的时间(通常间隔两到四周)进行测量。两次测量结果间的相关性被用来评价问卷的信度。
3、折半法。折半法是将上述两份问卷合成一份问卷(通常要求这两份问卷的问题数目相等),每一份作为一部分,然后考察这两个部分的测量结果之间的相关性。
二、问卷的效度
效度是指问卷正确测量研究者所要测量的变量的程度。检验效度的主要指标和方法有:表面效度、准则效度、架构效度。
1、表面效度(Face Validity)。也称为内容效度或逻辑效度,指的是测量的内容与测量目标之间是否适合,也可以说是指测量所选择的项目是否“看起来”符合测量的目的和要求。主要依据调查设计人员的主观判断。
2、准则效度(Criterion Validity)。准则效度是指量表所得到的数据和其他被选择的变量(准则变量)的值相比是否有意义。根据时间跨度的不同,准则效度可分为同时效度和预测效度。
3、建构效度(Construct Validity)。最关心的问题是:量表实际测量的是哪些特征?在评价建构效度时,调研人员要试图解释“量表为什么有效”这一理论问题以及考虑从这一理论问题中能得出什么推论。建构效度包括同质效度、异质效度和语意逻辑效度。
同质效度是指量表测量同一特征的其他测量方法相互关联的程度。异质效度是指量表和测不同特征的测量方法不同但理论上有关特征的测量方法之间相互关联的程度。建构效度指测量工具所能测量到的理论概念的程度,也就是说若将测量工具所得的结果与相同理论下的其他概念相比较,当二者有某种预期的相关性时,就表示这种测量工具具有某种程度的架构效度。
一般来说,问卷调查容易产生误差的原因,来自研究者的因素包括:测量内容不当、情景以及研究者本身的疏忽。来自受访者的因素则可能是由于其年龄、性格、教育程度、社会阶层等,而影响其答题的正确性。研究者透过信度与效度的检验,可以了解问卷本身是否优良,以作为改变修正的根据,避免做出错误的判断。
对于一名科研人员来说,如何成长和发展?如何能够不断推陈出新,逐渐形成自己独特而系统的思想?这里面问题意识是比较重要而关键的。
问题意识形成的首要条件是你要对一切的现象充满着好奇感和浓厚的兴趣,具有较强的观察能力。比如当你下到相关的实践场所时,观察到一定的现象和问题,如:课堂上教师为什么会像是在表演一样?为什么教师在上面兴趣盎然,而下面总有某些学生兴趣索然?就要积极展开一定的思考,多问几个为什么,并结合自己所学的相关教育教学理论,追问一下怎么才会更好?
其次是要具有强调的信息意识。信息资源是得以形成有价值问题的依据,除了实践观察中获得鲜活的感性信息之外,丰富的理论资源也是形成问题的关键。对于确定领域的古今中外所有的研究成果,包括最新的一些提法等都要积累到脑子中,并按照优化的结构将其组织起来,内化于心。对于已有的问题,要学会换一个角度去多多思考,另外也要善于发掘新的尚未研究或还未足够清楚的问题,并及时将这样一些问题作以记录。
再就是要学会思考,包括思考的方法、角度等等。只有能思考并善于思考的人才会一语中的地提出有意义的问题,并能够给出有效解决问题的清晰思路。
在做科研的过程中,随时随处遇到问题及时作以深入思考,相信会有大收获的。
基本的抽样方法主要有两大类:一类是在目标总体中,有意识地选择若干有代表性的单位为样本进行调查研究。这种抽样叫做目标抽样或主观抽样。
目标抽样的方法适用于典型调查或研究。它的特点是作为样本的各单位的代表性,都是由与该研究课题有关的专家来判断和决定的。其结果的可靠性和精确度叶必须依靠这方面的专家来判断和评价。采用目标抽样,可以对总体的有关特性作出推论,也可以对研究所涉及的有关因素加以适当考虑。也可以使已知的样本单位的某些信息在取样时发挥作用。这些都是目标抽样的优点。此外,采用目标抽样在数据收集方面比较方便。但采用目标抽样时,目标总体中各成员被抽取为样本的概率不能用客观方法来计算,因此抽样的误差和精度就无法用客观方法加以评价,这是目标抽样的最大缺点。
另一类是按照随即的原则,从构成目标总体的各成员中抽取样本,叫做随即抽样和概率抽样。随机抽样的最大优点是可以借助概率客观地计算调查结果的可靠性和精确度。而且可以根据实际条件和所要求的精度确定样本的大小。所以在教育科学研究尤其是大规模的评价研究中,应充分了解随机抽样的意义。
简单随机抽样(简称SRS)是随机抽样中最简单而又是最基本的一种。它的特点是采用随机数码表或抽签的办法确定样本,因此各总体成员都保证有相等的抽取概率。
如果抽取的样本数量很大,使用纯粹的简单随机抽样会有很多困难,因此常常可以采用机械随机抽样来代替。
采用简单(或机械)随机抽样的好处是,可以根据概率理论来客观地估计抽样误差的大小。
为了克服简单(机械)随机抽样的困难,另一个可行办法是采用整群抽样法。所谓整群抽样法,是将构成目标总体的若干成员集合在一起成为一个整群,并以这个整群作为抽取单位,然后抽取。
就整群分类的层次而言,又可以分为一阶整群抽样、二阶整群抽样,甚至是多阶整群抽样。
另外,还有一种分层抽样。按照某个标志将目标总体中的各个成员分成互不混淆的组,然后在各个组中再按照随机的原则抽取样本。如果按照是否采用比率来进行抽样,又可以分为比率分层抽样、非比率分层抽样。除了这些之外,还有非等概率和二相抽样法。
简单随机抽样
一般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的具体方法有抽签法和随机数表法。
抽签法是把总体中的每一个个体都编上号并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。
随机数表法。所谓随机数表法,是由一些任务的数毫无规律地排列而成的数表。使用很方便,从表中任一位置开始,依次往下找足你所需要的随机数,以这些随机数位编号的个体即组成一个样本。在查找数字时,有两点要注意,一是总体容量是几位数,你就在开始那个位置找相应位数的数。如总体容量位1000,你可以在表中任一位置找一个三位数,并依次往下找;二是找到的数字超过总体的容量范围,你可以不管这个数并再往下找,比如总体容量为500,而你从表中往下数的时候,你见到了678这个数,可以不管它,再往下找直到找到一个小于或等于500的数为止。
这两种方法都是针对有限总体的。
简单随机抽样从理论上说是最符合随机性原则,但是这种方法再实际应用时,存在着一些不足:首先,对大总体进行编号是相当困难的;其次,由于完全采用随机性,实际抽取的那一个样本可能不具备总体本应该有的一些特性。
另外,对于大总体在制签或查表时都是相当困难的。对于已有顺序编号的大总体,实际当中常常采用等距抽样来简洁地实现。等距抽样也称系统抽样,实际是在一个范围内按抽样比例(样本容量于总体容量之比)进行简单随机抽样,再将这个样本扩张到整个总体。
分层随机抽样
分层抽样是事先按总体已有的某些特征,将总体分成几个不同的部分,每一部分就叫一层,再分别在每一层中随机抽样。这种方法充分利用了总体的已有信息,因而是一种非常实用的抽样方法。
对于一个总体如何分层,分多少曾,要视具体情况而定。一个总的原则是,各层内个体在该特征上的差异要少,而层与层之间的差异要越大越好。比如说,对大学生课按其学校是属于一流大学、重点大学、一般大学来分层。对于复杂问题还可以按几个分层标准来分层。如韦克斯勒幼儿智力量表在制定常模时,就按年龄、性别、种族、地区、家长职业和城市农村等六个因素来分层,使得样本中各种搭配下的人数比例都与总体尽量接近。
分层抽样在具体实施时,又根据是否知道各层内标准差分成两种办法:
按各层人数比例分配。这是在各层内标准差不知道时的分配方式,即让样本中各层人数的比例与总体中各层人数的比例相同。
最佳分配。这是在已知各层内标准差时的分配方式,它是按标准差大小和总体中各层人数比例共同来确定最终样本中各层人数的比例。先确定各层内的抽取人数,每层内的抽取可采用简单随机抽样法进行。
两阶段随机抽样
两阶段抽样也称为分群抽样,首先是将总体分成若干群,从中随机选出一些群,这是第一阶段抽样。再从被选出的群中进行随机抽样,这是第二阶段抽样。这里分群的原则正好和分层抽样中分层的原则相反,这里要求各群内个体之间的差异尽量地大,而各个群之间就没有多大的差异。比如要进行一个全国范围内生活消费方面的调查,可以按大城市进行分群,显然各大城市内的居民千差万别,而各个城市之间则相差无几,因此不必选取所有的大城市,可以只从中选择一部分,然后再在这些城市进行抽样。
在一个复杂的抽样设计中,往往可能将分层抽样和分群抽样反复应用,最终才得到所要的样本。如上面的例子中,要在一个大城市里选取一部分居民,也不是件容易的事,这时可再分群或分层,直到便于抽样时为止。