中国智囊风云榜 首页 > 市场调研 > 研究方法 > 正文 返回 打印

开口组平均值计算方法的探讨

2007-07-20 08:58:57   报告业务: 010-65667912

在市场调查过程中,我们经常用划分区间的方法来把调查对象进行分类。而在划分区间的时 候,我们又经常需要用到开口组,如测量月收入时用到的“500元以下”、“50000元以上”等等。这种分组测量的方法决定了在后期的数据处 理与分析过程中,特别是在求取样本均值时,我们需要计算每一区间的平均值。譬如,下表是我们为K市某传播媒体做调查时对样本的月收入所 做的统计。如果我们想了解一下K市的平均月收入情况,我们首先必须计算出每一区间的平均值,然后进行加权平均。

K市居民月收入情况

<><><>  对于封闭组,如“1000―1500元”,其均值的计算是相当简单的,取该组组中值(=(该组上限+ 该组下限)/2)就可以了。如“1000―1500元”组的均值即为:(1500+1000)/2=1250元。
  但是,对于开口组,如“500元以下”,由于缺乏组下限或者组上限,其均值计算又该如何进行呢?
  传统的统计学方法是采用开口组组限加(减)邻组组距的一半来作为开口组的平均值,即:开口组的均值=该组上限(下限)-(+)( 邻组组距)/2。如上例中月收入在“500元以下”的开口组的平均月收入就为:
  (500-(1000-500)/2)=250(元)
  上述做法实际上是将开口组当作封闭组来处理,如“500元以下”实际上是看作“0―500元”。显然,这种处理方法隐含了两个假设前 提:其一是(0,500)间的任一值均有可能被取到,换句话说承认月收入为100元甚至0元的人(户)存在;其二是该组内人的月收入在该区间 均匀分布。
  对于第二点,我们往往没有什么异议,这是分组处理的一个必要前提。但是对于第一点却值得商榷。因为对于月收入这类的变量来说 ,由于最低生活水平的限制,它肯定存在一个下限值,而往往不可能完全分布于整个区间,同时对于该类区间而言均匀分布的假设也具有更大 的“失真性”。所以,采用传统方法得到的均值比较粗糙,效果难以令人满意。那么,我们能否采用其它方法来计算呢?
  实际中,我们采用了一种“直线外推法”来估算这类开口组的均值。这种方法的一个假设是:相邻组的中点是按同一斜率下降的。从 下图中我们可以看出,尽管相邻组的中点的连线的斜率有所变化,但这种变化还是可以接受的,所以,我们可以用相邻组的斜率来近似地估算 开口组平均值。下面我们将用两种方法计算的平均值作一对比。
  用相邻组的中点连线的斜率进行“直线外推法”计算的结果为:

  与传统方法的250元相比,参照K市的实际生活水平,显然这一均值更为实际、 合理一些。

  另外,如果我们想进一步对计算结果作一横向比较,譬如,我们想比较一下不 同城市月收入最低的这一群体的平均水平的话,那么,用相邻区间跨度的一半计算的结果就无法满足我们的要求,因为计算的结果只与区间划 分的标准有关,只要各城市的划分标准相同,那么,这一群体的平均水平也就完全一样,显然,这是不符合实际情况的。而用相邻区间的中点 连线的斜率所求的结果就可以满足这一需要,因为用这种方法计算所得的结果不仅与区间划分标准有关,而且还与该子群出现的频数有关。因 为在计算过程中,它比另外一种方法包含了更多的信息,因而它的结果也就很自然的继承了这些信息。所以,从数据的信息含量的角度来看, 用“直线外推法”计算的结果要优于用相邻区间跨度的一半计算的结果。
   当然,这一方法在理论意义上还有待探讨,其实际应用也有诸多的限制。但作为一种对传统方法的改良或者突破,这种方法在一定的 条件下还是具有其自身的意义和应用价值的!



/shichangdiaoyan/diaoyanfangfa/2007-07-20/102.html
关于我们 | 网站声明 | 网站地图 | | 中国智囊风云榜版权所有 京ICP证 06054752号