56
1 模模模 模模模模模模模模模模

模块四 抽样方案的设计及实务

  • Upload
    lelia

  • View
    113

  • Download
    0

Embed Size (px)

DESCRIPTION

模块四 抽样方案的设计及实务. 授课安排表( 10 学时). 一、教学目标 1. 知识目标:了解抽样调查的含义、意义和程序,掌握各种类型概率抽样技术和非概率抽样的类型和优缺点,学会抽样误差的分析及计算。 2. 能力目标:培养学习团队合作为各种类型项目选择一种合适的抽样设计方案能力。 3. 技能目标:培养学生如何在实际项目中选择一种合适的抽样设计方案。. 导入案例一:. W 市移动通信公司近期销售业绩平平,而远没有竞争对手联通公司好。他们便对客户实施了一次市场调查,希望能找出原因,提高公司业绩。 - PowerPoint PPT Presentation

Citation preview

Page 1: 模块四   抽样方案的设计及实务

1

模块四 抽样方案的设计及实务

Page 2: 模块四   抽样方案的设计及实务

2

学习任务名称 学习内容及课时安排 活动内容 总学时一、抽样调查概述 学习任务:

(一)抽样调查的含义、意义和程序。(二)概率抽样的原理。

理论教学多媒体教学启发式教学案例分析小组讨论

1

二、抽样调查类型 学习任务:(一)概率抽样方法1、简单随机抽样2、系统抽样3、分层抽样4、整群抽样5、多段抽样(二)非概率抽样方法1、偶遇抽样2、判断抽样3、定额抽样4、雪球抽样

3

三、抽样程序 学习任务一:一、界定总体二、制定抽样框三、决定抽样方案四、实际抽取样本五、评估样本质量

2

工作任务驱动的项目式教学

学习任务二:以小组为单位指导学生制作抽样方案。 项目式实训教学

2

学习任三:对小组成员进行抽样的选择和培训。 2

授课安排表( 10 学时)

Page 3: 模块四   抽样方案的设计及实务

3

一、教学目标 1. 知识目标:了解抽样调查的含义、意义和程序,掌握各种类型概率抽样技术和非概率抽样的类型和优缺点,学会抽样误差的分析及计算。

2. 能力目标:培养学习团队合作为各种类型项目选择一种合适的抽样设计方案能力。

3. 技能目标:培养学生如何在实际项目中选择一种合适的抽样设计方案。

Page 4: 模块四   抽样方案的设计及实务

4

导入案例一:导入案例一:

W 市移动通信公司近期销售业绩平平,而远没有竞争对手联通公司好。他们便对客户实施了一次市场调查,希望能找出原因,提高公司业绩。

为了减少成本,公司员工自己实施了调查,他们对公司周围的人及自己的亲朋好友进行了移动公司知名度、美誉度的调查。结果发现,移动公司的知名度和美誉度都远比竞争对手高。

公司营销部经理对此百思不得其解。 移动公司的这种调查结果可信吗?

Page 5: 模块四   抽样方案的设计及实务

5

导入案例二:导入案例二:

W 市移动通信公司近期销售业绩平平,而远没有竞争对手联通公司好。他们便对客户实施了一次市场调查,希望能找出原因,提高公司业绩。

为了减少成本,公司员工自己实施了调查,他们对公司周围的人及自己的亲朋好友进行了移动公司知名度、美誉度的调查。结果发现,移动公司的知名度和美誉度都远比竞争对手高。

公司营销部经理对此百思不得其解。 移动公司的这种调查结果可信吗?

Page 6: 模块四   抽样方案的设计及实务

6

学习任务: 学习任务一:通过课堂教学学习如何进行

抽样和对抽样过程进行管理。 学习任务二:以小组为单位指导学生制作

抽样方案。并对问卷进行试调查。 学习任务三:对小组成员进行抽样的选择

和培训。

Page 7: 模块四   抽样方案的设计及实务

7

一、抽样

( 一 )抽样的相关概念1、总体 总体是构成它的所有元素的集合。 元素则是构成总体的最基本单位。 一个总体中所包含的元素数目常用大写

字母 N表示。

Page 8: 模块四   抽样方案的设计及实务

8

2 、样本 就是从总体中按一定方式抽取出的一

部分元素的集合。样本中的元素数目通常用小写字母 n表示。

3 、抽样 指的是从组成某个总体的所有元素的

集合中,按一定的方式选择或抽取一部分元素(总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。

Page 9: 模块四   抽样方案的设计及实务

9

4 、抽样单位 就是一次直接的抽样所使用的

基本单位。 5 、抽样框 又称作抽样范围,指的是一次

直接抽样时总体中所有抽样单位的名单。

Page 10: 模块四   抽样方案的设计及实务

10

6 、参数值 也称为总体值,它是关于总体中某一变

量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。在统计中,最常见的参数值是总体某一变量的平均数。

7 、统计值 也称为样本值,它是关于样本中某一变

量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。统计值是从样本中计算出来的,它是相应的参数值的估计量。

Page 11: 模块四   抽样方案的设计及实务

11

8 、置信度 又称为置信水平,它指的是总体参

数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。

9 、置信区间 它是指在一定的置信度下,样本统

计值与总体参数值之间的误差范围。置信区间反映的是抽样的精确性程度。

Page 12: 模块四   抽样方案的设计及实务

12

( 二 )抽样的作用 向人们提供一种实现“由部分认识

总体”这一目标的途径和手段。1、有利于调研项目的顺利开展和进行 2、有利于提高调研工作的速度和效率 3、有利于降低调研成本 4、有利于提高调查结果的准确性

Page 13: 模块四   抽样方案的设计及实务

13

(三)抽样的类型 根据抽取对象的具体方式,抽样

被分为: 概率抽样:按照等概率原则进行的抽

样 ,避免人为误差,保证样本的代表性 。

非概率抽样:依据研究者的主观意愿、判断或是否方便等因素来抽取对象 。往往产生较大的误差,难以保证样本的代表性。

Page 14: 模块四   抽样方案的设计及实务

14

里根 蒙代尔

《时代》 / 《扬基拉维齐》 64 36

《今日美国》 / 《黑蛇发女怪》 63 37

哥伦比亚广播公司 / 《纽约时代周刊》 61 39

盖洛普民意测验 59 41

实际投票结果 59 41

盖洛普民间测验 / 《新闻周刊》 59 41

美国广播公司 / 《华盛顿邮报》 57 43

哈里斯民意测验 56 44

罗珀民意测验 55 45

1984 年美国总统选举预测与实际结果比较( % )

Page 15: 模块四   抽样方案的设计及实务

15

二、概率抽样的原理与程序

1 、概率抽样的基本原理 抽样的最终目的在于通过对样本统计值的描述来勾画出总体的面貌

其原理就在于它能够很好地按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。

Page 16: 模块四   抽样方案的设计及实务

16

2 、抽样的一般程序 (1)界定总体 就是在具体抽样前,首先对从中抽取样本的总体范围与界限作明确的界定。

( 2)制定抽样框 这一步骤任务就是依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框。

Page 17: 模块四   抽样方案的设计及实务

17

总统选举投票前,《文摘》杂志通过电话号码薄和汽车登记簿寄出 10000 万张询问投票倾向的明信片,然后依据收回的 200 万份调查结果极其自信地预测共和党候选人兰登将以领先 15%的得票率战胜民主党候选人罗斯福而当选总统。然而,选举结果使预测者们大失所望;获胜者不是兰登,而是罗斯福。并且其得票率反超过兰登 20% !《文摘》杂志的声誉一扫而光,不久就因此而关了门。

是什么原因导致《文摘》杂志的预测失败了呢?

[ 案例 ]1936 年美国总统大选的民意测验

Page 18: 模块四   抽样方案的设计及实务

18

( 3)决定抽样方案 我们应根据不同研究目的、不同调查范围、不同调查对象、不同抽样方法特点及其他有关因素来决定具体采用哪种抽样方法。

( 4)实际抽取样本 既可以先抽好样本,再下去直接对预先抽好的调查对象进行调查,也可以一边抽取样本,一边就开始调查。

Page 19: 模块四   抽样方案的设计及实务

19

( 5 )评估样本质量

样本评估 :就是对样本的质量、代表性、偏差等等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致调查的失误。

评估样本的基本方法是:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很少,则可认为样本的质量较高,代表性较大;反之,若二者之间差别十分明显,那么样本的质量和代表性就一定不会很高。

Page 20: 模块四   抽样方案的设计及实务

20

三、概述抽样方法

(一)概率抽样的概念及特点: 是按照等概率原理从调研总体中抽取一定数目的样本单位进行调查,以其结果推断总体的一种调研方式。其特点有:

1 、从全部调研总体中只抽取一部分单位进行调研。 2 、从总体中抽出来的部分单位,是按随机原则抽取的。

3 、以样本值推断总体值,并可计算出抽样推断产生的误差大小,也可在调研之前将其误差控制在一定范围之内。

4 、它是一种侧重于定量分析的调研方式。

Page 21: 模块四   抽样方案的设计及实务

21

( 二 ) 概率抽样调研的适用范围

1 、总体范围大、单位数目多,不必要进行全面调研的情况。

2 、某些调研对象总体为无限总体,无法进行全面调研。

3 、调研对象总体虽非无限总体,但不可能(或不允许)进行全面调研。

4 、对全面调研统计资料的质量进行检查与修正。

Page 22: 模块四   抽样方案的设计及实务

22

(三)概率抽样的类型

1 、简单随机抽样 它又称纯随机抽样,是概率抽样的

最基本形式。在总体中不进行任何有目的的选择,而是按照随机的原则、纯粹偶然的方法抽取样本。

常用的办法:抽签法和乱数表法。 特点 :简单、方便,但只适合规模小的样

本 .

Page 23: 模块四   抽样方案的设计及实务

23

案例案例 某居民区有某居民区有 620620 户居民,抽取户居民,抽取 1515 户调户调

查其家庭收入。查其家庭收入。

2828 4646 5353 3355 7474 9292 1133 45452020 6767 4242 1155 2020 5757 8800 90900404 3636 2828 1199 2626 6464 3377 15155555 0101 2626 6644 9898 5656 7711 49497272 5858 4343 5577 8989 6464 2277 5454

Page 24: 模块四   抽样方案的设计及实务

24

2 、系统抽样 又称为等距抽样、机械抽样或间隔抽样,是运用等距离抽样技术抽样,先在总体中按一定标志把个体顺序排列,并根据总体单位数和样本单位数计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位。

排列顺序可用与调查项目有关的标志为依据,如在购买力调查中,按收入多少由低至高排列,也可用与调查项目无关的标志为依据,如按户口册、姓名比划的排列。

Page 25: 模块四   抽样方案的设计及实务

25

系统抽样的具体步骤是: ( 1)给总体中的每一个个体按顺序编上号码,即制定出抽样框,这与简单随机抽样的作法一样;

( 2)计算出抽样间距,方法是用总体的规模除以样本的规模。假设总体规模为 N,样本规模为 n,那么抽样间距 K就由下列公式求得 K=N/n

(3) 在最前面的 K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为 A),它称作随机的起点;

( 4)在抽样框中,自 A开始,每隔 K个个体抽取一个个体。即所抽取个体的编号分别为 A,A+K,A+2K,…,A+(n-1)K;

( 5)将这 n个个体合起来,就构成了该总体的一个样本。

Page 26: 模块四   抽样方案的设计及实务

26

[ 案例 ]

要在一个村的 110户农民中,用等距抽样方法抽 10%的农户进行家庭收支情况调研,具体做法是:

若按无关标志排队等距抽样,其做法只要根据村民户的花名册,用该村的全部村民户数除以预定的户数,即 110/11=10,计算出抽样距离,然后每隔一个距离即 10户抽 1户进行调查。抽取调研单位的起点,可以从第一组 1号到 10号中随机抽出某号,譬如以 7号为第一个调查单位,则这 11个调查户应为第 7 户、第 17 户、第 27 户、…第 107 户。

Page 27: 模块四   抽样方案的设计及实务

27

使用系统抽样方法 , 应注意下列两种情况:

一是总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况。

二是总体名单上,个体的排列上有与抽样间隔相对应的周期性分布的情况。

特点:方法简单,且能使样本均匀地分散在调查总体中,增加了样本的代表性。适用于大规模调查。

Page 28: 模块四   抽样方案的设计及实务

28

3 、分层抽样

又称类型抽样,它是先将总体的所有单位某种特征或标志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

Page 29: 模块四   抽样方案的设计及实务

29

层次 N1

层次 N2

层次 Nn

抽样 n1

抽样 n2

抽样 nm

样本数n= n1+n2

+…+nm

总体 N=N1+N2+ …+Nn

Page 30: 模块四   抽样方案的设计及实务

30

分类 随机抽样

总体

样本子群

分层抽样图示分层抽样图示

Page 31: 模块四   抽样方案的设计及实务

31

( 1)分层抽样方法的优点

1 )分层抽样可以在不增加样本规模的前提下降低抽样误差,提高抽样的精度。因为采用分层抽样的最基本目的,是把异质性较强的总体分成一个个同质性较强的子总体,可以提高抽样效率,获得更好的抽样效果。

2 )便于对总体中不同的层次或类别进行单独研究,或者进行比较。

Page 32: 模块四   抽样方案的设计及实务

32

( 2)在实际运用分层抽样的方法时,还需要考虑下列两个方面的问题:

1 )分层的标准问题,通常采用的原则如下: A、以调查所要分析和研究的主要变量或相

关的变量作为分层的标准。 B、以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。

C、以那些已有明显层次区分的变量作为分层变量。

Page 33: 模块四   抽样方案的设计及实务

33

2) 分层的比例问题

分层抽样中有按比例和不按比例分层两种方法 按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法 ( 等比例分层抽样 )

每层抽取样本数计算公式为: Sⅰ=(Nⅰ/N) ×S 式中: Sⅰ表示第ⅰ层应抽取的样本数; N 表示总体中含单位总数; Nⅰ表示第ⅰ层含单位总数; S表示应抽取样本总数。

Page 34: 模块四   抽样方案的设计及实务

34

[案例 ]

某省有 1800个乡,其中山区 540个,丘陵 360个,平原 720个,滨海 180个,现要从中抽 270个乡来进行农村经济调研,问如何确定各层调查乡数?

Sⅰ(山区) =( 540/1800)×270=81 个 Sⅰ(丘陵) =( 360/1800)×270=54 个 Sⅰ(平原) =( 720/1800)×270=108 个 Sⅰ(滨海) =( 180/1800)×270=27 个

Page 35: 模块四   抽样方案的设计及实务

35

4 、整群抽样

将调研的总体按一定的标准(如地区、单位)分为若干群,然后在其中随机抽取部分单位进行普查的方法。

整群抽样与分层抽样的区别: (1) 分层抽样强调各层彼此之间差异明显,且层内差异很小;而分群抽样强调各群彼此差异不大,而每群内部差异明显。

(2) 分层抽样每层都要按一定数目抽取样本,而分群抽样是抽总群中的若干群,抽出的群全部为样本。

Page 36: 模块四   抽样方案的设计及实务

36

母群体总数

集群二

集群一

集群三

集群四

集群五

集群七

集群六

集群八

… 集群 n

集群一

集群三

集群 m

母群体共分成 n 个集群 共抽取 m 个集群

Page 37: 模块四   抽样方案的设计及实务

37

划分子群

随机抽样

Page 38: 模块四   抽样方案的设计及实务

38

5 、多段抽样

又称多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。

多段抽样具体做法是: 先从总体中随机抽取若干大群,然后再从这几个大群内抽取几个小群,这样一层层抽下来,直至抽到最基本的抽样元素为止。

Page 39: 模块四   抽样方案的设计及实务

39

案例案例尼尔森全国零研 99 ’

山东

济南 烟台 威海 荣成 蓬莱 …

威海 枣庄济宁蓬莱

商店普查

… 广东

全国 31 个省市区

山西 河北第一阶段

第二阶段

Page 40: 模块四   抽样方案的设计及实务

40

如何确定每一级抽样的单位数目?

需要考虑三大因素: 一是各个抽样阶段中子总体同质性程度;二是各层子总体的人数;

三是研究者的所拥有的人力和经费。 同等条件下减少多段抽样误差的方法是: 相对增加开头阶段的样本数而适当减少最后阶段的样本数。

Page 41: 模块四   抽样方案的设计及实务

41

各种抽样方法优缺点比较

优点 缺点简单随机抽样 简单易行。 总体数量小;构成总体的

元素之间差异较小。

系统抽样 样本在总体中的分布较为均匀。

总体的排列不能有周期性规律。

分层抽样 层间区别大,层内区别小; 层间的差别不影响到抽样的误差。

必须对总体情况较为了解。

整群抽样 抽样面较广、涉及层次较多,对总体情况不了解的情况。

在群内差异小,群间差异大的情况下,整群抽样的抽样误差较大。

阶段抽样 总体单位多,分布面广,而且单位之间差异较大的情况。

每段抽样都会产生误差,经过分段抽样得到的样本的抽样误差较大 。

Page 42: 模块四   抽样方案的设计及实务

42

练习题:

某市有 300所小学,共 240000名学生。这些小学分布在全市 5个行政区中。其中重点小学有 30所,一般小学有 240所,较差的小学有 30所。现要从全市小学生中抽取 1200名学生进行调查,以了解全市小学生的学习情况。请设计一种抽样方案。

Page 43: 模块四   抽样方案的设计及实务

43

万科青年群体居住形态研究 房地产市场已经开始从产品导向思维明显地向顾客导向诉求的方向不断地变化着,万科作为世界最大的房地产商和中国房地产市场的领头羊,更加关注顾客对于住房的细微需求,对已经置业人群在居住形态和使用房屋的行为习惯进行研究,无疑可以增进武汉万科未来项目产品设计的针对性。

Page 44: 模块四   抽样方案的设计及实务

44

三、非概率抽样方法 从调研对象总体中按调研者主观设定的某个标准抽取样本单位的调研方式。

Page 45: 模块四   抽样方案的设计及实务

45

1 、偶遇抽样

它又称作方便抽样或自然抽样。是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。特点: 针对性强 -快捷节省 -误差难估 适用范围:

探测性调查 总体同质性强 街头拦截式面访调查

Page 46: 模块四   抽样方案的设计及实务

46

2 、判断抽样

又称立意抽样,研究人员凭主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象 方法:

•专家判断 •标准样本

特点:简单快捷用途:多用于总体规模小、调查所涉及的范围较窄或调查时间、人力等条件有限而难以进行大规模抽样的情况。

Page 47: 模块四   抽样方案的设计及实务

47

3 、定额抽样 又称为配额抽样,是按照一定标准,分配样本数额,并在规定数额内由调查人员任意抽选样本的方法。

具体做法是: 研究者要尽可能地依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例。然后依据这种划分以及各类成员的比例去选择调查对象,使样本中的成员在上述各种因素、各种特征方面的构成和在样本的比例尽量接近总体的情形。

Page 48: 模块四   抽样方案的设计及实务

48

案 例

假设某高校有 2000名学生,其中男生占 60%,女生占 40% ;文科学生和理科学生各占 50% ;一年级学生占40%、二年级、三年级、四年级学生分别占 30%、 20%和 10%。现要用定额抽样方法依上述三个变数抽取一个规模为 100人的样本。

Page 49: 模块四   抽样方案的设计及实务

49

男 生 ( 60人)

女 生 ( 40人)

文科( 30人)

理科( 30人)

文科( 20人)

理科( 20人)

年级 一 二三四 一 二 三四 一二三四 一二三四

人数 12 9 6 3

12 9 6 3 8 6 4 2 8 6 4 2

100个人的定额样本分布表

Page 50: 模块四   抽样方案的设计及实务

50

定额抽样与分层抽样的区别 一、抽取方法不同 分层抽样依据概率原则到各层中进行抽样;而定额抽样则是通过主观的分析来确定和选择组成这种模拟物的成员。

二、目的不同 定额抽样注重样本与总体在结构比例上的表面上的一致性;而分层抽样进行分层,一方面是要提高各层间的异质性与同层中的同质性,另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减少。

Page 51: 模块四   抽样方案的设计及实务

51

4 、雪球抽样

它是以“滚雪球”的方式,通过使用初始被调查者的推荐来挑选和获得其他调查样本的抽样程序。定义:先随机选取一组调查对象,对他们调查后,根据他们提供的信息选择下一个调查对象

特点:有针对性 -样本间有联系 适用范围:特殊消费群体 案例:生态旅游调查

Page 52: 模块四   抽样方案的设计及实务

52

五、样本规模与抽样误差

(一)、抽样误差:抽样的统计值与总体的参数值之间的差别。如样本平均值与总体平均值之间的关系。

抽样调查中的误差有两个来源: 1 、由于抽样方法本身的随机性造成的样本

统计值与总体平均值之间的差别,也称为随机误差,这种误差是不可避免的;

2 、由于调查员工作失误造成的误差,也称为非抽样误差,能够通过提高调查员的工作责任感减少非抽样误差。

Page 53: 模块四   抽样方案的设计及实务

53

(二)样本规模:也称为样本量的大小。 确定样本规模的考虑因素: 1 、总体的规模。 2 、异质性:异质性越大,样本量越

大。 3 、准确程度:样本统计值接近总体参数值的程度。准确度要求越高,样本量越大。

4 、抽样方法:不同的抽样方法要求有不同的样本量。

Page 54: 模块四   抽样方案的设计及实务

54

在市场调研中的样本规模至少不能少于100个个案,但通常样本规模限制在 2000个个案之内。

Page 55: 模块四   抽样方案的设计及实务

55

抽样误差与样本规模

总体规模

100人以下

100-1000人

1000-5000人

5000-10000 人

10000-10万

10万人以上

抽样比例

50%以上

50%-20%

30%-10%

15%-3%

5%-1%

1% 以下

计算得出的样本量只是一个参考,对于不同的总体大小,有经验值作参考:

Page 56: 模块四   抽样方案的设计及实务

56

5 、分析类别:调查项目越多,样本量越大。如果样本量太少而调查项目又很多会造成许多项目的样本量太小而无法分析。

6 、客观条件:样本量越大,所需财力、物力和人力越多,应根据客观条件考虑样本量。

7 、样本量的大小还可以根据所能容许的误差大小确定。