34
社社 社社社社社社社社社社社社 —— 社“ 2002 社社社社社社社社社社社”社社 社社社社社社社社社社 社社社 [email protected]

社会统计在中国职工研究中的应用

Embed Size (px)

DESCRIPTION

社会统计在中国职工研究中的应用. —— 以“ 2002 年职工队伍状况调查数据”为例. 中国人民大学社会学系 冯仕政 [email protected]. 统计应用的三个内容. 统计知识的应用 统计软件的应用 应用统计软件(统计 + 软件)协助社会科学分析. 第一步:研究什么问题?. 在理论兴趣与社会现实的不断交锋中,不断明确 所要 研究、 所能 研究的问题 理论兴趣: 个人的社会认知或专业兴趣 有关组织或个人的指示、任务和委托 社会现实: 鲜活的生活事实 已获取和能获取的档案、数据和其他资料. 我 想 研究:中国工人的 “ 阶级意识 ”. - PowerPoint PPT Presentation

Citation preview

Page 1: 社会统计在中国职工研究中的应用

社会统计在中国职工研究中的应用

——以“ 2002年职工队伍状况调查数据”为例

中国人民大学社会学系 冯仕政

[email protected]

Page 2: 社会统计在中国职工研究中的应用

统计应用的三个内容 统计知识的应用 统计软件的应用 应用统计软件(统计 + 软件)协助社会科

学分析

Page 3: 社会统计在中国职工研究中的应用

第一步:研究什么问题? 在理论兴趣与社会现实的不断交锋中,不断明

确所要研究、所能研究的问题 理论兴趣:

个人的社会认知或专业兴趣 有关组织或个人的指示、任务和委托

社会现实: 鲜活的生活事实 已获取和能获取的档案、数据和其他资料

Page 4: 社会统计在中国职工研究中的应用

我想想研究:中国工人的“阶级意识” 基于社会感知:因就业、失业和下岗所引发

的社会冲突越来越频繁、越来越激烈 基于专业关切:这些冲突是以“阶级”为基

础的吗? 或,“阶级”在其中扮演什么角色?

Page 5: 社会统计在中国职工研究中的应用

关于“阶级意识”的理论争论 自在阶级、自为阶级与阶级意识 阶级意识的现状

个体意识的集合还是心心相印的群体意识? 阶级意识包含哪些内容?……

阶级意识的形成: 结构地位论 历史文化论 国家中心论 精英策动论

Page 6: 社会统计在中国职工研究中的应用

能研究吗?评估可行性 了解调查背景

项目建议书 调查问卷 调查执行报告

了解数据状况 变量设置 变量描述统计

Page 7: 社会统计在中国职工研究中的应用

了解调查背景 了解调查背景的中心任务是评估研究设计和

的科学性,以及数据的代表性 调查总体:职工队伍,什么是“职工”?根据

工作状态、工作身份还是工会会员身份? 抽样框:用什么数据做抽样框? 样本分配:抽样设计 田野执行:执行的具体过程?质量控制? 数据清理过程:逻辑矛盾、缺失值、……

Page 8: 社会统计在中国职工研究中的应用

调查数据质量评估报告 31 个省、市、自治区、 146 个城市、 80 个县城、

30000 多户家庭 家庭户,不含集体户 从家庭户中抽取 1 位 16 岁以上的从业、下岗、失

业内退或离退休人员为最终调查对象 家庭基本情况、个人劳动就业、收入分配、社会保

障、技能培训、民主权利、安全生产、劳动关系、思想状况等

抽样方法、质量控制、总体估计以及代表性估计

Page 9: 社会统计在中国职工研究中的应用

初步探索数据 Codebook

有哪些变量?变量性质? 变量的取值?取值的分布? 数据是否清理干净?

描述统计 观测值、平均值、标准差、全距

对数据的初步探索能够做到心中有“数”,既有利于评估选题的可行性,也有助于研究方向的精细化

Page 10: 社会统计在中国职工研究中的应用
Page 11: 社会统计在中国职工研究中的应用

选题的修正和提炼 在了解调查背景、内容和数据初步探索的基

础上,重新定向和提炼研究选题 放弃“阶级意识”,尝试研究“加班”问题 专业上对“加班”问题有兴趣 国内外相关研究很少,有学术价值 调查中相关数据比较丰富,有可行性

Page 12: 社会统计在中国职工研究中的应用

先了解加班 (a34, a35) 的基本情况 A34. 您上周实际工作了多少小时(包括加班、加

点) ? 在 5189 个样本中有 4729 人(在职工作者)回答了该问题

每周工作 40小时及以下只占 46.8% 平均每周工作 43.3小时,最短 0 小时,最长

112小时, 依国家法律而论,加班是普遍现象

Page 13: 社会统计在中国职工研究中的应用

加班待遇

完全执行 1,291 34.04 34.04部分执行 1,517 39.99 74.03完全没执行 985 25.97 100总计 3,793 100

A35. 如果您加班加点,您所在单位是否按照《劳动法》规定给您支付了了加班加点工资或安排了补休 ?[a35]

Page 14: 社会统计在中国职工研究中的应用

加班的性别差异

频数 均值男 2564 44.18 女 2165 42.28 合计 4729 43.31

(F=31.84 P <.01)

Page 15: 社会统计在中国职工研究中的应用

加班的年龄差异年龄分组 频数 均值

16-25岁 243 44.77 26-35岁 1158 43.63 36-45岁 1917 43.36 46-55岁 1265 42.92 56-65岁 146 41.25 合计 4729 43.31

(F = 2.71 p< .05)

Page 16: 社会统计在中国职工研究中的应用

婚姻与加班

婚姻状况 频数 均值 已婚 4361 43.97 未婚 368 43.31 总计 4729 43.26

(F = 1.29 p> .1)

Page 17: 社会统计在中国职工研究中的应用

问题的提出:为什么要加班? 不应只满足于描述加班状况,而应更深层次挖掘加班的社会动因和过程

以往局限于从劳动法的角度来考虑加班问题,关注的是劳动和休息的法律保障,以及超时劳动的补偿问题

这里从社会学角度来考察:人们为什么要加人们为什么要加班?班?

Page 18: 社会统计在中国职工研究中的应用

理论思考 理论思考的功能在于操作化研究提供“施工蓝图”,避免随意性导致的不周延和低效率

我的初步思考 劳动既是个人的志愿选择,也是一种结构性安排

劳动既是一个提供服务和物质产品的生产过程,也是一个不断再生支配 - 服从关系的政治过程

Page 19: 社会统计在中国职工研究中的应用

概念框架志愿选择 结构限制

生产过程

( 1 )个人的物质和地位欲望,以及个人实现这些欲望的能力(技术能力、教育水平)等

( 2 )所在组织和行业技术水平、产品特征、市场规律、薪酬制度

政治过程

( 3 )个体关于劳动的政治观念和自主性

( 4 )所在组织和行业的基本生产关系

Page 20: 社会统计在中国职工研究中的应用

理论假设 假设 1 :劳动作为个体选择下的生产过程

1.1 个人对工资的追求越强烈,加班可能性越低,加班的时间越长

1.2 个人的技术水平和教育水平越低,加班的可能越高,加班的时间越长

Page 21: 社会统计在中国职工研究中的应用

理论假设(续 1 ) 假设 2 :劳动作为结构限制下的生产过程

2.1 一个组织的薪资制度越是趋近小时工资制,其职工加班的可能性越高,加班时间越长

2.2 一个组织的产品越是面向市场,其职工加班的可能性越高,加班时间越长

2.3 一个组织的技术水平越低,其职工加班的可能性越高,加班时间越长

Page 22: 社会统计在中国职工研究中的应用

理论假设(续 2 ) 3. 劳动作为个体选择下的政治过程

3.1 个体越是热爱劳动,加班的可能性越高,加班时间越长

3.2 个体实现自我的欲望越强,加班的可能性越高,加班的时间越长

3.3 个体对选择工作的机会越多,加班的可能性越低,加班的时间越短

Page 23: 社会统计在中国职工研究中的应用

理论假设(续 3 ) 4. 劳动作为结构限制下的政治过程

4.1 一个组织越是不民主,其职工加班的可能性越高,加班的时间越长

4.2 一个组织的权力等级越高,其职工加班的可能性越低,加班的时间越短

Page 24: 社会统计在中国职工研究中的应用

函数表示 y = a+f(x1i, x2i, x3i, x4i)+e

Y: 加班 x1i:第一组假设所涉及的变量 x2i:第二组假设所涉及的变量 x3i:第三组假设所涉及的变量 x4i:第四组假设所涉及的变量 f表示自变量 xmi 与应变量 y 之间的映射关系

Page 25: 社会统计在中国职工研究中的应用

变量的操作化 因变量

是否加班: a34 分成两组—加班 vs. 不加班 加班时长 : (a34—40)小时

自变量: 工资追求: a40-1 :收入高 技术水平: a18 ,技术、职称等级 教育水平: a9 薪资制度: a12 (代理变量 proxy ) 组织市场化: a21 (代理变量 proxy )

Page 26: 社会统计在中国职工研究中的应用

变量的操作化(续) 组织技术水平: a23 (代理变量, proxy ) 个人劳动热情: a37( 代理变量, proxy) 自我实现欲望: a39_8 ( 代理变量, proxy) 工作选择机会: a38 组织民主程度:

a821: 是否实行劳资恳谈会 a84 :是否开展工资集体协商

Page 27: 社会统计在中国职工研究中的应用

人口学变量 性别 教育 婚姻

Page 28: 社会统计在中国职工研究中的应用

描述统计变量 观测数 均值 标准差 最小值 最大值 说明

是否加班 4729 0.37 0.48 0 1 虚拟, 1=加班

加班时长 4729 4.97 9.13 0 72 连续

性别 4729 0.54 0.50 0 1 虚拟, 1=男

年龄 4729 2.98 0.92 1 5 分类,每 10岁一组, 1=16-25

婚姻 4729 0.08 0.27 0 1 虚拟, 1=未婚

工资追求 4729 0.22 0.42 0 1 虚拟, 1=强烈

技术水平 4709 0.50 0.66 0 2 分类, 0=低, 2=高

教育水平 4728 12.42 2.58 3 19 连续

薪资制度 4729 0.29 0.46 0 1 虚拟, 1=小时制

组织市场化 4729 0.93 0.78 0 2 分类, 0=低, 2= 高

企业技术水平 4729 1.00 0.07 0 1 虚拟, 1=高

个人劳动欲望 4725 1.41 0.70 0 2 分类, 0=低, 2=高

自我实现欲望 4729 0.13 0.33 0 1 虚拟, 1=高

工作选择机会 4723 1.49 0.72 0 2 分类, 0=容易, 2=不容易

劳资恳谈会 4729 0.11 0.31 0 1 虚拟, 1=有

工资集体协商 4729 0.08 0.27 0 1 虚拟, 1=有

Page 29: 社会统计在中国职工研究中的应用

基本趋势观察 见表 2

Page 30: 社会统计在中国职工研究中的应用

对数回归模型:预测是否加班 结果见表 3

Page 31: 社会统计在中国职工研究中的应用

多元线性回归模型:预测加班时长 结果见表 4

Page 32: 社会统计在中国职工研究中的应用

结论与讨论 哪些假设得到验证,哪些假设没有得到支持

? 进一步思考:

理论假设的问题? 数据的问题? 测量的问题?

对今后调查和研究的意义

Page 33: 社会统计在中国职工研究中的应用

反思问卷设计 问卷调查

1 、一定要有理论思考 2 、理论思考一定要清晰 3 、没有理论指导的问卷调查一定是不周延的,低效率的

4 、相关档案的保存非常重要

Page 34: 社会统计在中国职工研究中的应用

•谢谢!