34
多多多多多多多多多 多多多多 analysis of variance, ANOVA 2012 多多多多多多多多 多多

多个样本均数比较的 方差分析

Embed Size (px)

DESCRIPTION

2012 年硕士研究生 《 医学统计学 》. 多个样本均数比较的 方差分析. analysis of variance, ANOVA. 第一节. 方差分析的基本思想及应用条件. 一、方差分析的基本思想. 合计 X ij N S X ij : 第 i 个处理组第 j 个观察对象的测量结果. 总均数. 各处理组均数. 总例数. N = n l + n 2 +…+ n g. 问题:推 断 g 个处理组总体均数有无差别. (一)测量数据的变异 - PowerPoint PPT Presentation

Citation preview

Page 1: 多个样本均数比较的 方差分析

多个样本均数比较的方差分析

analysis of variance, ANOVA

2012 年硕士研究生《医学统计学》

Page 2: 多个样本均数比较的 方差分析

第一节

方差分析的基本思想及应用条件

Page 3: 多个样本均数比较的 方差分析

g 个处理组的试验结果

处理分组 测量值 统计量

1 X11 X12 … X1j … 1nX1

n1 1X S1

2 X21 X22 … X2j … 2nX2

n2 2X S2

g Xg1 Xg2 … Xgj … ggnX ng gX Sg

一、方差分析的基本思想

合计 Xij N S

Xij :第 i 个处理组第 j 个观察对象的测量结果

X

Page 4: 多个样本均数比较的 方差分析

1 1

/ing

iji j

X X N

1

/in

i ij ij

X X n

N= nl+n2+…+ng

问题:推断 g 个处理组总体均数有无差别

总均数

各处理组均数

总例数

Page 5: 多个样本均数比较的 方差分析

(一)测量数据的变异离 均 差 平 方 和 (sum of squares of

deviations from mean , SS) :

2 2

1 1 ,

2 ( 1)

ing N

iji j i j

SS X X X X

N S

Page 6: 多个样本均数比较的 方差分析

1. 总变异 : 所有测量值之间总的变异程度

2 2

1 1 1 1

2

,

i in ng g

ij iji j i j

N

iji j

SS X X X C

X C

2 2

1 1 ,

( ) ( )ing N

ij iji j i j

X XC

N N

1N 总

其中

Page 7: 多个样本均数比较的 方差分析

2. 组间变异:各组均数与总均数的离均差平方和,反映 间的变异程度。 2

12

1 1

( )

( )

in

ijj

g g

i ii i i

X

SS n X X Cn

组间

1g 组间

iX

Page 8: 多个样本均数比较的 方差分析

存在组间变异的原因:

随机误差(个体变异和测量误差)不同处理(处理的不同水平)效果的差异

Page 9: 多个样本均数比较的 方差分析

2

1 1

( )ing

ij ii j

SS X X

组内

N g 组内

3. 组内变异:同一组内各测量值 Xij

与其所在组均数的差值的平方和,反映组内个体的变异程度。

Page 10: 多个样本均数比较的 方差分析

存在组间变异的原因:随机误差(个体变异和测量误差)不同处理的不同效果

存在组内变异的原因:随机误差

Page 11: 多个样本均数比较的 方差分析

SS SS SS 总 组间 组内

总 组间 组内

离均差平方和的分解:

Page 12: 多个样本均数比较的 方差分析

, SSSS

MS MS

组内组间组间 组内

组间 组内

均方差:在 SS 基础上考虑自由度

均方 (mean square , MS)

Page 13: 多个样本均数比较的 方差分析

1 2, , MS

FMS

组间组间 组内

组内

(二)方差分析的检验统计量: F

组间变异:随机误差和处理的效应组内变异:随机误差F 值越接近于 l ,越没有理由拒绝 H0 ;

反之, F 值越大,拒绝 H0 的理由越充分。

Page 14: 多个样本均数比较的 方差分析

当 H0 成立时, F 统计量服从 F 分布。

根据分子自由度 1 和分母自由度 2 ,查

出特定显著性水准 下 F 分布的界值,作为判断统计量 F 值大小的标准。

根据计算的统计量 F 值与 F 界值的相对大小,决定 H0 成立的可能性。

Page 15: 多个样本均数比较的 方差分析

方差分析的基本思想

将总变异分解为两个(如组间变异和组内变异)或多个部分,除随机误差外,各个部分的变异可由某个因素的作用加以解释。通过比较不同来源的变异(均方),借助 F 分布做出统计推断。若 F 值大于某个临界值,表示处理组间的效应不同;若 F 值接近甚至小于某个临界值,表示处理组间效应相同 ( 差异仅仅反映随机误差 ) 。

Page 16: 多个样本均数比较的 方差分析

不同设计类型方差分析的基本思想相同:

将处理间平均变异与误差平均变异比较。不同设计类型方差分析的变异分解项目不

同,应结合实际选择具体的方差分析方法。

Page 17: 多个样本均数比较的 方差分析

二、方差分析的应用条件各样本是相互独立的随机样本,均服从正态分布;相互比较的各样本的总体方差相等,即具有方差齐性( homogeneity of

variance )。

Page 18: 多个样本均数比较的 方差分析

第二节

完全随机设计资料的方差分析

Page 19: 多个样本均数比较的 方差分析

一、完全随机设计 采用完全随机化分组方法,将全部试验对象分配到 g 个处理组(水平组),各组分别接受不同的处理,实验结束后比较各组均数之间的差别有无统计学意义,推论 g 个处理因素的效应是否相同。

Page 20: 多个样本均数比较的 方差分析

例 4-2 某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120 名高血脂患者,采用完全随机设计方法将患者等分为 4 组,分别使用安慰剂和三个剂量的降血脂新药。

Page 21: 多个样本均数比较的 方差分析

完全随机化分组方法:

1. 实验单位编号

2. 取随机数

3. 随机数排序

4. 按随机数的序号决定组别

Page 22: 多个样本均数比较的 方差分析

完全随机设计:统计方法选择

1. 正态分布且方差齐同:完全随机设计的单因素方差分析 (one-way ANOVA) 或两独立样本均数比较的 t 检验( g=2 )

2. 非正态分布或方差不齐:数据变换或采用Wilcoxon 秩和检验(非参数方法)

Page 23: 多个样本均数比较的 方差分析

例 4-1 完全随机化分组方法

1. 120 名患者编号

2. 为每个编号的患者取随机数

3. 120 个随机数排序

4. 按患者随机数的序号决定组别

Page 24: 多个样本均数比较的 方差分析

编 号 1 2 3 4 5 6 7 8 9 10 … 119 120

随机数 260 873 373 204 056 930 160 905 886 958 … 220 634

序 号 24 106 39 15 3 114 13 109 108 117 … 16 75

分组结果 甲 丁 乙 甲 甲 丁 甲 丁 丁 丁 … 甲 丙

例 4-1 完全随机设计分组结果

Page 25: 多个样本均数比较的 方差分析

二、方差分析的变异分解

例 4-2

120 名高血脂患者,完全随机等分为 4 组,分别使用安慰剂和三个剂量的降血脂新药。试验 6 周后测得低密度脂蛋白。问 4 个处理组患者的低密度脂蛋白含量总体均数有无差别 ?

Page 26: 多个样本均数比较的 方差分析

统计量 分 组 测量值

n iX X 2X

3.53 4.59 4.34 2.66 3.59 3.13 2.64 2.56 3.50 3.25

3.30 4.04 3.53 3.56 3.85 4.07 3.52 3.93 4.19 2.96 安慰剂组

1.37 3.93 2.33 2.98 4.00 3.55 2.96 4.3 4.16 2.59

30 3.43 102.91 367.85

降血脂新药

2.42 3.36 4.32 2.34 2.68 2.95 1.56 3.11 1.81 1.77

1.98 2.63 2.86 2.93 2.17 2.72 2.65 2.22 2.90 2.97 2.4g组

2.36 2.56 2.52 2.27 2.98 3.72 2.80 3.57 4.02 2.31

30 2.72 81.46 233.00

2.86 2.28 2.39 2.28 2.48 2.28 3.21 2.23 2.32 2.68

2.66 2.32 2.61 3.64 2.58 3.65 2.66 3.68 2.65 3.02 4.8g组

3.48 2.42 2.41 2.66 3.29 2.70 3.04 2.81 1.97 1.68

30 2.70 80.94 225.54

0.89 1.06 1.08 1.27 1.63 1.89 1.19 2.17 2.28 1.72

1.98 1.74 2.16 3.37 2.97 1.69 0.94 2.11 2.81 2.52 7.2g组

1.31 2.51 1.88 1.41 3.19 1.92 2.47 1.02 2.10 3.71

30 1.97 58.99 132.13

4 个处理组低密度脂蛋白测量值 (mmol/L)

Page 27: 多个样本均数比较的 方差分析

变异总变异处理组间变异(随机误差和处理效应)

组内变异(随机误差)

Page 28: 多个样本均数比较的 方差分析

完全随机设计资料的方差分析表

变异来源 自由度 SS MS F

总变异 N-1 2

1 1

ing

iji j

X C

组 间 g-1 2

1

1

( )in

ijgj

i i

XC

n

SS

组间

组间

MS

MS组间

组内

组 内 N-g SS SS总 组间

SS

组内

组内

Page 29: 多个样本均数比较的 方差分析

三、分析步骤

H0:1 2 3 4 ,即4个试验组的总体均数相等

H1:4个试验组的总体均数不全相等

0.05

按表4-4中的公式计算各离均差平方和SS、自由度、均

方MS和F值。 H0 : 即 4 个试验组总体均数相等

H1: 4 个试验组总体均数不全相等

1 2 3 4

0.05

1. 建立假设

检验水准

Page 30: 多个样本均数比较的 方差分析

102.91 81.46 80.94 58.99 324.30ijX

2 367.85 233.00 225.54 132.13 958.52ijX

2(324.30) /120 876.42C

958.52 876.42=82.10SS 总

总=120-1=119

2 . 计算

Page 31: 多个样本均数比较的 方差分析

2 2 2 2(102.91) (81.46) (80.94) (58.99)876.42 32.16

30 30 30 30SS 组间

4 1 3 组间

82.10 32.16 49.94SS 组内

120 4 116 组内

32.1610.72

3MS 组间

49.940.43

116MS 组内

10.7224.93

0.43F

Page 32: 多个样本均数比较的 方差分析

例 4-2 的方差分析表

 

3. 列方差分析表

变异来源 自由度 SS MS F P

总变异 119 82.10

组 间 3 32.16 10.72 24.93 <0.01

组 内 116 49.94 0.43

Page 33: 多个样本均数比较的 方差分析

4 . 下结论 按 ,拒绝 H0 ,接受

H1 ,认为 4 个试验组 ldl-c 总体均数不相同,即不同剂量药物对血脂 ldl-c 水平的影响存在统计学意义上的差别。

0.05

Page 34: 多个样本均数比较的 方差分析

方差分析的结果若拒绝 H0 ,不能说明各组总体均数两两间都有差别。如果要分析哪两组间有差别,需要进行均数间的多重比较。

当 g=2 时,方差分析的结果与两独立样本均数比较的 t 检验等价,且有 。t F