27
第第第 第第第第第第第第 第第第 第第第第第第第第 第第第第第第第第X Y 第第 第第 X 第 Y 第第第第第第第第第 第第 第第 EX DX EY DY 第第第第第第第第第 X 第 Y 第第 第第第第第第第第第第第第第第第第第第第第第第第 X 第 Y 第第第第第第第第第 第第 第第第第第第第第第第第 第第第第第第第第 X 第 Y 第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第第

第三节 协方差和相关系数

  • Upload
    chessa

  • View
    142

  • Download
    8

Embed Size (px)

DESCRIPTION

第三节 协方差和相关系数. 对于二维随机向量( X,Y) 而言,如果 X 和 Y 的数学期望和方差都存在,这时 EX、DX、EY、DY 分别反映了随机变量 X 和 Y 各自的部分特性。 然而二维随机向量的联合分布中还包含有 X 与 Y 之间相互关系的信息,能不能像数学期望和方差那样,用某些数值来刻画 X 和 Y 之间的联系的某些特性呢? 协方差和相关系数就是描述两个随机变量之间联系的数字特征。. 定义 5- 6 设( X,Y) 是 一 个 二 维 随 机 向 量,且. 存在,则称. - PowerPoint PPT Presentation

Citation preview

Page 1: 第三节  协方差和相关系数

第三节 协方差和相关系数第三节 协方差和相关系数

对于二维随机向量( X , Y) 而言,如果 X 和 Y

的数学期望和方差都存在,这时 EX 、 DX 、 EY 、 DY

分别反映了随机变量 X 和 Y 各自的部分特性。

然而二维随机向量的联合分布中还包含有 X 与 Y

之间相互关系的信息,能不能像数学期望和方差那样,用某 些数值来刻画 X 和 Y 之间的联系的某些特性呢?

协方差和相关系数就是描述两个随机变量之间联系的数字特征。

Page 2: 第三节  协方差和相关系数

)])([( EYYEXXE 定义 5-6 设( X , Y) 是 一 个 二 维 随 机 向量,且 存在,则称 )])([(),( EYYEXXEYXCov 为 X 与 Y 的协方差 (Covariance) 。 性质 5-8 设 X , Y 和 Z 是任意随机变量,且它们的方差均存在,则

EYEXXYEYXCov )(),( )1(

( 3 ) 对于任意常数 a 和 b,有 :

),(),( )2( XYCovYXCov

),(),( YXabCovbYaXCov

证明 由协方差的定义容易验证( 2 )和( 3 ),下面仅证( 1 )和( 4 )。

),(),(),( )4( ZYCovZXCovZYXCov

( 1 ) )])([(),( EYYEXXEYXCov )( EXEYYEXXEYXYE

EYEXXYE )(

)()()()( EYEXEYEXEXEYEXYE EYEXEXEYEYEXXYE )(

Page 3: 第三节  协方差和相关系数

)])([( EYYEXXE 定义 5-6 设( X , Y) 是 一 个 二 维 随 机 向量,且 存在,则称 )])([(),( EYYEXXEYXCov 为 X 与 Y 的协方差 (Covariance) 。 性质 5-8 设 X , Y 和 Z 是任意随机变量,且它们的方差均存在,则

EYEXXYEYXCov )(),( )1(

( 3 ) 对于任意常数 a 和 b,有 :

),(),( )2( XYCovYXCov

),(),( YXabCovbYaXCov

证明 由协方差的定义容易验证( 2 )和( 3 ),下面仅证( 1 )和( 4 )。

),(),(),( )4( ZYCovZXCovZYXCov

( 4 ) )])(([(),( EZZYXEYXEZYXCov )]))(()[(( EZZEYYEXXE

)])(())([( EZZEYYEZZEXXE )])([()])([( EZZEYYEEZZEXXE

),(),( ZYCovZXCov

Page 4: 第三节  协方差和相关系数

)])([( EYYEXXE 定义 5-6 设( X , Y) 是 一 个 二 维 随 机 向量,且 存在,则称 )])([(),( EYYEXXEYXCov 为 X 与 Y 的协方差 (Covariance) 。 性质 5-8 设 X , Y 和 Z 是任意随机变量,且它们的方差均存在,则

EYEXXYEYXCov )(),( )1(

( 3 ) 对于任意常数 a 和 b,有 :

),(),( )2( XYCovYXCov

),(),( YXabCovbYaXCov

证明 由协方差的定义容易验证( 2 )和( 3 ),下面仅证( 1 )和( 4 )。

),(),(),( )4( ZYCovZXCovZYXCov

以上这些性质是计算协方差时经常要用到的。同时,我们显然还有:

DXXXCov ),( )1(

.0),( )2( YXCovX Y,,独立时有:当

Page 5: 第三节  协方差和相关系数

),(2)( YXCovDYDXYXD 性质 5-9 设随机变量 X 与 Y 的方差存在,则

证明 由方差的定义知,2)]()[()( YXEYXEYXD

2)]()[( EYYEXXE )])((2)()[( 22 EYYEXXEYYEXXE

),(2 YXCovDYDX

类似地可以证明: ),(2)( YXCovDYDXYXD

性质 5-9 可推广为:设 X1 …, , Xn 的方差均存在,则用归纳法和性质 5-8 的( 4)即可证明 :

),(2)(11

jiji

n

ii

n

ii XXCovDXXD

注意: 当 X1 …, , Xn 不独立时,

n

ii

n

ii DXXD

11

)(不一定成立。

Page 6: 第三节  协方差和相关系数

例 5-24 设 X 服从超几何分布,即 ),,,(~ nNMHX

求 EX , DX 。 解 为叙述方便,不妨设n ≤ M,且以产品检验为例加以说明。 产品共 N 件,其中 M 件是次品,以 X 表示抽

验的 n件产品中次品的个数,显然 ),,,(~ nNMHX

0

1iX

第 i个产品为次品第 i个产品为正品

显然

n

iiXX

1

其中 X1 …, , Xn 不独立。由第一章例 1-12知,

其中 i = 1 , 2 …, , n 。

N

MEX i

所以N

MnEXEX

n

ii

1

N

M

N

M1

i XP

10

Page 7: 第三节  协方差和相关系数

下面计算 X 的方差 DX 。

)1(N

M

N

MDX i

因为 Xi 服从 0-1 分布,

N

M

N

M1

i XP

10

所以,又当i < j , i , j = 1 , 2 …, , n 时,

N

MEX i

所以, XiXj 的概率分布为

)1,1()1( jiji XXPXXP

1

1

N

M

N

M

)1|1()1( iji XXPXP

j iX X

P

10

)1(

)1(

NN

MM

)1(

)1(1

NN

MM )1(

)1(

NN

MMXEX ji

故 jijiji EXEXXXEXXCov )()(

2)()1(

)1(

N

M

NN

MM

)1(

)(2

NN

MNM

Page 8: 第三节  协方差和相关系数

)1(N

M

N

MDX i

N

M

N

M1

i XP

10

N

MEX i

)1(

)1(

NN

MMXEX ji

再由性质 5-9 的推广知,

)( jiXXCov

njiN

M

N

Mn

1

2)1(

)1(

)(2

NN

MNM

)(1

n

iiXDDX

ji

jiXXCov )(2

n

iiDX

1

])1(

)([

2

NN

MNM

njiNN

MNM

N

MNnM

122

1)1(

)(2)(

2

)1(

)1(

)(2)(22

nn

NN

MNM

N

MNnM

)1(

))((2

NN

nNMNnM

Page 9: 第三节  协方差和相关系数

协方差是关于两个随机变量的一个数字特征,它的数值在一定程度上反映了这两个随机变量相互间的某种关系,不

过用它来描述这关系马上就会发现一个不足的地方,这就是 :

设 随机变量 X 和 Y 的协方差为: 如随机变量 X 和 Y 各自增大 k 倍( k ≠ 0 ),则

),( YXCov

即协方差却增大了 倍。

kYkX 和

即协方差却为: ),,(),( 2 YXCovkkYkXCov

而 kX , kY 相互之间的联系与 X , Y 之间的关系从直观上

2k

为克服这一缺点,可在计算协方差之前,先对随机变量进“ ”行 标准化 。故引入相关系数概念。

看并无差别。

Page 10: 第三节  协方差和相关系数

定义 5-7 设( X , Y) 为二维随机向量,且 X 和 Y 的

DYDX

YXCov

DY

EYY

DX

EXXEYXXY

),()

))(

)(),(

方差均存在,都为正 ( >0 ),则称

为随机变量 X 与 Y 的相关系数( coefficient of correlation )。

易见,对k ≠ 0 , 有 。),(),( YXkYkX

因为有: ),,(),( 2 YXCovkkYkXCov

和,)(,)( 22 DYkkYDDXkkXD

Page 11: 第三节  协方差和相关系数

例 5-25 设 。则 XYNYX ),,,,,(~),( 22

2121

证明 略。

从而二维正态分布的五个参数均有明确的含义。

其中

])())((2)(

[)1(2

1

221

22

22

21

2121

21

2

12

1),(

yyxx

eyxp

,,,, 2121

( X ,Y ) 的密度函数为:

为常数,且

1||,0,0,, 2121

Page 12: 第三节  协方差和相关系数

, XY 定理 5-5 设随机变量 X 与 Y 的方差存在,相关系数为 则有:

的充分必要条件是 X 与 Y 以 概率

,1|| (1) XY1|| (2) XY

1 线性相关,即存在常数 a 与 b,使有 证明 ( 1 ) 令

。1)( baXYP

运用定理 5-3 (柯西 - 施瓦茨不等式),可得

,, EYYYEXXX 11

DXDY

EYYEXXEXY

22 )])(([

1)]([

21

2

211

1

EYEX

YXE

即: 。1|| XY

则有: ,, 0)(0)( 11 EYYEEYEXXEEX

,, 21

21

211

21

21

211 )()( EYEYEYDYEXEXEXDX

,, DYEYYDDYDXEXXDDX )()( 11

Page 13: 第三节  协方差和相关系数

的充分必要条件是 X 与 Y 以 概率

1|| (2) XY 1 线性相关,即存在常数 a 与 b,使有 证明 ( 2) :由上述( 1)的证明过程可知:

。1)( baxYP

1)]([

21

21

211 EYEX

YXE等价于,1|| XY

这等价于二次方程:

即: 21

21

211 )]([ EYEXYXE

0)]([ 21

21

211 EYEXYXE

仅有一个重根

0)(2)( 2111

21

2211 EYYXtEEXtYtXE

即,0t

又因为0)( 2

110 YXtE

所以0)( 110110 EYEXtYXtE

2110

2110110 )]([)()( YXtEYXtEYXtD

000 而由性质 5-6 (DX=0, 有 P(X=a)=1) 知:

Page 14: 第三节  协方差和相关系数

的充分必要条件是 X 与 Y 以 概率

1|| (2) XY 1 线性相关,即存在常数 a 与 b,使有 证明 ( 2) :

。1)( baxYP

的充分必要条件是:0)( 110 YXtD

.1)0( 110 YXtP

., 00 EXtEYbta 即有:

.1)( baXYP

而由性质 5-6 (DX=0, 有 P(X=a)=1) 知:

.1)0)()(( 0 EYYEXXtP

.1)( 00 EYEXtXtYP

Page 15: 第三节  协方差和相关系数

定理表明:当

时,在 X 与 Y 之间存在着线性关系

,1|| XY

的事件概率为 1 , 即 X 与 Y 之间线性关系不成立的事件的概概率为零。

0 1 aXY 时,当

这 种 线 性 相 关 的 程 度 随 着

, 称 X 与 Y 正线性相关;

0 1 aXY 时,当 , 称 X 与 Y 负线性相关;

1|| 时,XY当

的减小而减弱。当

|| XY

时,称 X 与 Y 是不相关的,0XY

即它们没有线性关系。

由此可知,相关系数 XY 是描述随机变量之间线性

关系强弱的一个数字特征。

Page 16: 第三节  协方差和相关系数

定理 5-6 若随机变量 X 与 Y 相互独立,则 X 与 Y不相关;反之不然。

证明 由于 X 与 Y 独立,即知EYEXXYE )(

所以,0)(),( EYEXXYEYXCov

从而可知 : ,0XY 即 X 与 Y 不相关。

特别注意:但当 X 与 Y 不相关时, X 与 Y 却不一定

独立。反例参见以下 例 5-26 。

Page 17: 第三节  协方差和相关系数

例 5-26 设随机变量 Θ 的密度函数为

且令 X = sinΘ , Y = cosΘ,证明:

0

1)( p 22

其它

( 1 ) X 与 Y 不相关; ( 2 ) X 与 Y 不独立。 证明( 1 ) 由随机变量函数的期望公式知,

于是,

01

sin2

2

dEX

21

cos2

2

dEY

)2(sin2

1)cos(sin)( EEXYE

又显然

0)(),( EXEYXYEYXCov

即知,0,0 DYDX 可见 X 与 Y 是不相关的。

,0XY

d 2

2

12sin

2

1 0

Page 18: 第三节  协方差和相关系数

证明( 2 )设( X , Y )的联合分布函数为 F(x,y) ,则 :)

2

1,

2

1()

2

1,

2

1( YXPF

dp

3

2

)(

)2

1cos,

2

1(sin P

)32

(

P6

1

其 中 ,由

2

1sin 可得 ,

62

可得2

1cos 或,32

,

23

例 5-26 设随机变量 Θ 的密度函数为

且令 X = sinΘ , Y = cosΘ,证明:

0

1)( p 22

其它

( 1 ) X 与 Y 不相关; ( 2 ) X 与 Y 不独立。

)2

1,

2

1(F故

2

2

2

1

6

3

sinxcosy

3

)]2

(3

[1

Page 19: 第三节  协方差和相关系数

再由第三章例 3-21( 见教材第 63 页 ) 知, X , Y 的密度函数,故

2

1

12

1

1 2|arcsin

1

1

1)

2

1(

xdxx

FX ))

2(

6(

1

2

1

02

1

0 2|arcsin

1

1

1)

2

1( ydy

yFY

3

2

6

2

3

1

从而可知, )2

1()

2

1()

2

1,

2

1( YX FFF

即知 X 与 Y 不独立。此时 X 与 Y 存在函数关系: 。122 YX

例 5-26 设随机变量 Θ 的密度函数为

且令 X = sinΘ , Y = cosΘ,证明:

0

1)( p 22

其它

( 1 ) X 与 Y 不相关; ( 2 ) X 与 Y 不独立。 .

6

1)

2

1,

2

1( F

Page 20: 第三节  协方差和相关系数

定理 5-6 和 例 5-26说明:两个随机变量之间的

独立与不相关是两个不同的概念。

“不相关”只说明两个随机变量之间没有线性关系 ,

但可能存在其他函数关系,也可能相互独立。

“而 独立”说明两个随机变量之间既无线性关系,

“ ” “ ”也无其他函数关系,所以 独立 必导致 不相关 ;

反之不然。

Page 21: 第三节  协方差和相关系数

“独立” “不独立” (无任何关系) (有某种关系)

相关 “不相关”(有线性关系) , (没有线性关系) 关系可有强弱 (但存在其

他 函 数 关系)

“不相关”(没有线性关系)

没有任何其它关系

随机变量 X 与 Y 的关系

Page 22: 第三节  协方差和相关系数

),,,,,(~),( 22

2121 NYX 例 5-27 若

则 X 与 Y 相互独立的充分必要条件是 X 与 Y 不相关。 证明 显然只要证明充分性即可。 设 X 与 Y 不相关,由二维正态分布时性质可知, ,0XY

则当ρ = 0时的二维正态分布的联合密度函数为:。, ),(~),(~ 2

22211 NYNX

])()(

[2

1

21

22

22

21

21

2

1),(

yx

eyxp

22

22

21

21

2

)(

2

2

)(

1 2

1

2

1

yx

ee )()( ypxp YX

这说明 X 与 Y 相互独立。 在一般情况下, X 与 Y 相互独立可以推得 X 与Y 不相 但是,对于二维正态随机向量( X , Y )而言,“ X与 Y 相

相关;反之不成立。

互独立”和“ X 与 Y 不相关”是等价的。

Page 23: 第三节  协方差和相关系数

例 5-28 设随机向量( X , Y)的联合密度函数为

求 :

0

15),(

2xyyxp

10 xy

其它; )1( XY

;7)3Y-D(2X )2(

解( 1)由于相关系数

XY 由 DX 、 DY 和Cov ( X , Y)确定, 所 以 , 先 计 算 DX 、 DY 和

Cov ( X , Y )。

dyyxpxpX ),()(

10 x其它

0

150

2dyxyx

0

5 4x

dxyxpypY ),()(

10 y

其它

0

151 2dxxyy

0

)1(2

15 22 yy

dxxxpEX X )(

1

0

45 dxxx6

5

dyyypEY Y )(

1

0

22 )1(2

15dyyyy

8

5

xy

x

y

0

1

1

Page 24: 第三节  协方差和相关系数

dxxxpEX X )(

1

0

45 dxxx6

5

dyyypEY Y )(

1

0

22 )1(2

15dyyyy

8

5

dxxpxEX X )(22

1

0

425 dxxx7

5

dyypyEY Y )(22

1

0

222 )1(2

15dyyyy

7

3

所以 22 )(EXEXDX 252

5

22 )(EYEYDY 448

17

xy

x

y

0

1

1

0

15),(

2xyyxp

10 xy

其它

Page 25: 第三节  协方差和相关系数

dxxxpEX X )(

1

0

45 dxxx6

5

dyyypEY Y )(

1

0

22 )1(2

15dyyyy

8

5

所以 22 )(EXEXDX 252

5

22 )(EYEYDY 448

17

从而

现再来计算相关系数得 :

dxdyyxxypXYE ),()(

1

0 0

215 dyxyxydxx

28

15

EXEYXYEYXCov )(),(8

5*

6

5

28

15

DYDX

YXCovXY

),(

44817

2525336

5

17

5 542.0

336

5

xy

x

y

0

1

1

0

15),(

2xyyxp

10 xy

其它

Page 26: 第三节  协方差和相关系数

22 )(EXEXDX 252

5

22 )(EYEYDY 448

17

( 2 ) 由性质 5-8 和 性质 5-9 知 :

EXEYXYEYXCov )(),(336

5

)732( YXD

2423.0

)32( YXD

)3,2(2)3()2( YXCovYDXD

),(1294 YXCovDYDX

336

512

448

179

252

54

Page 27: 第三节  协方差和相关系数

第五章 习题 ( P133 )

23 , 24 , 25 , 26* , 27 , 28*协方差和相关系数