Upload
chessa
View
142
Download
8
Embed Size (px)
DESCRIPTION
第三节 协方差和相关系数. 对于二维随机向量( X,Y) 而言,如果 X 和 Y 的数学期望和方差都存在,这时 EX、DX、EY、DY 分别反映了随机变量 X 和 Y 各自的部分特性。 然而二维随机向量的联合分布中还包含有 X 与 Y 之间相互关系的信息,能不能像数学期望和方差那样,用某些数值来刻画 X 和 Y 之间的联系的某些特性呢? 协方差和相关系数就是描述两个随机变量之间联系的数字特征。. 定义 5- 6 设( X,Y) 是 一 个 二 维 随 机 向 量,且. 存在,则称. - PowerPoint PPT Presentation
Citation preview
第三节 协方差和相关系数第三节 协方差和相关系数
对于二维随机向量( X , Y) 而言,如果 X 和 Y
的数学期望和方差都存在,这时 EX 、 DX 、 EY 、 DY
分别反映了随机变量 X 和 Y 各自的部分特性。
然而二维随机向量的联合分布中还包含有 X 与 Y
之间相互关系的信息,能不能像数学期望和方差那样,用某 些数值来刻画 X 和 Y 之间的联系的某些特性呢?
协方差和相关系数就是描述两个随机变量之间联系的数字特征。
)])([( EYYEXXE 定义 5-6 设( X , Y) 是 一 个 二 维 随 机 向量,且 存在,则称 )])([(),( EYYEXXEYXCov 为 X 与 Y 的协方差 (Covariance) 。 性质 5-8 设 X , Y 和 Z 是任意随机变量,且它们的方差均存在,则
EYEXXYEYXCov )(),( )1(
( 3 ) 对于任意常数 a 和 b,有 :
),(),( )2( XYCovYXCov
),(),( YXabCovbYaXCov
证明 由协方差的定义容易验证( 2 )和( 3 ),下面仅证( 1 )和( 4 )。
),(),(),( )4( ZYCovZXCovZYXCov
( 1 ) )])([(),( EYYEXXEYXCov )( EXEYYEXXEYXYE
EYEXXYE )(
)()()()( EYEXEYEXEXEYEXYE EYEXEXEYEYEXXYE )(
)])([( EYYEXXE 定义 5-6 设( X , Y) 是 一 个 二 维 随 机 向量,且 存在,则称 )])([(),( EYYEXXEYXCov 为 X 与 Y 的协方差 (Covariance) 。 性质 5-8 设 X , Y 和 Z 是任意随机变量,且它们的方差均存在,则
EYEXXYEYXCov )(),( )1(
( 3 ) 对于任意常数 a 和 b,有 :
),(),( )2( XYCovYXCov
),(),( YXabCovbYaXCov
证明 由协方差的定义容易验证( 2 )和( 3 ),下面仅证( 1 )和( 4 )。
),(),(),( )4( ZYCovZXCovZYXCov
( 4 ) )])(([(),( EZZYXEYXEZYXCov )]))(()[(( EZZEYYEXXE
)])(())([( EZZEYYEZZEXXE )])([()])([( EZZEYYEEZZEXXE
),(),( ZYCovZXCov
)])([( EYYEXXE 定义 5-6 设( X , Y) 是 一 个 二 维 随 机 向量,且 存在,则称 )])([(),( EYYEXXEYXCov 为 X 与 Y 的协方差 (Covariance) 。 性质 5-8 设 X , Y 和 Z 是任意随机变量,且它们的方差均存在,则
EYEXXYEYXCov )(),( )1(
( 3 ) 对于任意常数 a 和 b,有 :
),(),( )2( XYCovYXCov
),(),( YXabCovbYaXCov
证明 由协方差的定义容易验证( 2 )和( 3 ),下面仅证( 1 )和( 4 )。
),(),(),( )4( ZYCovZXCovZYXCov
以上这些性质是计算协方差时经常要用到的。同时,我们显然还有:
DXXXCov ),( )1(
.0),( )2( YXCovX Y,,独立时有:当
),(2)( YXCovDYDXYXD 性质 5-9 设随机变量 X 与 Y 的方差存在,则
证明 由方差的定义知,2)]()[()( YXEYXEYXD
2)]()[( EYYEXXE )])((2)()[( 22 EYYEXXEYYEXXE
),(2 YXCovDYDX
类似地可以证明: ),(2)( YXCovDYDXYXD
性质 5-9 可推广为:设 X1 …, , Xn 的方差均存在,则用归纳法和性质 5-8 的( 4)即可证明 :
),(2)(11
jiji
n
ii
n
ii XXCovDXXD
注意: 当 X1 …, , Xn 不独立时,
n
ii
n
ii DXXD
11
)(不一定成立。
例 5-24 设 X 服从超几何分布,即 ),,,(~ nNMHX
求 EX , DX 。 解 为叙述方便,不妨设n ≤ M,且以产品检验为例加以说明。 产品共 N 件,其中 M 件是次品,以 X 表示抽
验的 n件产品中次品的个数,显然 ),,,(~ nNMHX
设
0
1iX
第 i个产品为次品第 i个产品为正品
显然
n
iiXX
1
其中 X1 …, , Xn 不独立。由第一章例 1-12知,
其中 i = 1 , 2 …, , n 。
N
MEX i
所以N
MnEXEX
n
ii
1
N
M
N
M1
i XP
10
下面计算 X 的方差 DX 。
)1(N
M
N
MDX i
因为 Xi 服从 0-1 分布,
N
M
N
M1
i XP
10
所以,又当i < j , i , j = 1 , 2 …, , n 时,
N
MEX i
所以, XiXj 的概率分布为
)1,1()1( jiji XXPXXP
1
1
N
M
N
M
)1|1()1( iji XXPXP
j iX X
P
10
)1(
)1(
NN
MM
)1(
)1(1
NN
MM )1(
)1(
NN
MMXEX ji
故 jijiji EXEXXXEXXCov )()(
2)()1(
)1(
N
M
NN
MM
)1(
)(2
NN
MNM
)1(N
M
N
MDX i
N
M
N
M1
i XP
10
N
MEX i
)1(
)1(
NN
MMXEX ji
再由性质 5-9 的推广知,
)( jiXXCov
njiN
M
N
Mn
1
2)1(
)1(
)(2
NN
MNM
)(1
n
iiXDDX
ji
jiXXCov )(2
n
iiDX
1
])1(
)([
2
NN
MNM
njiNN
MNM
N
MNnM
122
1)1(
)(2)(
2
)1(
)1(
)(2)(22
nn
NN
MNM
N
MNnM
)1(
))((2
NN
nNMNnM
协方差是关于两个随机变量的一个数字特征,它的数值在一定程度上反映了这两个随机变量相互间的某种关系,不
过用它来描述这关系马上就会发现一个不足的地方,这就是 :
设 随机变量 X 和 Y 的协方差为: 如随机变量 X 和 Y 各自增大 k 倍( k ≠ 0 ),则
),( YXCov
即协方差却增大了 倍。
kYkX 和
即协方差却为: ),,(),( 2 YXCovkkYkXCov
而 kX , kY 相互之间的联系与 X , Y 之间的关系从直观上
2k
为克服这一缺点,可在计算协方差之前,先对随机变量进“ ”行 标准化 。故引入相关系数概念。
看并无差别。
定义 5-7 设( X , Y) 为二维随机向量,且 X 和 Y 的
DYDX
YXCov
DY
EYY
DX
EXXEYXXY
),()
))(
)(),(
方差均存在,都为正 ( >0 ),则称
为随机变量 X 与 Y 的相关系数( coefficient of correlation )。
易见,对k ≠ 0 , 有 。),(),( YXkYkX
因为有: ),,(),( 2 YXCovkkYkXCov
和,)(,)( 22 DYkkYDDXkkXD
例 5-25 设 。则 XYNYX ),,,,,(~),( 22
2121
证明 略。
从而二维正态分布的五个参数均有明确的含义。
其中
])())((2)(
[)1(2
1
221
22
22
21
2121
21
2
12
1),(
yyxx
eyxp
,,,, 2121
( X ,Y ) 的密度函数为:
为常数,且
1||,0,0,, 2121
, XY 定理 5-5 设随机变量 X 与 Y 的方差存在,相关系数为 则有:
的充分必要条件是 X 与 Y 以 概率
,1|| (1) XY1|| (2) XY
1 线性相关,即存在常数 a 与 b,使有 证明 ( 1 ) 令
。1)( baXYP
运用定理 5-3 (柯西 - 施瓦茨不等式),可得
,, EYYYEXXX 11
DXDY
EYYEXXEXY
22 )])(([
1)]([
21
2
211
1
EYEX
YXE
即: 。1|| XY
则有: ,, 0)(0)( 11 EYYEEYEXXEEX
,, 21
21
211
21
21
211 )()( EYEYEYDYEXEXEXDX
,, DYEYYDDYDXEXXDDX )()( 11
的充分必要条件是 X 与 Y 以 概率
1|| (2) XY 1 线性相关,即存在常数 a 与 b,使有 证明 ( 2) :由上述( 1)的证明过程可知:
。1)( baxYP
1)]([
21
21
211 EYEX
YXE等价于,1|| XY
这等价于二次方程:
即: 21
21
211 )]([ EYEXYXE
0)]([ 21
21
211 EYEXYXE
仅有一个重根
0)(2)( 2111
21
2211 EYYXtEEXtYtXE
即,0t
又因为0)( 2
110 YXtE
所以0)( 110110 EYEXtYXtE
2110
2110110 )]([)()( YXtEYXtEYXtD
000 而由性质 5-6 (DX=0, 有 P(X=a)=1) 知:
的充分必要条件是 X 与 Y 以 概率
1|| (2) XY 1 线性相关,即存在常数 a 与 b,使有 证明 ( 2) :
。1)( baxYP
的充分必要条件是:0)( 110 YXtD
令
.1)0( 110 YXtP
., 00 EXtEYbta 即有:
.1)( baXYP
而由性质 5-6 (DX=0, 有 P(X=a)=1) 知:
.1)0)()(( 0 EYYEXXtP
.1)( 00 EYEXtXtYP
定理表明:当
时,在 X 与 Y 之间存在着线性关系
,1|| XY
的事件概率为 1 , 即 X 与 Y 之间线性关系不成立的事件的概概率为零。
0 1 aXY 时,当
这 种 线 性 相 关 的 程 度 随 着
, 称 X 与 Y 正线性相关;
0 1 aXY 时,当 , 称 X 与 Y 负线性相关;
1|| 时,XY当
的减小而减弱。当
|| XY
时,称 X 与 Y 是不相关的,0XY
即它们没有线性关系。
由此可知,相关系数 XY 是描述随机变量之间线性
关系强弱的一个数字特征。
定理 5-6 若随机变量 X 与 Y 相互独立,则 X 与 Y不相关;反之不然。
证明 由于 X 与 Y 独立,即知EYEXXYE )(
所以,0)(),( EYEXXYEYXCov
从而可知 : ,0XY 即 X 与 Y 不相关。
特别注意:但当 X 与 Y 不相关时, X 与 Y 却不一定
独立。反例参见以下 例 5-26 。
例 5-26 设随机变量 Θ 的密度函数为
且令 X = sinΘ , Y = cosΘ,证明:
0
1)( p 22
其它
( 1 ) X 与 Y 不相关; ( 2 ) X 与 Y 不独立。 证明( 1 ) 由随机变量函数的期望公式知,
于是,
01
sin2
2
dEX
21
cos2
2
dEY
)2(sin2
1)cos(sin)( EEXYE
又显然
0)(),( EXEYXYEYXCov
即知,0,0 DYDX 可见 X 与 Y 是不相关的。
,0XY
d 2
2
12sin
2
1 0
证明( 2 )设( X , Y )的联合分布函数为 F(x,y) ,则 :)
2
1,
2
1()
2
1,
2
1( YXPF
dp
3
2
)(
)2
1cos,
2
1(sin P
)32
(
P6
1
其 中 ,由
2
1sin 可得 ,
62
可得2
1cos 或,32
,
23
例 5-26 设随机变量 Θ 的密度函数为
且令 X = sinΘ , Y = cosΘ,证明:
0
1)( p 22
其它
( 1 ) X 与 Y 不相关; ( 2 ) X 与 Y 不独立。
)2
1,
2
1(F故
2
2
2
1
6
3
sinxcosy
3
)]2
(3
[1
再由第三章例 3-21( 见教材第 63 页 ) 知, X , Y 的密度函数,故
2
1
12
1
1 2|arcsin
1
1
1)
2
1(
xdxx
FX ))
2(
6(
1
2
1
02
1
0 2|arcsin
1
1
1)
2
1( ydy
yFY
3
2
6
2
3
1
从而可知, )2
1()
2
1()
2
1,
2
1( YX FFF
即知 X 与 Y 不独立。此时 X 与 Y 存在函数关系: 。122 YX
例 5-26 设随机变量 Θ 的密度函数为
且令 X = sinΘ , Y = cosΘ,证明:
0
1)( p 22
其它
( 1 ) X 与 Y 不相关; ( 2 ) X 与 Y 不独立。 .
6
1)
2
1,
2
1( F
定理 5-6 和 例 5-26说明:两个随机变量之间的
独立与不相关是两个不同的概念。
“不相关”只说明两个随机变量之间没有线性关系 ,
但可能存在其他函数关系,也可能相互独立。
“而 独立”说明两个随机变量之间既无线性关系,
“ ” “ ”也无其他函数关系,所以 独立 必导致 不相关 ;
反之不然。
“独立” “不独立” (无任何关系) (有某种关系)
相关 “不相关”(有线性关系) , (没有线性关系) 关系可有强弱 (但存在其
他 函 数 关系)
“不相关”(没有线性关系)
没有任何其它关系
随机变量 X 与 Y 的关系
),,,,,(~),( 22
2121 NYX 例 5-27 若
则 X 与 Y 相互独立的充分必要条件是 X 与 Y 不相关。 证明 显然只要证明充分性即可。 设 X 与 Y 不相关,由二维正态分布时性质可知, ,0XY
则当ρ = 0时的二维正态分布的联合密度函数为:。, ),(~),(~ 2
22211 NYNX
])()(
[2
1
21
22
22
21
21
2
1),(
yx
eyxp
22
22
21
21
2
)(
2
2
)(
1 2
1
2
1
yx
ee )()( ypxp YX
这说明 X 与 Y 相互独立。 在一般情况下, X 与 Y 相互独立可以推得 X 与Y 不相 但是,对于二维正态随机向量( X , Y )而言,“ X与 Y 相
相关;反之不成立。
互独立”和“ X 与 Y 不相关”是等价的。
例 5-28 设随机向量( X , Y)的联合密度函数为
求 :
0
15),(
2xyyxp
10 xy
其它; )1( XY
;7)3Y-D(2X )2(
解( 1)由于相关系数
XY 由 DX 、 DY 和Cov ( X , Y)确定, 所 以 , 先 计 算 DX 、 DY 和
Cov ( X , Y )。
dyyxpxpX ),()(
10 x其它
0
150
2dyxyx
0
5 4x
dxyxpypY ),()(
10 y
其它
0
151 2dxxyy
0
)1(2
15 22 yy
dxxxpEX X )(
1
0
45 dxxx6
5
dyyypEY Y )(
1
0
22 )1(2
15dyyyy
8
5
xy
x
y
0
1
1
dxxxpEX X )(
1
0
45 dxxx6
5
dyyypEY Y )(
1
0
22 )1(2
15dyyyy
8
5
dxxpxEX X )(22
1
0
425 dxxx7
5
dyypyEY Y )(22
1
0
222 )1(2
15dyyyy
7
3
所以 22 )(EXEXDX 252
5
22 )(EYEYDY 448
17
xy
x
y
0
1
1
0
15),(
2xyyxp
10 xy
其它
dxxxpEX X )(
1
0
45 dxxx6
5
dyyypEY Y )(
1
0
22 )1(2
15dyyyy
8
5
所以 22 )(EXEXDX 252
5
22 )(EYEYDY 448
17
又
从而
现再来计算相关系数得 :
dxdyyxxypXYE ),()(
1
0 0
215 dyxyxydxx
28
15
EXEYXYEYXCov )(),(8
5*
6
5
28
15
DYDX
YXCovXY
),(
44817
2525336
5
17
5 542.0
336
5
xy
x
y
0
1
1
0
15),(
2xyyxp
10 xy
其它
22 )(EXEXDX 252
5
22 )(EYEYDY 448
17
( 2 ) 由性质 5-8 和 性质 5-9 知 :
EXEYXYEYXCov )(),(336
5
)732( YXD
2423.0
)32( YXD
)3,2(2)3()2( YXCovYDXD
),(1294 YXCovDYDX
336
512
448
179
252
54
第五章 习题 ( P133 )
23 , 24 , 25 , 26* , 27 , 28*协方差和相关系数