Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
分散分析 確かさ評価分散分析の不確かさ評価への利用への利用
産業技術総合 究 計 標準 究部産業技術総合研究所 計測標準研究部門
物性統計科 応用統計研究室 城野 克広物性統計科 応用統計研究室 城野 克広
1
1 分散分析の導入1.分散分析の導入
2
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
室内の平均温度を計測するときに,部屋の4箇所をランダムに選んで測定点として,各2回の測定を行ったンダムに選んで測定点として,各2回の測定を行った以下のデータがある.
測定点1 測定点2 測定点3 測定点4
1
2 4 3 8 1 25.3 ºC 25.0 ºC 25.7 ºC 24.8 ºC2 24.9 ºC 24.5 ºC 25.4 ºC 24.4 ºC
1 75 6 平均温度は25.0 ℃.
不確かさは?不確かさは?
3
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用4×2 = 8個のデータの平均値として,
平均値の実験標準偏差 4 2 21
ij TTTu平均値の実験標準偏差 1 112424 i j
ij TTTu
Tij:測定点iのj番目の測定値
T :全平均
ij j
724 38か所を測定した
ときと同じ式でよ1 5 68
ときと同じ式でよいのだろうか?
4
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
不確かさの成分を考えてみると...
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
不確かさの成分を考えてみると...
測定点の違いによる偏差は不確かさの要因になる.
2 4 3 8
不確かさの要因になる
繰 値がば く き
place(Tij) とする.
1 75 6
繰返して値がばらつくときには不確かさ要因になる.
(T ) とするrepeat (Tij) とする.
84
~2repeat
2place ijij TT
Tu
“4つの測定点”,“8回の測定”の“平均”だから
84“平均”だから,
5
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
“place(Tij) とrepeat (Tij)を別々に推定して合成”する!!
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
place(Tij) とrepeat (Tij)を別々に推定して合成 する!!
測定点iの測定点の違いにる室内 度 均 から
2 4 3 8よる室内温度の平均からの偏差をi、その測定点のj番目の測定値の繰返しの偏1 7
5 6番目の測定値の繰返しの偏差をijとする.
ijiijT
iij uT ~place
uT ~
place(Tij)とrepeat(Tij)は次の式によって推定される ijij uT ~repeat定される.
6
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
注意しなくてはいけないことは...
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
注意しなくてはいけないことは...
①はT11 = + 1 + 11,⑦はT
2 4 3 8⑦はT12 = + 1 + 12. = + 1 + (11+ 12)/2.
測定点2 1T1 7
5 6 ②はT21 = + 2 + 21.④はT22 = + 2 + 22.22 2 22 = + 2 + (21+ 22)/2測定点1 2T
uTu 1 - 2 = (1 - 2) + {(11 + 12) - (21 + 22)}/2 = 1 - 2T T
つまり ii uTu つまり,
7
分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用分散分析の不確かさ評価への利用
結果として 今回紹介したような簡単なケ スでもや結果として,今回紹介したような簡単なケースでもやや複雑な式を解くことが要求される.実験計画に応じた計算の方法が精緻に検討され 整理されているた計算の方法が精緻に検討され,整理されている.
その一連の解析手法を
分散分析(ANOVA: Analysis of variance)
その 連の解析手法を
という.
確*より広い意味での分散の解析を対象にしており,不確かさの評価という観点に立った整理をされていることはむしろ少ない.
8
記号について記号について記号について記号について
(x) 本当のばらつきの標準偏差(x):本当のばらつきの標準偏差2(x):本当のばらつきの分散( )
期待値 推定値
u(x):標準不確かさu(x):標準不確かさu2(x):標準不確かさの二乗
不確かさは本当のばらつきの標準偏差を推定したものである。似たような意味を持つが、本資料ではなる
9
ある。似 うな意味を持 、本資料 なるべく厳密に使い分けるので注意されたい。
2 分散分析の方法2.分散分析の方法
10
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
まず例に挙げたような「ある量について 1つの因子をまず例に挙げたような「ある量について、1つの因子を
いくつかの水準に分け、その水準内で繰返し測定を行う場合」を考えよう 分散分析を用いるもっとも単純行う場合」を考えよう。分散分析を用いるもっとも単純な場合で、「一元配置」と呼ばれる実験計画である。
測定点2 測定点4
測定点1 測定点2 測定点3 測定点41 25.3 ºC 25.0 ºC 25.7 ºC 24.8 ºC
2 4 3 8
2 24.9 ºC 24.5 ºC 25.4 ºC 24.4 ºC1 75 6
11
測定点1 測定点3
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
問題設定と記号を確認しておこう。問題設定と記号を確認しておこう。
T測定点iのj番目の測定値をT とする
例えば
測定点2 測定点4
測定点1 測定点2 測定点3 測定点4
41T定値をTijとする。
2 4 3 8
測定点 測定点 測定点 測定点
1 25.3 ºC 25.0 ºC 25.7 ºC 24.8 ºC
2 24.9 ºC 24.5 ºC 25.4 ºC 24.4 ºC
1 75 6
25.20 ºC 24.75 ºC 25.65 ºC 24.60 ºC
n
TT 1 測定点iのすべての測定値の平均をTとする
測定点1 測定点3
j
jTn
T1
11 定値の平均をTiとする。nは各測定点での繰り返し回数とする。
12
平均温度は25.0 ºC。不確かさは?
分散分析の方法分散分析の方法
Ti(i = 1 a)のばらつきの標準偏差はもちろん
分散分析の方法分散分析の方法
Ti(i 1, …, a)のばらつきの標準偏差はもちろん以下の式で与えられる。
TはT (i = 1 n)の平均
211
1
n
iii TT
aTu
TはTi (i = 1, …, n)の平均
a
iTa
T 1ia 1
先に示したように、
u(Ti)は場所のばらつきの標準偏差ではない
それならば (T )とは何なのか?
u(Ti)は場所のばらつきの標準偏差ではない。
それならば、u(Ti)とは何なのか?13
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
「 (T )とは何か? 「Tとは何か?「u(Ti)とは何か?」 「Tiとは何か?」
Tiを構成している内容について確認してみよう。
ijiijT j = 1 nの平均として
場所による偏差
繰り返しによる偏差
j = 1,…, nの平均として、
n
jiji
a
jijii na
T11
11 jj na 11
14
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
n
jijii n
T1
1 jn 1
繰り返しの誤差!!(の平均値。)
というわけで、実際にはTiの実験標準偏差には 誤差の効果が残ってしまっている!
15
には、誤差の効果が残ってしまっている!
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
それでそれで、
n
ijii nT 1
jn 1
iの標準偏差
u
16
iu
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
n
jijii n
T1
1 jn 1
の標準偏差?
n
jijn 1
1
u ij注意!!!
これは“平均値の標準偏差” 平 n
u ijこれは 平均値の標準偏差 。平均値の標準偏差は一つの測定値の標準偏差を√(測定回数)で
17
標 定 数割ったもの。(次ページ)
平均値の標準偏差平均値の標準偏差平均値の標準偏差平均値の標準偏差
もしx1 x2 x が同じ標準偏差の分布にもしx1、x2、…、xnが同じ標準偏差の分布に従うなら、それらの平均値x
x = (x + + x )/nx = (x1 + …+ xn)/nの標準偏差は/√nであることが知られている。
左図がx1、x2、x3が従う分布とすると、
x = (x1 + x2+ x3)/3が従う分布は右図のようなもの 同じ分布ようなもの。同じ分布からの平均値は、分布の平均の周りに小
18
布の平均の周りに小さく鋭く分布する。
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
は“部屋の本当の平均の温度”という意味合 は 部屋の本当の平均の温度 という意味合いなので、ばらつきを持たない。
n
T 1 の不確かさ要因は
j
ijii nT
1 の不確かさ要因は
iu と n
un
u ijn
jij
1
1nn j 1
だから
19
だから、
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
不確かさの要因は二乗して足す!!
2
不確かさの要因は二乗して足す!!
n
uuTu ij
ii
222
n
iij uT ~place ijij uT ~repeat でしたから、、
n
TTTu ij
iji
2repeat2
place2 ~
20
n
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
TTTTT ij
n 2repeat2
22 1
n
TTTa
Tu ijij
iii
repeat2place
1
2 ~1
u(Ti)とは場所のばらつきとn回の平均
値に対する繰り返しのばらつきを足し値に対する繰り返しのばらつきを足したものを推定している。
ということになるわけです。
21
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
繰返しの不確かさu( )は 各測定点での繰り返しから繰返しの不確かさu(ij)は、各測定点での繰り返しから求めることができます。u(Ti)の標準偏差からu(ij)の効果を抜いてあげれば u( ) つまり場所によるばら効果を抜いてあげれば、u(i)、つまり場所によるばらつきの標準偏差repeat(Tij)の推定値、が求まります。
ijij
ii Tu
Tuu 2l
222 ~
ijii T
nTuu place
ようやく計算できる。
22
分散分析表分散分析表
毎度毎度 うな考察 計算す
分散分析表分散分析表
毎度毎度このような考察の上に計算するのは大変!!るのは大変!!
このような結果を実験の形式ごとにまとめておいて、解析しやすくしておけばよいのではないか?
そのために容易された表を
分散分析表
23
という.
分散分析表分散分析表分散分析表分散分析表
一元配置の分散分析表は以下のような表である。
要因 S (変動) f (自由度) V (分散) 分散の期待値
2 a n 2
位置 (A) fA = a-1 VA =SA/fA
2repeat(Tij)
+ n·2place(Tij)
a
i
n
ji TTS
1 1
2
A
繰返し(e) fe = a(n-1) Ve =Se/fe
repeat2(Tij)
a
i
n
jiij TTS
1 1
2e
総和 f = an-1
a
i
n
jij TTS
1 1
2
24
分散分析表分散分析表分散分析表分散分析表
変動(平方和)分散
測定点数
変動(平方和)
1
というどこかで聞いたことがある式になっている!!
要因 S (変動) f (自由度) V (分散) 分散の期待値
V 2 (T ) a n 2
位置 (A) fA = a-1 VA =SA/fA
2repeat(Tij)
+ n·2place(Tij)
a
i
n
jiA TTS
1 1
2
ただし、変動(平方和)の形式や分散が何を意味しているのか?に注意。場所によるばらつきの分散が求まってい
25
るわけではない!!
分散分析表分散分析表分散分析表分散分析表
変動(平方和)分散
測定回数
変動(平方和)
1
に(なっていない?いや、実はよく見ると)なっている。
要因 S (変動) f (自由度) V (分散) 分散の期待値
V a n 2
繰返し(e) fe = a(n-1) Ve =Se/fe
2repeat(Tij)
a
i jiij TTS
1 1
2e
この変動はa個の
計測点の変動の
これはa個の測定値それぞれに(測定回数-1)
つまり、a個の測定
点ごとの分散の平均
26
計測点の変動の和である。
ぞ (測定回数 )を考えてa倍している。
点ごとの分散の平均が求まっている!!
分散分析表分散分析表分散分析表分散分析表この表は因子Aについてのa水準n回繰返しの一元配
が置ではいつも使うことができる。量xに対して、その繰返しの分散ue
2(x)と因子の分散uA2(x)は分散分析表を用
算いて以下のように計算される。
2 2 e2e ~Vxu nVVxu AA e
2 ~
要因 S (変動) f (自由度) V (分散) 分散の期待値
A SA fA = a-1 VA = SA/fA e2(xij) + n·A
2(xij)
繰返し Se fe = a(n-1) Ve = Se/fe e2(xij)
27
総和 S f = an-1
分散分析表分散分析表冒頭の例に対して、適用した結果は以下の通り。
分散分析表分散分析表
C 29.0~ oerepeat VTu ij C 37.02~ o
eplace VVTu Aij
平均値25.0 ºCの不確かさは、
22 TuTu
もちろんこれに加えて温度計の校正の不確かさ
C 21.084
orepeatplace ijij TuTuTu
校正の不確かさが必要である。
要因 S (変動) f (自由度) V (分散) 分散の期待値
位置 1.07 ºC2 fA = 3 VA = 0.3567 ºC2 2repeat(Tij) + n·2
place(Tij)
繰返し 0.33 ºC2 fe = 4 Ve = 0.0825 ºC2 2repeat(Tij)
28
総和 1.40 ºC2 f = 7
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
要注意要注意
nVVTu 2だが
いつも、VA > Veになるわけではない。
nVVTu eAA だが、
ijij xunxuV 2A
2eA ~
いつも、VA Veになるわけではない。
ijij AeA
ijxuV 2ee ~
VAやVeは単なる分散の推定値でしかない。とくにuA(xij)が小さいときには、 VA < Veになる懸念がある。もしuA(xij) = 0なら、VAは約半
29
A e A ij A分の確率でVeよりも小さくなってしまう。
分散分析の方法分散分析の方法分散分析の方法分散分析の方法
従来の分散分析はむしろu (x )が0とみなすことができる従来の分散分析はむしろuA(xij)が0とみなすことができるかどうかを確かめるために行われてきた。 VA - Ve < 0であれば u (x )は存在しないとみなす つまり u (x ) =あれば、uA(xij)は存在しないとみなす。 つまり、uA (xij) = 0とする。
ただし uA (x) = 0ということは この実験全体が単なる繰り返しと
詳細を知りたい方は「統計的検定」について、調べてみて下さい。
ただし、uA (x) = 0ということは、この実験全体が単なる繰り返しと
みなすということだから、繰返しの分散は以下のように計算しなおした方がよい。
22e 1
11
a n
ij xxSxu
30
1 1
e 11 i j
ijanan
補足補足補足補足
改めて….
2repeat
2place ijij TT
T
なぜ
改めて….
? 84
~ repeatplace ijijTu なぜ ?
4つの測定点の平均値であるから、1測定点ごとのばらつきを (T )すると場所によるばらつきはばらつきをplace(Tij)すると場所によるばらつきはplace/√4、8つの測定の平均であるから、1回の測定の繰返しのばらつきを (T )とすると繰返しのばの繰返しのばらつきをrepeat(Tij)とすると繰返しのばらつきはrepeat/√8。その2つの不確かさ要因の二乗和の平方根をとると標準不確かさになる
31
和の平方根をとると標準不確かさになる。
3 分散分析のモデル式と3.分散分析のモデル式と適用範囲適用範囲
32
分散分析のモデル式分散分析のモデル式分散分析のモデル式分散分析のモデル式
分散分析をするべきところで それをせず誤った不確かさ評価分散分析をするべきところで、それをせず誤った不確かさ評価を行っていたりすることがある。また逆に一見分散分析が適していそうで、分散分析では解決しないこともある。分散分析を行うに適した状況とはどのようなものか?モデル式との関連から説明する。
例えば、「経験上ある量の測定には温度が影響することがわかっている その物理的理由は明確ではないので 温度に起かっている。その物理的理由は明確ではないので、温度に起因する不確かさを分散分析で評価したい。」これは可能か?
また、分散分析のモデル式をどう描くべきかという
33
式を う描く き う点についても触れる。
モデル式モデル式モデル式モデル式GUM4.1.1 多くの場合、測定量Yは直接には測定されず、他のN個の量X1、X2、…、XNから次の関数関係fにより決定される。
Y=f(X1、X2、…、XN) …(1)
mf
例えば、液体の体積vを、その質量mと密度から求める式は
mfv ,
m:重さの値 (g) :密度の値 (g/cm3)m:重さの値 (g) :密度の値 (g/cm )
この定式化を「測定のモデル化」と言う。立てられた式は 測定のモデル式と呼ばれるられた式は、測定のモデル式と呼ばれる。
モデル式の表明によって まず測定値の算出の仕方が明確化で
34
モデル式の表明によって、まず測定値の算出の仕方が明確化できる。また、測定に影響する量(m, )をリストアップできる。
モデル式と感度係数モデル式と感度係数モデル式と感度係数モデル式と感度係数
モデル式の表明によって、まず測定値の算出の仕方がモデル式の表明によって、まず測定値の算出の仕方が明確化できる。また、測定に影響する量をリストアップできる。先ほどの例では(m, )が影響する量である。きる。先ほどの例では(m, )が影響する量である。
さて、重さと密度のの標準不確かさが求まったとすると、
mmfv ,体積v のモデル式
m:重さ mu
:密度 u
体積vの影響量の評価はできた。vの不確かさ自体
:密度
35
体積vの影響量の評価はできた。vの不確かさ自体はどのように求めるか?
モデル式と感度係数モデル式と感度係数モデル式と感度係数モデル式と感度係数
が ( )だけ変わるとき に関係する量xがu(x)だけ変わるとき、xに関係する量y=f(x)はどれだけ変わるだろうか?
u(y)=c×u(x) 係数cを感度係数という
(y) ( )という。
y例えばu(y)=0.5×u(x)
y例えばy = 0.5×x + bならなら、c = 0.5。(右図参照) u(x)
b
36
( )
モデル式と感度係数モデル式と感度係数モデル式と感度係数モデル式と感度係数
しかし、普通は変化量を計算しよしかし、普通は変化量を計算しようとすると、方向が二つある。
f(x+u(x))-f(x)
f(x)-f(x-u(x))
u(x) u(x)
yとxの関係が直線(前ページの例)でない限り、方向によ て 感度係数 の値が変わ てしまう!!
37
よって、感度係数cの値が変わってしまう!!
モデル式と感度係数モデル式と感度係数モデル式と感度係数モデル式と感度係数
そこちらの方向ではxが大きくなったときの変化が大きいそこで、
読み値の点で接線
たときの変化が大きい
c×u(x)
読み値の点で接線を引くと、両方向の c×u(x)中間の特徴を持つ。
接線の傾きを感度u(x)係数とする。
38
こちらでは小さい。
モデル式と感度係数モデル式と感度係数モデル式と感度係数モデル式と感度係数
mu重さの標準不確かさ mu
u
重さの標準不確かさ
密度の標準不確かさ
mmfv ,
密度の標準不確かさ
モデル式の微分で求まる感度係数を使って、これらを測定量=体積の不確かさに変換する!!
重さに起因する体積の標準不確かさ
密度に起因する体積の標準不確かさ
mumvmucvu mm
uvucvu v
39
分散分析のモデル式分散分析のモデル式分散分析のモデル式分散分析のモデル式
もちろんこれらの二乗和の平方根をとったものが測定量の標準不確かさである。このようにモデル式を作る量の標準不確かさである。このようにモデル式を作ることは、「不確かさ要因をリストアップすること」と「感度係数を求めること」という二つの点で不確かさの算度係数を求めること」という二つの点で不確かさの算出に非常に役に立つものであることが分かる。
分散分析のモデル式は?
40
分散分析のモデル式分散分析のモデル式
分散分析を行うような場合 基本的にモデル式の形式
分散分析のモデル式分散分析のモデル式
分散分析を行うような場合、基本的にモデル式の形式は、以下のような形になりがちである。
corrrepeatday y
y:測定値 :真の値 :日間の偏差y:測定値 :真の値、 day:日間の偏差、repeat:繰り返しの偏差、 corr:校正の偏差
もちろん、例えば上記のyが何かの入力になることはあるから、以下のようなこともある。
zyzy yczycz
zyyyy ccccc corrrepeatday 41
分散分析のモデル式分散分析のモデル式分散分析のモデル式分散分析のモデル式
まず 分散分析のモデル式で気になるのはまず、分散分析のモデル式で気になるのは、
td y corrrepeatday y
:真の値 真の値 ?真 値
もちろん真の値は分からない。つまり、モデル式に入力デ不可能であり、モデル式のそもそもの定義からは大きく
逸脱してる。しかし、真の値であるからu() = 0と分かる。
GUM4.1.1 多くの場合、測定量Yは直接には測定されず、他のN個の量X1、X2、…、XNから次の関数関係fにより決定される。
Y f(X X X ) (1)
42
Y=f(X1、X2、…、XN) …(1)
分散分析のモデル式分散分析のモデル式分散分析のモデル式分散分析のモデル式このモデル式を微分すると感度係数が求まる。
1day
day
ycday
1repeat
yc
repeatrepeat
1y 1corr
corr
yc
「感度係数はモデル式の微分で求まる」という統一的で、強
力な理解ができるようになる。誤差の構造をよく表わすこの式
43
は不確かさ評価には非常に便利である。
分散分析のモデル式分散分析のモデル式分散分析のモデル式分散分析のモデル式
もちろん ( + + + )全体は分かる値であるもちろんy = ( + day+ repeat + corr)全体は分かる値である。GUMの事例で一元配置が紹介されているがその際のモデル式は 冒頭の例に当てはめるとル式は、冒頭の例に当てはめると、
Ty
Tというものである。もちろん はわかる値で、モデル式の元
の定義によく合致する。しかし、これでは誤差の構造も分からず 微分して感度係数を求めるという形にもならないからず、微分して感度係数を求めるという形にもならない。
結局どちらをとっても一長一短である 併記するのもよいか結局どちらをとっても一長一短である。併記するのもよいかもしれない。( など)。いずれにせよ
議論の残る部分ではある。とりあえず本講習では、真の値をrepeatplaceTy
44
議論の残る部分ではある。とりあえず本講習では、真の値を含む表記を許し、それを中心に議論する。
分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲ここで先ほどの問題。
例えば、「経験上ある量の測定には温度が影響することがわかっている。その物理的理由は明確ではないので 温度に起かっている。その物理的理由は明確ではないので、温度に起因する不確かさを分散分析で評価したい。」これは可能か?
似た式なので誤解しやすいが、分散分析で不確かさ評価行う場合 下のような形になることはほとんどない価行う場合、下のような形になることはほとんどない。
corrrepeattemp y corrrepeattemp
y:測定値 :真の値、 temp:温度に起因する偏差、繰り返しの偏差 校正の偏差
45
repeat:繰り返しの偏差、 corr:校正の偏差
分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲
なにが違うのか?なにが違うのか?
y:測定値 :真の値 :日間の偏差
corrrepeatday y
y:測定値 :真の値、 day:日間の偏差、repeat:繰り返しの偏差、 corr:校正の偏差
corrrepeattemp y
y:測定値 :真の値、 temp:温度に起因する偏差、繰り返しの偏差 校正の偏差
corrrepeattemp
46
repeat:繰り返しの偏差、 corr:校正の偏差
分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲
y
温度に関しては
corrrepeattemp y
「繰り返しの実験の最中にも刻々変化する」「繰り返しの実験最中には変化しないが設定からずれている」
のどちらかであるのどちらかである。
前者であれば は 含まれており 別に考察する必前者であれば、 tempはrepeat含まれており、別に考察する必要がない後者とき分散分析によるアプローチがあるとすれば、設定か
らのずれがどのくらいの標準不確かさをもつかを調べるということであるが、その標準不確かさu(T)がわかったとしても、測定量の不確かさには繋がらない
47
定量の不確かさには繋がらない。
分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲結局、温度に起因する偏差のようなものが問題になる場合
Tuc T temp
という構造をtempの内に有していることが多い。こな 「 度 起 す 定の場合、分からないのは「温度に起因する測定量
の不確かさtemp」というよりも、「感度係数cT」であるる。
「感度係数はモデル式の微分で与えられる」から 実「感度係数はモデル式の微分で与えられる」から、実はこのような感度係数が分からないときにすべきなのは、分散分析ではなく、回帰分析によってモデル式を
48
近似的に導くことである。
分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲分散分析の適用範囲
従来の効果の検定のための分散分析との関連から勘違従来の効果の検定のための分散分析との関連から勘違いしやすいが、このように不確かさ評価における分散分析では定量的な物理量が因子になることはほとんどない。因子となりやすいのは位置、時間、測定者、測定器などの変量的な因子で、その標準偏差を求めるものである。定量的な量が因子になる とも必ずしもないわけではな定量的な量が因子になることも必ずしもないわけではないが、モデル式や感度係数を知りたいという問題になっていないか注意すべきであるていないか注意すべきである。
49
4 実験計画4.実験計画
50
実験計画実験計画実験計画実験計画
「一元配置」であれば 先ほどの分散分析表を用いて分散を計「 元配置」であれば、先ほどの分散分析表を用いて分散を計算することができた。様々な実験の方法に相当する分散分析表が用意されているので、われわれはそれを用いて簡単に分散の分解ができる。問題は、どのような実験を行うか、「実験計画」を定めることである。
A1 A2 A3
1 ○○ 1 ○△ 1 ○○例えば。
B11 ○○ 1 ○△ 1 ○○
2 ○△ 2 ○○ 2 ○○
B1 △○ 1 ○△ 1 ○△
B2 2 ×△ 2 ○△ 2 ○×
実はこの表見ただけではどのような分散分析表を用
51
実 表見 う 分散分析表を用いるのか決められない。
実験計画実験計画実験計画実験計画
以下のような表の場合、大きく分けて3つの解釈できる。
① 2名の測定者で同じ3つの試料を測定する。② 2名の測定者が各々異なる3つの試料を測定する② 2名の測定者が各々異なる3つの試料を測定する。③ 3つの試料について各々異なる2名の測定者が測定する。
試料1 試料2 試料3
測定者11 ○○ 1 ○△ 1 ○○
測定者12 ○△ 2 ○○ 2 ○○
測定者21 △○ 1 ○△ 1 ○△
2 ×△ 2 ○△ 2 ○×2 ×△ 2 ○△ 2 ○×
一番目以外はこの表の理解として自然でないようにも思えるが、実際 確 さ 価 ② ③ 常 くあ あ
52
実際の不確かさ評価では②や③は非常によくあるケースである。
多元配置多元配置多元配置多元配置
① 2名の測定者で同じ3つの試料を測定する。① 名 測定者 同 試料を測定する。
この場合「測定者1」と「測定者2」は「試料1」、「試料2」、「試料3」のいずれ対しても同じ人である この場合 測定者は「対応3」のいずれ対しても同じ人である。この場合、測定者は「対応がある」という。もちろん試料も「対応がある」。
ともに対応がある2つの因子がある実験計画を「二元配置」の実験計画と言う。元配置」の実験計画と言う。
53
多元配置多元配置多元配置多元配置
「二元配置」は非常に細やかな実験計画であることが分かるだ「二元配置」は非常に細やかな実験計画であることが分かるだろう。それほど大規模には行うことが難しい。その代わり「測定者1」は「試料1」を測るときだけ値を大きく報告しがちで、 「試料2」と「試料3」では小さく報告しやすいとかいう精緻な点まで
検討することができる。ちなみに、このような相性の問題を分散分析の用語では「交互作用」と呼ぶ散分析の用語では「交互作用」と呼ぶ。
対応がある因子がk個ある場合、k元配置と呼ぶ。またそれら対応がある因子がk個ある場合、k元配置と呼ぶ。またそれら
を総称して多元配置と呼ぶ。もし交互作用がある場合には、多元配置による実験を行う必要がある。
もちろん詳細な検討は必要だが、交互作
54
用が問題なることはあまりない。
枝分かれ枝分かれ枝分かれ枝分かれ
② 2名の測定者が各々異なる3つの試料を測定する。② 名 測定者 各 異なる 試料を測定する。
「測定者1」にとっての「試料1」、「試料2」、「試料3」 と「測定者2」にとってのそれらは異なる 試料には「対応がない」 一方2」にとってのそれらは異なる。試料には「対応がない」。一方、測定者には「対応がある。」
1つの因子を除いて他すべての因子に対応がない場合、「枝分かれ」実験計画という。い場合、 枝分かれ」実験計画という。
名前が同じ「試料1」なだけで別の試料である。だけで別の試料である。
55
枝分かれ枝分かれ枝分かれ枝分かれ
「枝分かれ」の意味するところは察することができる 「測定「枝分かれ」の意味するところは察することができる。「測定者」と「試料」には階層構造がある。(下図参照。)対応のある「測定者」が最上位の構造である。測定者は2名だが、試料は測定者」が最上位の構造である。測定者は2名だが、試料は6種類である。二元配置では2回の繰り返しで24回の実験を行
うところである。交互作用がないと分かっているときには、先のような枝分かれ実験計画を実施することにより、その実験の回数を12回に減らし、同じ精度の解析が行える。
56
枝分かれ枝分かれ枝分かれ枝分かれ
③ 3つの試料について各々異なる2名の測定者が測定する。③ 試料 各 異なる 名 測定者 測定する。
試料には「対応がある」。一方、測定者には「対応がない。」
これも、「枝分かれ」実験計画である。
名前が同じ「測定者1」なだけで別の人である。
名前が同じ「測定者2」なだけで別の人である。
57
枝分かれ枝分かれ枝分かれ枝分かれこの場合下のように書けば、誤解がないのでは?
試料 測定者 繰返し
測定者11 ○○
このように書けば誤解が
ないし、枝分かれの構造が分
試料1測定者1
2 ○△
測定者21 △○
2 ×△
な 、枝分 構造 分かりやすい。実際にこのような表記もよく行われる。(もっと層が増え くと 冗長な2 ×△
試料
測定者31 ○○
2 ○△
と層が増えていくと、冗長な表記になり、逆に理解を阻害するかも知れない )試料2
測定者41 △○
2 ×△ 枝分かれ実験計画の層の数kに
するかも知れない。)
試料3測定者5
1 ○○
2 ○△
1 △○
応じて「k段枝分かれ実験計画」
と呼ばれる。ただし、繰り返しは含まない。左の場合2段枝分か
58
測定者61 △○
2 ×△れである。
5. (つり合い型)枝分かれ実験計画
59
枝分かれ実験計画の分散分析枝分かれ実験計画の分散分析
枝分かれ実験計画の分散分析表の中身を説明する 先ほど
枝分かれ実験計画の分散分析枝分かれ実験計画の分散分析
枝分かれ実験計画の分散分析表の中身を説明する。先ほどの最後の例「③ 3つの試料について各々異なる2名の測定者
が測定する。」を取り上げる。「つり合い型」とは、この場合全ての試料について、測定者と繰り返しの数が同じことを意味する。
60
二段枝分かれの分散分析二段枝分かれの分散分析二段枝分かれの分散分析二段枝分かれの分散分析
測定量:ある30 gの粉末中の成分Aの含有量
30 gの粉末中を10 gずつ、3つの試料に分割し、各々の
測定量:ある30 gの粉末中の成分Aの含有量
試料は別々の2名、計6名の測定者によって、それぞれ2回ずつ分析された。
全ての分析は同じ分析機器を用いている この機器の校 全ての分析は同じ分析機器を用いている。この機器の校正による含有量の値の標準不確かさは0.01 gと分かっている。
試料1 試料2 試料31 0 97 1 1 09 1 1 02
上記の方法で得られた10 gの試料中の成分Aの含有量(g)の12個の測定値
測定者11 0.97 1 1.09 1 1.022 0.99 2 1.11 2 1.04 1 0.91 1 1.06 1 0.95
61
測定者21 0.91 1 1.06 1 0.952 0.91 2 1.07 2 0.99
モデル式と不確かさ評価モデル式と不確かさ評価モデル式と不確かさ評価モデル式と不確かさ評価
33 mMモデル式
corr33 ijkijimMモデル式
M :ある30 gの粉末中に成分Aの含有量m :試料10g中の成分Aの含有量の12回の測定の平均値
3 2 2
:試料間の偏差の平均値
3 2 2
i j kijkmm
試料i、測定者jにつi :試料間の偏差の平均値ij :校正の偏差の平均値ijk :繰り返しごとの偏差の平均値
いてのk回目の測定値をmijkとする。
ijkcorr :校正の偏差
M 3 3 0275ず
62
M = 3×m = 3.0275 g まずは、測定値
モデル式と不確かさ評価モデル式と不確かさ評価モデル式と不確かさ評価モデル式と不確かさ評価
一回の測定値に対する 試料間の偏差の標準偏差を回の測定値に対する、試料間の偏差の標準偏差をusample(mijk)、 測定者間の偏差の標準偏差をuhuman(mijk) 、繰り返しごとの偏差の標準偏差をurepeat(mijk)とする。
標準不確かさ 、 、 について、 ijku iju
iu
“3つの試料”の平均だから、 3
sample ijki
muu
“6人の測定者”の平均だから、 6
human ijkij
muu
“12回の測定”の平均だから、
6
12repeat ijk
ijk
muu
63
12
モデル式と不確かさ評価モデル式と不確かさ評価
もちろんu() = 0。また1回の校正だから(校正を何度も受けた
モデル式と不確かさ評価モデル式と不確かさ評価
もちろんu() 0。また1回の校正だから(校正を何度も受けた
からと言って、その平均値で補正する訳ではない。)、校正の標準不確かさucorr(mijk) (= 0.01 g)として、u(corr) = ucorr(mijk)。
3j
c
3i
Mc i 3corr c3k
c
感度係数は、 、同じく 、 、 。i
各要因の標準不確かさを感度係数にかけて、平方和をとったものが、測定量の標準不確かさの二乗である。、測定 標準 確 あ 。
つまり測定量の標準不確かさは、
ijkijkijkijk mu
mumumuMu 2
corr
2repeat
2human
2sample3
つまり測定量の標準不確かさは、
64
ijkmuMu corr12633
モデル式と不確かさ評価モデル式と不確かさ評価
最初の一元配置のところではこのような考察は深くは行わな
モデル式と不確かさ評価モデル式と不確かさ評価
最初の一元配置のところではこのような考察は深くは行わなかったが、ときに
mumumumumu 2222
としてしまう誤りを目にすることがある。これは平均値ではなく「 回の測定値 ( まり ではなく )の不確かさである
ijkijkijkijk mumumumumu corrrepeathumansample
「一回の測定値」(つまりm ではなくmijk)の不確かさである。
分散分析は基本的に“多くの似たような測定量に対する測定値を用いて蓄積された標準偏差”、いわゆる「プールされた標準偏差」を標準不確かさとして用いる方法である 「プールされた標差」を標準不確かさとして用いる方法である。 「プールされた標
準偏差」を用いる場合、測定値が何の平均値であるのかをきちんと見極め、正しい不確かさ評価を行う必要がある。
65
んと見極め、正し 不確かさ評価を行う必要がある。
二段枝分かれの分散分析表二段枝分かれの分散分析表二段枝分かれの分散分析表二段枝分かれの分散分析表
分散分析表は以下のようになる一段目の要因をA(水準数a)、二段目の要因をB (水準数b) 、繰返しn回とする。
分散分析表は以下のようになる。
要因 S (変動) f (自由度) V (分散) 分散の期待値
A SA fA = a-1 VA = SA/fA e2(xijk) + n·B
2(xijk)+ bn·A2(xijk)
B SB fB = a(b-1) VB = SB/fB e2(xijk) + n·B
2(xijk)
繰返し(e) Se fe =ab(n-1) Ve = Se/fe e2(xijk)繰返し(e) Se fe ab(n 1) Ve Se/fe e (xijk)
総和 S f = abn-1
a b n 2 a b n 2
a
i
b
j
n
ki xxS
1 1 1A
a
i
b
j
n
kiij xxS
1 1 1
2
B
a b n
xxS 2
a n n
S2
66
i j k
ijijk xxS1 1 1
e
i j kijk xxS
1 1 1
二段枝分かれの分散分析表二段枝分かれの分散分析表二段枝分かれの分散分析表二段枝分かれの分散分析表
今回の結果に適用すると、
要因 S (変動) f (自由度) V (分散) 分散の期待値
試料(s) 0 038317 2 0 0191583 2repeat (mijk) + 2·2
human (mijk)試料(s) 0.038317 2 0.0191583 p j j+ 4·2
sample (mijk)
測定者(h) 0.009725 3 0.0032417 2repeat (mijk) + 2·2
human (mijk)
繰返し(e) 0.001450 6 0.0002417 2repeat (mijk)
総和 11
urepeat (mijk) = √(0.0002417) g = 0.01555 guhuman (mijk) = √[(0.0032417-0.002417)/2] g = 0.03873 g
67
jusample (mijk) = √[(0.0191583-0.0032417)/4] g = 0.06308 g
二段枝分かれの分散分析表二段枝分かれの分散分析表
測定値の標準不確かさは 以下のように求めることができる
二段枝分かれの分散分析表二段枝分かれの分散分析表
測定値の標準不確かさは、以下のように求めることができる。
g 1236.01263
3 2corr
2repeat
2human
2sample ijk
ijkijkijk mumumumu
Mu1263
包含係数(k = 2)として、
測定量(ある30 gの粉末中の成分Aの含有量)は、
3.03 g ± 0.25 g (k=2)
と、報告することができる。
68
6. おわりに
69
ランダムにする理由ランダムにする理由ランダムにする理由ランダムにする理由
実験の順序はランダムにするべき!!実験の順序はランダムにするべき!!ということを不確かさの視点から見てみる。
例えば、3種類の試料があるときに試料間のばらつきを分散分析で調べたい場合を考える。分析で調べたい場合を考える。
70
ランダムにする理由ランダムにする理由ランダムにする理由ランダムにする理由
各試料につき繰り返し3回の一元配置の実験計画で、計9回の実験を行うこととする。以下の場合では問題がある。なぜだろうか?
試料 定--打ち合わせ----出社--
試料2の測定10:45-11:30
休憩
試料3の測定15:00-15:45
実験開始試料1の測定8:30-9:15
試料1の測定9:15-10:00
試料2の測定12:30-13:15
--休憩--
試料3の測定15:45-16:30
8:30 9:15
9:15 10:00
試料1の測定10:00 10:45
試料2の測定13:15 14:00
15:45 16:30
試料3の測定16:30 17:1510:00-10:45 13:15-14:00 16:30-17:15実験終了
71
ランダムにする理由ランダムにする理由ランダムにする理由ランダムにする理由
実験を続けていると、実験装置からの発熱で室温が上がり、そのせいでピーク強度が大きくなるということがあったとしたら?
休憩や打ち合わせの間に充分に温度が落ち着かなければ休憩や打ち合わせの間に充分に温度が落ち着かなければ、室温は一日の実験が終了するまで上がり続ける。試料1のピーク強度は小さく、試料3のピーク強度は大きくなる。試料間のかたよりと温度の変動によるばらつきが区別できなくなる。
もちろん管理の上で 知りたいばらつきが求まっていないこ
結果 不確かさはどうなるのか?
もちろん管理の上で、知りたいばらつきが求まっていないことそのものが大きな問題ではあるが。。。
72
結果、不確かさはどうなるのか?
ランダムにする理由ランダムにする理由ランダムにする理由ランダムにする理由
細かくみると、細かくみると、
試料 定--出社--
ブロ クiごとに温度
ブロック1 ブロック2
試料2の測定10:45-11:30
休憩
実験開始試料1の測定8:30-9:15
ブロックiごとに温度
の設定からのずれTiが生じる。この
試料1の測定9:15-10:00
試料2の測定12:30-13:15
--休憩--8:30 9:15 Tiが生じる。この
温度のずれに対して測定量が(Ti)ず9:15 10:00
試料1の測定10:00 10:45
試料2の測定13:15 14:00
( )れるとする。その標準偏差をu2((Ti)) としよう
73
10:00-10:45 13:15-14:00 としよう。
ランダムにする理由ランダムにする理由
ランダム化したときの繰り返しの不確かさをurepeat、試料間の不
ランダムにする理由ランダムにする理由
ランダム化したときの繰り返しの不確かさをurepeat、試料間の不確かさをusampleとする。
もしランダム化ができていないと、u2((Ti)) が試料間のばらつきもしランダ 化ができて な と、 ( (Ti)) が試料間のばら き
と区別できなくなってしまい、試料間のばらつきとして分散分析で求められるのは、
u'2sample = u2sample+ u2((Ti))
である。ただし、繰り返し間のばらつきはその分少なくなって、
となる
u'2repeat = urepeat - u2((Ti))
74
となる。
ランダムにする理由ランダムにする理由
平均値は“3つの試料”、“9回の測定”の平均値だから、その標準
ランダムにする理由ランダムにする理由
平均値は 3つの試料 、 9回の測定 の平均値だから、その標準不確かさは以下のように計算される。
22
93
2repeat
2sample uu
xu
ランダム化されていないときの平均値は、
2222
uuuuxu TiTi
93'
22repeat
22sample
xuuuuuu Ti
9392
93
2repeat
2sample
22repeat
2sample
75
ランダムにする理由ランダムにする理由ランダムにする理由ランダムにする理由
実験を続けていると、実験装置からの発熱で室温が上がり、そのせいでピーク強度が大きくなるということがあったとしたら?
結果、不確かさが大きくなる。
逆に
なるべくランダムに実験計画を作ることは、計測値の管
逆に、
なる くランダムに実験計画を作ることは、計測値の管理の問題だけではなく、不確かさの低減にもつながる。
も 値 管 があ 確 が も ば ダ
76
もちろん計測値の管理上の問題があるので、不確かさが大きくてもよければ、ランダムにしなくてよいということではありませんが。
ソフトウェアソフトウェアソフトウェアソフトウェア
当研究室の運営している「不確かさWeb ( http://www.nmij.jp/~mprop-stats/stats-当研究室の運営している 不確かさWeb ( http://www.nmij.jp/ mprop stats/statspartcl/uncertainty/uncertainty.php ) 」のホームページから、 Excelのアドイン(あら
かじめ登録してあるひと通りの計算手順をツールバーのタグをクリックすることで行うようにする機能)として分散分析のプログラム「AIST-ANOVA」が簡単な登録のみで、無料でダウンロードできる。本日お話した全ての実験計画で応用が可能で、10種類の要因までの解析が可能である。興味のある方は一度ダウンロードして、使い勝手を試してみていただきたい。
77
おわりにおわりにおわりにおわりに
変量的な違い(測定者 測定方法 測定場所)によるずれの測定量に対す変量的な違い(測定者、測定方法、測定場所)によるずれの測定量に対する不確かさを定めるのに、分散分析は非常に強力なツールである。どのような実験計画が有効かよく検討して、応用していただきたい。分散分析表の作法に関しては様々な書籍があるので参考にされたい (例えば 近藤の作法に関しては様々な書籍があるので参考にされたい。(例えば、近藤良男、船阪渡「技術者のための統計的方法」共立出版(1985)、他にも「分
散分析」「実験計画」をキーワードに多くの書籍が見つかるだろう。)しかし、うな数学的 法 われ 実験をなる く ダ するこのような数学的手法にのみとらわれて、実験をなるべくランダム化するこ
とを忘れてはならない。むしろコストの面からどこまでランダム化できるかという考えに基づいて、実験の計画を定めるべきである。
78
参考資料(二元配置)参考資料(二元配置)
79
二元配置の分散分析二元配置の分散分析二元配置の分散分析二元配置の分散分析
因子が位置 時間 測定者 測定器によるずれなど因子が位置、時間、測定者、測定器によるずれなどのように実験者が自分で制御できないものの場合、これを変量因子と呼ぶ ここに示すのは2つの変量因子れを変量因子と呼ぶ。ここに示すのは2つの変量因子がある場合の二元配置の分散分析表である。
一つ目の要因をA(水準数a)、二つ目の要因をB (水準数b) 、繰返しn回とする。因子A、因子B、交互作用、繰り返しの1測定値の標準不確かさをそれぞれ ( ) ( ) ( ) ( )とする なお 交互作用がある場合のれuA(xijk)、 uB(xijk)、 uA×B(xijk)、 ue(xijk)とする。なお、交互作用がある場合の総平均xは “a個のA”、“b個のB”、“ab回の交互作用”、 “abn回の繰り返し”の平均であるから、標準不確かさは以下のようになる。
bxu
bxu
bxuxu
xu ijkijkijkijk2e
2BA
2B
2A
80
abnabba
二元配置の分散分析表二元配置の分散分析表一つ目の要因をA(水準数a)、二つ目の要因をB (水準数b) 、繰返しn回とする。
二元配置の分散分析表二元配置の分散分析表
要因 S(変動) f (自由度) V (分散) 分散の期待値
A SA fA = a-1 VA = SA/fA u 2(xijk) + n·uA B2(xijk)+ bn·uA
2(xijk)A SA fA a 1 VA SA/fA ue (xijk) + n uA×B (xijk)+ bn uA (xijk)
B SB fB = b-1 VB = SB/fB ue2(xijk) + n·uA×B
2(xijk)+ an·uB2(xijk)
f = V =A×B SA×BfA×B =
(a-1)(b-1)VA×B =
SA×B/fA×Bue
2(xijk) + n·uA×B2(xijk)
e Se fe =ab(n-1) Ve = Se/fe ue2(xijk)
交互作用
繰り返し e e ( ) e e e e ( ijk)
総和 S f = abn-1
a b n 2
繰り返し
2
a
i
b
j
n
ki xxS
1 1 1
2
A
a b n
S2
a b n
S 2 a n n 2
a
i
b
j
n
kjiij xxxxS
1 1 1
2
BA
81
i j kj xxS
1 1 1B
i j k
ijijk xxS1 1 1
2e
i j kijk xxS
1 1 1
二元配置の分散分析表二元配置の分散分析表二元配置の分散分析表二元配置の分散分析表
交互作用が無視できる場合一つ目の要因をA(水準数a)、二つ目の要因をB (水準数b) 、繰返しn回とする。
交互作用が無視できる場合。
要因 S(変動) f (自由度) V (分散) 分散の期待値
A SA fA = a-1 VA = SA/fA ue2(xijk) + bn·uA
2(xijk)
B SB fB = b-1 VB = SB/fB ue2(xijk) + an·uB
2(xijk)
e Se fe = abn-a-b+1 Ve = Se/fe ue2(xijk) 繰り返し
総和 S f = abn-1
a b n 2a b n 2
繰り返し
a
i
b
j
n
ki xxS
1 1 1
2
A
a
i
b
j
n
kj xxS
1 1 1
2
B
a b n 2
a n n 2
82
i j kjiijk xxxxS
1 1 1e
i j kijk xxS
1 1 1