Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
農林學報 48 (31 : 55 ~ 68 (1 999 1 民d
pa
傅立黨級數估式對一個迴歸函數的自己過
林永立 1 ) 郭寶錚2) 何兆銓3)
(接受刊歡日期 -中華民國 88 年 8 月 18 日)
摘要:當觀測的資料具有週期性的現象時,可以考慮以包含正拉及餘弦的線性模式來估計過
歸函數μ' 典型傅立葉級數估式即為一例,但當迴歸函數無法滿足週期性的邊界條件時,利用
誤差均方的方法來決定典型傳立葉級數佑式中的三角函數項次多少的準則,如 GVC 等,常會
造成使用過多的項次,使得估式較為晃動。在典型傅立葉級數估式中如能加上低階的多項式可
解決無法滿足週期性邊界條件的問題,所得到的估式也較為平滑 。 本文將探討直交級數估式的
性質,並以數例說明如何以 GCV 準則來選取典型傅立葉級數估式的項次,及其求配過程和當
斷分析等,並考慮加入低階多項式,以滿足邊界效應,並比較兩函數對資料配適的表現。
關鍵字:傳立葉級數,直交級數估式,廣義交叉確認,多項式的三角迴歸。
則已
迴歸分析 (regression analysis) 的目的
之一在於尋找一適當的數學模式 ,來探討資
料組 l (圳) 1 ~'= I 中,設計點 (design point)lj
與反應變數 yj 的期望值之間的關係'通常設
計點 tj 與反應變數 VJ 的期望值間之關係模式是存在的( IO ì 。無母數迴歸分析 (nonparamet
ric regression analysis) 不同於母數迴歸分
析 (parametric regression analysis) ,因為
它只需假設迴歸函數為一平滑的曲線(數學
上的說法則為迴歸函數之二階導函數存在且
連續) ,而並不需要侷限迴歸函數的基本模
式 。 一般迴歸模式可表示如下:
yJ=μ(tj)+εj ,j=l ,...., n' (1)
此喔, ε = (εl 、.., εn)' 為平均值為0' 具有共同雙方 σ2 ,且彼此間互相獨立的逢機機
差所構成的機差向量, μ表示一個未知的平
滑函數( 4 ) 。
無母數迴歸分析是一種重要的統計分析
工具,基本上它是利用過歸函數的平滑特性
來尋找迴歸估式,也就是在過歸函數 μ ,其
平滑性 (smoothness) 被確認下,則在估計 μ
(t) 的時候,利用估計點 t 鄰近區域 (neigh
borhood) 內的觀調iJ值 yj 來提供估式丘 (t) 的
訊息;而估計點 t 鄰近區域外的觀測值只有提
供少量甚至沒有提供估式 丘 (t) 的訊息。因此要估計 μ(t) 的最簡單方法就是將這些含有μ
1 )國立中興大學農藝學系碩士班研究生。
2) 國立中興大學農藝學系副教授(通訊作者)。
3) 國立中興大學應用數學系副教授。
.'ifi
(t)訊息的資料作加權平均。無母數迴歸分析
的方法中,直交級教估式 (orthogonal series
esti mators) 是一種對觀測值 y 作加權平均的
估計方法:而傳立葉級數估式 (Fourier
series estimator) 正為直交級數估式的一種
在線性 (linear) 母數模式中,對於迴歸
函數 μ 的基本形式假設為已知,而 μ一位可
以用2 月 rXJ( t)來表示,其中XJ(t)表示為觀測
資料中之解釋變數, β1為其相對應之迴歸參
數 2 在無母數迴歸中,倘若只假設 μ 為連續
的函數峙,直交級數估式可以仿照線性母數
模式的情形,用某些己生日的函數集合所構成
的無限項線性組合來表示迴歸函數。本文目
的在於對直交級數佑式的性質做一些探討,
並以數例說明如何以廣義交叉確認 (general
ized cross-validation; GCV) 準則來選敢典
型傳立葉級數估式中的項次,及其求配過程
和診斷分析等,並考慮加入低階多項式以滿
足運界效應,並比較兩函數對資料配適的表
現 D
廣義傅立葉級數 (generalized Fourier
serier) 與其估式
密 i主函數之直交的級數估式最初是由
Cencovl21 提出的 (cf. Prakasa Raol i 11;
Silverman" 訂) ,而對於定點設計迴歸模式的
情形是由 Rutkowski '121 所提出。其一般理念
是將迴歸函數展開成為一個博立葉級數:
μ(t) 內主 ßj~j(t) (2)
此式稱之為廣義傅立葉級數,其中(中 d':l
馬已知的基底 (basi s ) 函數,而( ß j );1 則為
未知的廣義傳立葉參賽史。
在一個無限維度的向量空間中,如
L2[a ‘ b] 空間 這裡空間 L2扭, b] 指的是在區
f導立j;級教估式對一個迴歸函數的配通
間 [a ‘ b] 聞所有平方可積分 (square inte
grable) 之函數的集合。首先,若屬於 L2扭, b]
空間中的二個函數 hl 與 h2 '如果 hl 與 h2 間
的內積 (inner product)為零(也就是 <hl , h2
>= J h l (t)h2(t)dt=ü) 時,則函數 hl 與 h2 稱
做是直交的:再者,若一函數的序列{中 j}
中,其基本的元素中 j 是成對 (pairwise) 直
交的並且其和模 (norm) 為 1
(也就是 !I 中三 (5 中 j(t)2dt 1'/"=1 )時
則稱此函數序列(中 jl是為正則的(orthonor
mal) 最後,若對於所有的 J '函數 μ 與函
數序列{中 d中的元素中 J 直交的話,則 μ 三
0 峙,那磨這函數序列(中 J}稱做是一個完全
的耳目系統 (complete orthonormal system) ,
簡稱為 CONS 。因此可以了解到,若{中 j}
是 L2[a , b] 空間中的~ CONS '表示說與所
有的中 J 直交的函數僅有零函數而已,也就
可以用一基底函數(中 J}之無限多的線性組合
來表示 μ 。
之前所提及之基底函數(中 j} 就是一個
CONS '在 L2仙, b] 空間的傅立葉參數,依
據 LuenbergerlY1 書中的所提之定理,定義為
ßj=(μ'~j) = fJ.i(t)中/t) (3)
對於所有的 α 三 ( a 1 、...., αA ) ,屬於歐基里
德的 λ 度空間時,將會使得
)μ-ZRhli 三 11μ-N那層意思就是說對於迴歸函數 μ 而言,當假
設 μ 屬於 L2位 , b] 函數空間,我們可以了解到
在給定一個 CONS 為 i 中 j}' 對於在 L2恤,b]
函數空間中之任一函數可以找到一個廣義傅
立葉級數展閉式,為 主向中 j( t) ,並且當 λ
趨近於無限大時,:2:月 j <Þ j(t) 會在 t 上均勻地
農林左手報 48 (31 : 55 - 68 11999i
l收斂到 μ c t吋此在這些假設下對於 μ 而言 ,
原始資料便會遵循著 ‘具無限多個未知迴歸
參數之線性模式 3 所以 , 以廣義傳立葉級教
展開式來表示 μ 時,此時要獲得 μ 的估式,
意即在求取廣義傳立葉級數估式 , 這可藉由
(專 立葉參戰 lßd 的估計得到解決。
當所取得的觀 ìWJ值為在區間 [a.b] 中之離
散的點 (discrele poinlsl 時, lA ,l"=1 為互斥的 I~間 (di 日joi nl i nlervals) 的集 合時 ,使得
2A=[a.b J '且 1 , 三 A ' i= l.. .. n 。I= !
那閉雙若區間 A1 鳥在 t 周圍集結的區間峙,對
於式i3) 可有為
ß j =幻 μ(t)~) (t)dt
zp(tz)幻j(t)dt 0 :{)
閃此 , 用反應變敷出來取代 μ(l i )時 ,就可以
得到(3,的估式 ,為
ßj今i 1. ~)(抽l揖此 , 最後可以得到 μ 的廣義傳立葉級醫生估
式 , t吧,
已(肛三師/t) , ) . 1
其中 λ 馬一合理的整數值 占 這個佔式也可視
為是對觀測值 v 作加權平均的 - -f重形式 , 其
權重傌 n5iμμ。吭) (如抽財S 中h州削州J正ρ川(肛份t吋)川
式 i心6心}中的 λ 決定了此展開式在 f估古計仁中扣所
包括直交商數的個數,較大的 λ 值將意謂著
此估式的偏差會較為小,另一方面,此估式
的雙方會隨著 λ 的增加而增加,由此可了解
到此估式的偏差與雙方是種相互拉址( lrade
ofO 的形式發生。因此可合理增暇設有一 整
數 λ 可使得 μ 三2: ß 1 中 ,並且
RU
〉 j 竺 E d j h( 1 1)+ 丸,其中 i= 1 , ....n '這 可
視為一線性橫式:如此在找到一適當的 λ 數
值下,即可以 231 中 Jt,)進行對 μ 的估計。
λ數值的選取
使用式 (6 )來進行對於迴歸函數 μ 的估計
時,那磨便要去選擇一個 λ 的數值 。 λ 的選
取將會控制估式是否平滑或晃動:通常,犬
的 λ 數值將會導致估式較為晃動,因此這裡
的 λ 可視為是一平滑參數。
基於統計理論,可藉由損失函數( 10ss
funClion) 、風險函數 (risk function) 或預測
風險函數 (prediction risk function) 的使用
來決定 λ 的數值\ I.~) 。 當使用估式丘來進行
過歸函數 μ 的估計時,損失函數的定義爵
Lλ = n-II(μ(t j) 一已(t j ))2
1, 31
可被用來表示 μ 與丘間的接近程度:損失函
數的期望值定義為風險函數,寫成
R人 =E\L ,} =n土w 吋州: 毛主:
KV
了:者皆依!別台觀測值資料 1 (tj ,Yj) 1 ~=1 所定
義。男外,假設在原來的設計點 lj 上觀視IJ到
新觀測值 )'j獻,其資料組為 1 (t j')'J') 1 ~=1 '依循著 下面的模式
yJ=μ(t j) +εJ , j= l,. ..,n '
其 I扣 μ 與式(j)相同 ,而 ε*為逢機機差所構成
的機差向量 , 其平均值為0' 各機差間彼此互
相獨立外 ,與構成 ε 的逢機機差間亦互相獨
立,且具有共同雙方 σ2 。 則定義預測風險
函數如下:
民寸
' 、- ;)Ö -
因此預測風險函數等於風險函數加上常數σ 。
L λ 、 R\ 與P ), 皆可用來檢測 μ λ的表現 ,其值
愈小,代表利用某 λ 個項次之級數和所構成
的估式μ較佳。遺憾的是,因為實際上的 μ
情未知且 σ:亦為未知,因此無法對於L ),、
R ), 與P \ 進行估計 。
所幸"6J藉由使用GVO掌則對於P ),進行估
計 山 。因此 ,藉由對於 GCV 準則的最 小
化,可以得到一適當的 λ 估值:定義
n-1L: (YJ -~(tJ))2 GCV、= __ JZi j i 71
, (1 一九)2
式中〈表示民估式中的參數個數 。 Lí í 月 1 曾指
出,在假設滿足條件( 1 )機差項 εJ彼此間互相
獨立且為同一的分布,其帶有的雙方一定存
在,此外其密噎囡數一定限於某個範圍內:
(2) 當 n 趨近於無限大峙,
inf nR 1 →∞ ; (3hnfLλ 一土~O ' λ S; n A. 5n
m煙,假如 λ 可以使得式m最小化,則可以
L,恥得主目一」一 r → 1 。
infL λ
因此認為當n趨近於無限大時, L ~將會朝向最
小化的損失函數靠近,此時以 GCV;去來選擇
λ 是為一適當的方法 。
典型傳立葉級數估式
(classical Fourier series estimators) 對於廣義傳立葉級數估式而言 ,當使用
的 CONS:1 中;f ,馬複數 的 指數函數
(comp lex expo nentíals) 時, 例如中 j ( t ) 為
(b-a),jer 或 ehlJI ,如Jí= _JT,j=O 、 τ 1..... '由於所得之估式相當於是傅立
葉級數典型的概念, 因此稱之為典型傅立葉
級數估式。
這裡假設區間 [a.b] 為 [0.1] ,其資料集
f專立#.級要走佑式實f一個迫歸函數的配迪
為 t (中 j(t) 、 yJ }~=I 並且設計點嗎在[0 , 1]間均
勻地等距的條件成立下 ,若其CONS為
中 j ( 的=e.2.rr i jl ,其中í= Fl' j=O,:t 1,... . '可得到迴歸函數 μ 的估式為
的) = IßJehJjt (8 )
J=-A
其中戶j=n-IZYre
J= 一 λ 、 .. , λ 。式 (8)就是一個典型傅立葉級
數估式,對於 μ而言 , ß j被認為是一個在傅立葉展開式中第 J 個參數的直接估值。
由於函數 μ 為實數,所以
ß; == JIl' (t)e 2π心
此外, 又由於 e " '=cosx+í sín x '因此,對於廣義傳立葉級數展開式可得到
μ(t) = L: ~l"jt J.-‘
=ßo +主Wje 2 ",J t +ß_je-hd')
=戶。+主 (ßjeb ,j' +戶;rJjt) , i9i
其中
e 2.;j' == cos(2π:j t) + i sin(2可t)
e-2叫, == cos(-2π:j t) + i sin(-2句t)
== cos(2πjt)- isin(2πjt)
將之代回式(9)中可得
ß je 2 :,! 1只 +戶:戶 ,j' == ~j(cos(2阿t) + i sin(2πjt))
+戶; (cos(2吋 t) 一九in(2π:j t) )
=(~j +戶;) cos(2吋 t)
+ i(ß j - ~ ;)sin(2πjt)
令 C j =ßj +吭, 5 j = i(吭一 ß; ) ,
因為~>丸,所以
一 59 一48(3) : 55 - 68 (1 999) 農林學報
k £L 吋(r -1) 、 S;= 一 >:y , sinC'
w
-/).
n 三1 n
以及丘 (t)值:此外,對於機差項 ε 之雙方 σ2
可以使用下式來估計
其中 j=l ,.. ., λ' CJ=ßJ +戶 -J
-主主立旦 a 主必立立
=n-1Ly,e n +n-1Ly,e n
~ (___/2吋(r-l) , . , 2nj(r-1川一 n-' )3,1 cos(一一一一)一 jsin(=一一) 1
三ï \ n n) ) i l (
2σ-zn
一一
、BEF
Anny
位V
什V
一+
風
μ7λ
-一司,-
n寸中叫n
Aσ
那憑空對於佑值 3 。而言,由於
+n土yJ C05( 2 1tj(卜 1) 均(r 一!L)ì 1 C05(一一一) + j sin(一一一) I
I \ n ~ n)
E吃y,∞5(且已2)u r :z l 11
:對於估
值已與合!而言, Var(毛) = 40-2 于∞Sl(且已2) . n. ';:j' n
Fn ,所以 3 。的標準機差估值為5
J = j(ßj - ß-)
( n 三且已斗1 n 豆豆立il\
=jl n-1Ly ,e n -n-1Ly,e-n一|
Var(sJ)=i羊子 sin'(且已2) . n- 云i n
M-n AS
缸V + An--
Jtt、缸
V 於由
={•(
一 n正n-I斗l2玄》y扎←r可得 Var(ê) = Var(s) =于所以 EJ 與吃的標準機差估值為 σ斤,如此可進行參數之檢定,作為判定該項次是否要由
估式中剔除。對於嚴格的統計推論而言,這
裡可以一漸近常態分佈之統計量作為有用的
判別指標。經過對於估式中之參數檢定,最
後可得到一真正可供使用之典型傅立葉估
式,如此可仿照線性母數的情形,對於估式
進行模式的話峰,如殘差分析等 (4.5\ 。
另外,由於給定 λ 以及樣本大小 n 皆禮
近於無限大,貝lJ A 趨近於 0 。那麼對於固定
nl(已(t) - E{已(t) })
σ(2λ+ 1)2
式收斂 (converges in distri bution) 為一標
準常態逢機變數。那麼在給定屬於空間 W;.per[0 ,1 ]中帶有滿足傅立葉參數紹對值的平方在
代數學上是退滅的函數,其中空聞 Wi.per[O , l]是 L2位, b] 空閩中的一子集合,其定義為函數
-.ë--. _. _,_/2π:j (r 一 1)一一>S, sin(一一一-=)n 三j n
其中 t=羊, r=I ,...,n 0 所以最後對於迴歸函數 μ 而言,也可以正弦以及餘弦函數為項
次作為傅立葉級數之展開式構成估式。其展
開式如下:
已(付。+主(己j叫2π:j t) + 5J sin(2πjt) ) 川ui (
21lj( r 一 1
、其中戶。 =n lZYr ,已j 了Ly, cosC"J\: '}) .lJ. r=1 .u
2 志 2πj(r 一 1)5i =一子), sin(一一一一)。
n ,=1 “ 會以分佈的方的 t 點而言,
典型傅立葉級數估式之參數檢定與迴歸
函數之信賴區闊的建立
對於 μ 的估式(1m而言,在以 GCV 準則
(式(7))找到一適當之 λ 數值(是為 Å )後,其中估式中之參數個數〈為2 Â + 1 '可估計
得到式中的參數值為
戶。可1主 y,、己 j 主y, cos(盟主旦)4且 τ=1 u
- 60
μ 之導函數 μIj l 是絕對地連續的並且 μ1叮囑於
L[札 bJ 全間所構成之集合 。 此時對於國定的
t !jlli 犬,在樣本大小n以及 λ 皆以n λ l -J +" j趨近
於 0 的方式趨近胎無限大峙,n) !c已 (t) 一 μ(1)):
σ(2λ+ 1f
會有一漸近的標準常態分布 。 因此,可藉由
下式提供作 μ(t)的一一個 100( 1- 前)%漸近信賴
區間,,9
2λ+ L ~ 已(t):!:Zaσ(一一r
了 n
其中Z立為標準常態分布下,信賴水準為 1- a
之標準 fl 值 。 這裡要注意的是,由於相對於
估式的偏差降滅的速度,會發生估式的變方
會有較快速地變小的情形,為了要克服這個
難題必須以一 合理的方式將變方加大。學者
建議可使用一稍微大的 λ 值來建立區間,如
利用 GCV 準則所找到的 2 值再斗,那麼可以
使肘 2 值為 5 來建立 μ( t)的一個 100(1- a)%
漸近信賴區間I ~ I 。
多 i頁式的三角迴歸估式 (polynomial
trigonometric regression estimator)
Graybill ' Ö1 認為當真正的過歸函數 μ 具有週期性的 (periodic) 性質時,可以考意以
{身立 葉級數過歸估式來進行迴歸函數的估
計 z 假設迴歸函數 μ 在式 ( j i 成立下並且 μ 屬
於 L 2 [a 司 bJ 中的函數時,若函數 μ 滿足週期性
的邊界條件 (pcriodic boundary conditions)
μ(叫=μ(b)以及 μ'(a)=μ , (b) , ß. IJ 使用博立
葉級教過歸估式可以滿足對於迴歸曲線的估
計。 Eubank and S peckman's : 指出當真正
的lli!歸函數 μ 沒有週期性的性質峙,使用傳
立葉級教迦歸估式的方法會遭受到邊界效應
(boundary cffect)的影響,此時建議使用多
項式的三角迴歸佔式來進行佔計可以改善受
到邊界效應的影響。多項式的三角迴歸估式
f#立 fi級教佑式對一個 1皂歸函數的配逍
的基本形式魚
的)=戶。+彭 t J +主(已 j cos(2πjt) + 5 J叫j :1 l"1
其中 d 與 λ 皆為正整數 D 對於 d 與 λ 的選取
可以藉由對 GCV 準則(式(7; )的最小 ft來獲
得 。在以 GCV 准則找到一適當之 d 與 λ 數值
(是為 a 與 î )後 ,其中估式中之參數個數〈為(1+8+2Â) 。估式中參數之估計與檢定可
仿照線性母數的情形進行估計與評估,也可
對於估式進行模式的診斷以得到最終之估式
形式 c
數例
以 Eubank i41 書中第 103 頁的習題作為
數例,說明典型傅立葉級數估式的求配估計
過程 。首先 ,根據模式)' ;=40月(1- t j )+εJ ' J=
j - 1 L …50 '其中 t,=一「並且 ε?扁平均值為0 ,
"
具有共同標準偏差 (σ) 為 0.5 '且彼此間
互相獨立的常態逢機變數,利用 SAS 所提供
之標準常態逢機變數生產函數 RANNOR(131
產生出符合上述模式條件之 50 個觀調IJ值資料
進而使用式(]Q)來估計迴歸模式。經由電腦模
擺得到的資料組如圖一所示。
再者 ,在給定-CONS為中j( t)=e" 川t ,
對中 j { t)而言J=λ ,一, λ ,可用式(10)典型博立
葉級數佔式對於迴歸函數 μ 進行估計 。 對於
Uí).J已 形式為 已(t) =戶。+主(已J州河t) + sJ sin(沖) )
必須先選取到適當的 λ 數值, 式中
戶。 =n它y,守主y , c叫到尸2) . ..1 u r..l lJ.
2 寸 2πj(r - 1) J 一一 > j , sin(一一一一) ,
n 三1" n
其中 j=1 、.、 λ 。這裡藉由使得 GCV 準則
(式 17 )的最小化,其中估式中之參數個數
〈為 2λ+1 '可以找到一適當的 λ 數值,是
農林學報 48(3 ) : 55 - 68 (1 999)
12
- 61 一
X V<
V<
Y<
X X
Y<
X X V
<
X
X X X
X X X VA
V<
V<
V<
10
8
y 6
4
X X V<
X X
2 xx x x
。
xxxxx x
x xX x
X X V
<X
X
xx X
X
X
0.3 0.4 0.6 0.0 0.1 0.2 0.5 0.7 1.0 0.8 0.9
j-l 圖一 、根據模式Yj=40tj( 1- tj)+εj' 經由電腦模儷產生樣本數為50之資料組,其中tj=可「且 εJ
為平均值為O' 具有共同標準偏差 (σ) 為0.5 .且彼此間互相獨立的常態逢機變數。
Figure 1. The 50 obse~va[ions generated from the mode1 yj=40tj(l- tj)+ 叭,where hJEL 叫 the E j are zero mea札 uncorrelated normal random
variates with common standard deviation (σ) 0.5 .
為 î 在此數例中,£爵 6 (表一) .因此可得到一原始的典型博立葉級數估式之參數
ß o , ê l丸 之b以及合ls2,..丸,其結果列於
表二。依此可再進一步檢定各個參數是否為
零,而得到一真正的典型傅立葉級數估式
(表三) .為
已(t) =6.6592+ [(一4.0790)cos(2πt) + (一0.8635)cos(4πt) + (一0.4057)cos(6πt)
(一0.2605)∞s(8πt) + (一0.1916) cos(l 0前) + (-0.2920)則(12叫)] , ω
根據估式式 (14) 的獲得,更可進一步進行如同
在母數線性方法中的殘差診斷,由殘差圖
(圍二,圍二)中可以知道,對於殘差的檢
定可將之視為是符合原先給模式之前提條
件。因此,最後可以以式(4)作為這筆模擬資
料的求配(圖四) .更可建立過歸函數 μ 的
95% 漸近信賴區間 (圍五) .而作為建立信
賴區間之用的 λ 數值需要比 6 大。在考慮過歸函數是否滿足週期性的邊界
條件時,以多項式的三角迴歸估式進行邊界
效應的修正:此時藉由 GCV 準則所選敢之適
當之 3 值為 2 , 2 值為(表一) ,因此可得
到估式式(13) 之參數的估計(表四) ,經由參
數檢定後可得最終之估式形式為
μ(t)=40.12316t-40 . 24693t2 (表五) ,因
此最後可以此式作為這筆模擬資料的求配
(圖六)
比較以典型傅立葉級數估式及多項式估
式對於模擬的資料所繪出的求配結果(圖
六) ,可以發現在尖峰處 (peak) 與二端點附
近,以典型傅立葉級數估式求配的結果較為
晃動,然而在考慮迴歸函數之週期性的邊界
一 62 一
條件時,以多項式的三角迴歸估式進行邊界
效應的修正,所得到配適的結果較為平滑並
f專立it級數估式對一個迴歸函數的配通
且改善了上述情形。
表一、典型傅立葉級數迴歸估式以及多項式的三角迴歸估式的斗,2與3)之GCV數值。
Table 1. Generalized cross- validation for classical Fourier series regression and polynomial- trigonometric regression estimators( d= 1,2 and 3).
Classical Fourier Polynomial- trigonometric regression estimators senes regress lOn
estl口lator d=1 d=2 d=3
λ < GCV λ A GCV λ < GCV λ < GCV
。 9.42799 。 9.79295 。 0.25898 。 0.26445 0.83250 0.86536 0.26514 0.27526
2 0.44741 2 0 .46709 2 0.28697 2 0.29829 3 0.37361 3 0.38983 3 0.31395 3 0.29729 4 0.35372 4 0.37099 4 0.32606 4 0.32590 5 0.36023 5 0.37490 5 0.35129 5 0.36240 6 0.31039 6 0.32173 6 0.33991 6 0.34751 7 0.34632 7 0.35952 7 0.37935 7 0.38122 8 0.38736 8 0.40348 8 0.42912 8 0.41420 9 0 .40552 9 0.4 1443 9 0.41644 9 0.41262 10 0.45207 10 0.44961 10 0.45641 10 0 .47658
表二、當£二 6 時,典型傅立葉級數迴歸估式中係數及標準機差的估計(最初)。
Table 2. The coefficient and standard error estimation of classical Fourier series regression estimator when t = 6 (initial).
Coefficient Estimate Standard Error Parameter Estimate/(Standard Error)
戶。 6.65920 0.067778 98.250 c l -4.07897 0.095852 -42.555 C勻 -0.86349 0.095852 -9.009 c} -0 .40566 0.095852 -4.232 c4 -0.26050 0.095852 -2.718 cs -0.19156 0.095852 -1.998 c6 - 0.29202 0.095852 -3.047 SI 0.00874 0.095852 0.091 S、 0.02782 0.095852 0. 290 S3 0.08724 0.095852 0. 910 S4 - 0.09539 0.095852 -0.995 S5 -0.025 73 0.095852 -0.268 S6 0.11448 0.095852 1.194
農林學報 48(3) : 55 - 68 (1 999)
表三、當£二 6 時,典型傅立葉級數迴歸估式中係數及標準機差的估計(最後)。Tab!e 3. The coefficient and standard error estimation of classical Fourier series
regression estimator when ~二 6 (final).
- 63 一
Coefficient Estimate Standard Error Parameter Estimate/(Standard Error)
戶。 6.65920 0.065705 101. 350
C 1 -4.07897 0.092921 -43.897
C、 -0.86349 0.092921 -9.293
c3 -0 .40566 0.092921 -4.366
c4 -0.26050 0.092921 -2.803
c5 -0.19156 0.092921 -2.062
C6 -0.29202 0.092921 -3.143
表四、當 d 二 2 時,多項式的三角迴歸估式中係數及標準機差的估計(最扭)
Tab!e 4. The coefficient and standard error estimation of polynomial-trigonometric regression estimator when d=2 (initia!).
Coefficient Estimate Standard Error Parameter Estimatef(Standard Error)
戶。 0.12229 0.201230 0.608
ß 1 39.62912 0.949648 41.730
戶、 -39.83108 0.937100 -42.505
表五、當 d = 2 時,多項式的三角迴歸估式中係數及標準機差的估計(最後)。Tab!e 5. The coefficient and standard error estimation of polynomial-trigonometric
regression estimator when d=2 (final).
Coefficient
ß 1
戶、
Estimate Standard Error Parameter Estimatef(Standard Error)
40.12316 0.487690 82. 272
-40.24693 0.636041 -63. 277
傅立禁級數估式對一個迴歸函數的配通一 64 一
1.0
. . 。 5
-圓3SZU正
。。
-0.5
1.0
T
。 9
T
0.8
團二、殘差對設計點 t 作圖。
Figure 2. The plot of residuals vs. design points t.
T
0.7
T
0.6 0.5 。40.3
T
0.2 0.1
-1.0
.0
1.0
0.5 . .
. . . 。。
一咽=逗留出
-0.5
11
T
10
寸
g
T
圖三 、 殘差對觀測值 y 作圖 。
Figure 3. The plot of residuals vs. observations y.
I
S 7 6
I
4 3 2 1
-1.0
O
農林學報 48(3) : 55 - 68 (999) 一 65 一
12
10
8
Y 6
4
2
。
12
10
8
Y 6
2
x
x/ x
x
x
/ x
x observation 一一- classical Fourier series regression estimator
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
t
圖四、實線為以典型傅立葉級數估式(式。3) )求得之預測值。
Figure 4. The predicted values. shown by soild line. of classical Fourier series estimator (eq uation 13).
X.
咒'0.
x
/x x observation 一- classical Fourier series regression estimator
. approximate 95% confidence interval 示:
o L..L:. 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
圖五、 以典型傅立葉級數估式建立迴歸函數μ的95%漸近信賴區間。
Figure 5. The 95% approximate confidence interval of regression function μby classicaI Fourier serier estimator.
1.0
x
1.0
- 66 一 f尋立黨級數估式對一個迴歸函數的配通
12
10
8
Y 6
4
x observation 2
一一- classical Fourier series regression estimator polynomial-trigonometric regression estimator
。0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
圖六、多項式的三角迴歸估式與典型傅立葉級數估式。
Figure 6. The polynomial- trigonometric regression estimator, shown by dotted line , and classical Fourier regression estimator , shown by solid line.
討 ";"j:,、吾同
典型傅立葉級數估式曾經在時間序列分
析 (time series analysis) 的領域上廣泛地使
用,其使用的動機為當觀樹的資料真實的表
現上為週期性的現象。而當考慮的為週期性
的情形時,對於最初的國數形式是可以含有
正弦以及餘弦函數。因此,自然可以考慮使
用含有正弦以及餘弦函式之過歸模式作為對
於時間序列分析的描述。藉由相似於時間序
列的情形,可以得到傅立葉級數估式的性
質;對於使用一個包含有數個正弦以及餘弦
函數之總性模式來估計迴歸函數 μ ' 這就是
典型傅立葉級數估式的結果。
在數例中,給定之迴歸國數為 μ(t)=40t
(1 -t) 為一多項式迴歸函數,由於在區間 [0 , 1]
間並不滿足遇期性的邊界條件,此時以典型
傅立葉級數估式進行求配會有邊界效應的影
響:這會使得在尖峰虛與二端點附近會有晃
動的情形發生(圖六) ,也可以知道典型傅
立葉級數估式對於資料的過勢表現土是較為
平滑性不足 (undersmoothing) .典型傅立葉
級數估式中若包含之三角函數項次為少的
話,晃動的情形可以消失,這裡的典型傅立
葉級數估式包含著 6 個項次的三角函數項,
因此晃動的較為嚴重。考慮以多項式的三角
迴歸估式進行邊界效應的修正,所得之估式
中並不包含任一三角函數而完全是一多項式
過歸估式,可以理解到經由修正後會回歸於
原先給定之迴歸函數形式。
典型傅立葉級數估式在無母數迴歸分析
中為重要的,是因為它與其他的無母數迺歸
估式有著緊密的相連。 此外,當考慮欲估計
之迴歸函數的週期性的邊界條件時,可以多
項式的三角迴緝估式進行邊界效應的修正,
改善典型傅立葉級數估式表現上之不足。
農林學報 48(3) : 55 - 68 (1 999) 句d
no
參考文獻
I 郭寶錚、林永立、何兆銓。 1999 。從降低預測風險函數來決定最佳預測變數組合。
農林學報刊(1 ):“-71 。
2. Cencov , N. N. 1962. Evaluation of an unknown distribution density from observations. Soviet
Math. 3:1599-1562.
3. Craven, P. and G. Wahba. 1979. Smoothing noisy data with spline function: estimating the
correct degree of smoothing by the method of generalized cross-validation. Numer. Math.
31:377-403.
4. Eubank , R. L. 1988. Spline smoothing and nonparameteric regression. pp. 15-108. Marcel
Dekker. Inc. , New York and Basel.
5. Eubank R. L. and P. Speckman. 1990. Curve fitting by polynomial-trigonometric regression.
Biometrika 77:1-9.
6. Graybill , F. A. 1976. Theory and application of linear model. Durbury Pres, North Scituate,
Mass.
7心 H且rdle , W. 1990. Applied nonparametric regression. Cambridge University Press, New York.
8. Li , K. C. 1987. Asymptotic optimality for Cp, CL, cross-validation and generalized
cross-validation: discrete index set. Ann. Statist. 15:958-975.
9. Luenberger , D. G. 1969. Optimization by vector space methods. John Wiley & Sons. Inc. , New York.
10. Neter,孔, M. H. Kutner, C. J. Nachtshemi , and W. Wasserman. 1996. Applied linear
statistical models. Richard D. Irwin. Inc.
11. Parkasa Rao , B. L. S. 1983. Nonparametric functional estimation. Academic Press, New York.
12. Rutkowski , L. 1982. Orthogonal series estimates of a regression function with applications in
system identification. pp. 343-347. In:Grossmann, W. , G. Pf1ug and W. Wertz. (ed.)
Probability and statistical inference. North Holland, Boston.
13. SAS Institute , Inc. 1993. SAS/STAT User's Guide , Version 6, 4th ed. , Cary, NC , USA.
14. Silverman , B. W. 1986. Density estimation for statistics and data analysis. Chapman and
Hall , London.
- 68 一 傅立?震級數佑式對一個迴歸函數的配通
The Fitting of A Regression Function
Using the Fourier Series Estimator
Yung-Li Lin l) Bo-Jein Ku02) Siu Chuen H03)
(Accepted for publication: Aug 18 , 1999)
Abstract
When the observed data exhibit periodic behavior, usualIy a Iinear model including sines
and cosines is employed to estimate the regression function μ. The classical Fourier series esti
mator is of this type. However, if the regression function μdoes not satisfy periodic boundary
conditions, the criterion based on the mean squared error , i.e. GCV, to choose the number of
trigonometric functions in the regression would yield too many terms and the chosen function
performs wiggly. A combination of low-order polynomial and trigonometric terms could alleviate
the above problem and achieve a smooth curve. 1n this study , we tried to investigate the proper
ties of orthogonal series estimator. A simulated data set was used to illustrate how to use GCV
criteria to choose the number of trigonometric functions in this regression , the fitting , and diag
nostic procedures. After adding the low-order polynomial terms , the boundary effect was
reduced. The performance of the two functions was also compared.
Key Words orthogonal series estimator, Fourier series, generaIized cross-vaIidation (GCV) ,
pol ynomial- trigonometric regression.
1) Graduate student, Department of Agronomy , National Chung-Hsing University, Taichung,
Taiwan , ROC.
2) Associate professor (Corresponding author) , Department of Agronomy , National Chung-Hsing
University , Taichung , Taiwan, ROC.
3) Associate professor, Department of Applied Mathematics, National Chung-Hsing University ,
Taichung, Taiwan , ROC.