Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
315
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
สถตคาสดขด
ปยภทร บษบาบดนทร และ อรณ แกวมนอาจารย ภาควชาคณตศาสตร คณะวทยาศาสตร มหาวทยาลยมหาสารคาม
ผนพนธประสานงาน โทรศพท 08-9542-6396 อเมล piyapatrbmsuacth
รบเมอ 15 กรกฎาคม 2557 ตอบรบเมอ 15 มกราคม 2558 เผยแพรออนไลน 15 พฤษภาคม 2558
DOI 1014416jkmutnb201501003 copy 2015 King Mongkutrsquos University of Technology North Bangkok All Rights Reserved
บทคดยอ
เปาหมายของการวเคราะหแบบจาลองคอ การไดแบบจาลองทดทสดสาหรบขอมลทศกษา แตเมอขอมลทศกษา
มคาสดขดเกดขน นกวเคราะหสวนใหญมกจะตดขอมลนนทงไปไมนามาพจารณาเพอหาแบบจาลอง เนองจาก
มความซบซอนและยงยากในการวเคราะห แตในความเปนจรง ถานกวเคราะหตองการทราบถงความนาจะเปนใน
การเกดขนของเหตการณทมคาสงสดหรอตาสดซงอยในสวนของปลายหางซงมคานอยมาก เครองมอทางสถตท
มบทบาทเกยวของในเรองนคอ ldquoทฤษฎคาสดขดrdquo บทความนมจดประสงคเพอยกตวอยางการประยกตใชทฤษฎ
คาสดขดกบขอมลจรงในสาขาวชาตางๆ พรอมทงกลาวถงแนวความคดและการพฒนาทฤษฎคาสดขด และทาการสรป
สถตอนมานของคาสดขด การแจกแจงของคาสดขด ไดแก การแจกแจงคาสดขดวางนยทวไป และการแจกแจง
พาเรโตวางนยทวไป เปนตน พรอมทงตรวจสอบความเหมาะสมของแบบจาลองคาสดขด คาบเวลาการเกดซา และ
การหาคาระดบการเกดซาในรอบปทสนใจ
คาสาคญ ทฤษฎคาสดขด การแจกแจงคาสดขดวางนยทวไป การแจกแจงพาเรโตวางนยทวไป ระดบการเกดซา คาบเวลาการเกดซา
การอางองบทความ ปยภทร บษบาบดนทร และ อรณ แกวมน ldquoสถตคาสดขดrdquo วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25
ฉบบท 2 หนา 315 - 324 พค - สค 2558 httpdxdoiorg1014416jkmutnb201501003
316
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
Extreme Values Statistics
Piyapatr Busababodhin and Arun KeawmunLecturer Department of Mathematics Faculty of Science Mahasarakham University Maha Sarakham Thailand
Corresponding Author Tel 08-9542-6396 E-mail piyapatrbmsuacthReceived 15 July 2014 Accepted 15 January 2015 Published online 15 May 2015DOI 1014416jkmutnb201501003 copy 2015 King Mongkutrsquos University of Technology North Bangkok All Rights Reserved
AbstractOne of the greatest achievements of modeling is to find an optimal model for the data If the extreme value
is included an analyst usually cuts them out from the data because of its complexity In practice if an analyst wants to know the extreme eventrsquos probability which there is extreme values in the tailed The statistical tool which is very popular which is called ldquoExtreme Value Theoryrdquo This article aims to give a sample self-contained introduction to the motivations and basic ideas behind the development of extreme value theory Also briefly covered are the inference statistics of extreme value and its distribution such as generalized extreme value distribution and generalized Pareto distribution theory how to check and find optimal extreme value modeling and return period and return level
Keywords Extreme Value Theory Generalized Extreme Value Distribution Generalized Pareto Distribution Return Level Return Period
Please cite this article as P Busababodhin and A Keawmun ldquoExtreme Values Statisticsrdquo J KMUTNB Vol 25 No 2 pp 315 - 324 May - Aug 2015 (in Thai) httpdxdoiorg1014416jkmutnb201501003
317
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
1 บทนา
ทฤษฎคาสดขด (Extreme Value Theorem) เปน
ทฤษฎทกลาวถงคณสมบตของเหตการณทมตวแปรสม
ซงจดอยในลกษณะทเรยกวา ldquoคาสดขดrdquo อาจจะเปนคา
สงสดหรอตาสดกได พรอมทงศกษารปแบบการแจกแจง
ความนาจะเปนของตวแปรส มเหลาน การวเคราะห
ขอมลเมอขอมลมคาสดขด (Extreme Value) เกดขน นกวเคราะหสวนใหญจะตดขอมลสวนนนทงไปไมนามา
พจารณา เนองจากมความซบซอนและยงยากในการวเคราะห แตในความเปนจรงถาตองการทราบถงความนาจะเปน
ในการเกดขนของเหตการณทมค าสงสดหรอตาสด
ซงอยในสวนของปลายหางซงมคานอยมาก อาทเชน ปรมาณนาฝนสงสด-ตาสดในแตละวน ความเรวลมสงสด
ในรอบเดอน อณหภมสงสด-ตาสดในแตละวน เปนตน กสามารถทาได
การศกษาทฤษฎคาสดขดเรมตนมาตงแตทศวรรษท 19 และไดถกพฒนามาอยางตอเนองโดยนกคณตศาสตร ในป คศ 2000 Kotz และ Nadaraja [1] ไดกลาววาการ
แจกแจงคาสดขดไดถกคนพบครงแรกในป คศ 1709 โดย Bernulli และถกประยกตใชครงแรกโดย Fuller ในป คศ 1914 ซงในชวงระยะเวลาสบปทผานมามงานวจย
ทเกยวของกบสถตของคาสดขดถกตพมพเผยแพรเปน
จานวนมาก ซงงานวจยเหลานไดสรปความรพนฐานและ
เครองมอทใชสาหรบวเคราะหคาสดขดในเบองตน เพอ
ใชประกอบการตดสนใจและหาแนวทางในการปองกน
และแกไขสถานการณตางๆ เชน ดานเศรษฐศาสตร ไดนา
ทฤษฎคาสดขดชวยประเมนคาและราคาของการทาประกน (Insurance) เมอพจารณาโอกาสของเหตการณทกอให
เกดความหายนะอยางใหญหลวงทอาจจะเกดขน ถงแม
ในความเปนจรงแลวเหตการณเหลานมโอกาสจะเกดขน
ไดยากกตาม หรอใชทฤษฎนเพอประมาณมลคาของ
ความเสยง (Value at Risk VaR) ในสถาบนการเงน
และบรษททมการลงทนดานหลกทรพยหรอสนทรพย (รายละเอยดเพมเตม [2] - [5]) ดานอทกวทยา ใชทฤษฎ
คาสดขดเพอตรวจสอบความเสยงของเหตการณรนแรง
ทางสงแวดลอมทจะเกดขน เชน การหาความสงของ
คลนในทะเลเพอปองกนการเกดนาทวมของพนทชายฝง การหาปรมาณนาฝนสงสดเพอปองกนการเกดนาทวม (รายละเอยดเพมเตม [6] - [8]) ดานวศวกรรม ประยกตใช
ทฤษฎคาสดขดเพอหาขอบเขตของความตานทานของ
วตถเพอคานวณการเสอมสภาพของผลตภณฑอนเนองจาก
การขยายตวอยางชาๆ ของรอยแตกตามระยะเวลา
การใชงานในเชงพลวต (Dynamic) และความเชอถอ
ไดในการกอสรางอาคาร เชน การสรางสะพาน อปกรณ
ขดเจาะนามน และใชในการประมาณคาระดบมลพษ
ทเกดขน (รายละเอยดเพมเตม [9] - [11]) โดยหวขอถดไปผเขยนไดกลาวถงความเปนมา
ของคาสดขด การแจกแจงของคาสดขด การประมาณคา
พารามเตอร การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด และคาบเวลาการเกดซาและการหาระดบ
การเกดซา ตามลาดบ
2 ความเปนมาของคาสดขด
เหตการณสดขด (Extreme Events) คอเหตการณ
ของตวแปรสมทมโอกาสเกดขนมากกวาคาคาดหวงของ
ตวแปรสม สมมตให Xi เมอ i = 12n เปนตวแปรสม
ทอสระตอกน และมฟ งก ชนความนาจะเปนสะสม F(xθ) equiv Pr(Xi le x) เดยวกน กาหนดใหคาสงสดของ
ตวแปรสม คอ X(n) = Max(X1 X2 Xn ) ทมฟงกชน
การแจกแจงเปน Fn (x) ซงมความสมพนธกบ F(xθ) โดยมเงอนไขดงตอไปน
Fn (n) equiv Pr(X(n) le x) equiv Pr(X1 le x X2 le x Xn le x) equiv Pr(X1 le x) Pr(X2 le x) Pr(Xn le x) equiv Fn (x)
เมอ n rarr infin พบวา Pr(X(n) le x) ลเขาส F(xθ) และ x(n) = (X(n) - bn)an เปนฟงกชนการแจกแจงความนาจะเปน
แบบนอนดเจนเนอเรต (Non-degenerate Distribution) ของ F(xθ) โดยท an และ bn เปนคาคงท ดงนน
318
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
Pr(X(n) le x) = Pr((X(n) - bn)an le x) = Pr(X(n) le an x + bn) = F n(an x + bn) rarr F(x) เมอ n rarr infin
อาจจะเรยกทฤษฎคาสดขดวา ldquoทฤษฎสามแบบrdquo (Three Types Theorem) ตามลกษณะของลมตการแจกแจง
ของฟงกชน F(xθ) ตามรปท 1 [12] ดงน
แบบท 1 กมเบล (Gumbel Type) F(x) = exp(-exp(-x))เมอ -infin lt x lt infin แบบท 2 ฟรเชท (Freacutechet Type) F(x) = exp(-x-a)เมอ -infin lt x lt infin และ a gt 0พบวาถา F(x) = 0 เมอ x lt 0 แบบท 3 ไวลบล (Weibull Type) F(x) = exp(-(-x)-a)เมอ -infin lt x lt infinและ a gt 0พบวาถา F(x) = 1 เมอ x gt 0
3 การแจกแจงของคาสดขด
การวเคราะหแบบจาลองคาสดขดดวยทฤษฎคาสดขด สามารถแบงลกษณะการแจกแจงของคาสดขดไดเปน 2 ประเภทตามลกษณะของการเลอกขอมลคาสดขดทนามา
วเคราะห ดงแสดงในรปท 2 ไดแก การแจกแจงคาสดขด
วางนยทวไป (Generalized Extreme Value Distribution GEV) และการแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) ซงการสรางแบบจาลองดวย GEV เหมาะสาหรบวเคราะหคาสดขดในชวงคาบเวลาท
สนใจ เชน รายป รายเดอน รายไตรมาส หรอรายสปดาห เปนตน ซงคาสงเกตทรวบรวมไวควรจะมจานวนมากกวา 30 ปขนไป โดยจะเลอกขอมลทสงสดในแตละชวงคาบเวลา
ทผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลานเมอขอมลมจานวนมาก หรอ
ขอมลเกบรวบรวมเปนรายวน การสรางแบบจาลองดวย GPD จะมความเหมาะสมกวา GEV เนอง GPD จะอธบาย
ลกษณะขอมลทมการแจกแจงแบบมหางทหนก (Heavy-tailed Distribution) ไดดกวา และจานวนคาสดขดท
นามาวเคราะหดวย GPD จะมจานวนมากกวาขอมลท
นามาวเคราะหดวย GEV ซงสามารถลดความไมแนนอน
ทเกดขนจากการสมตวอยางได การสรางแบบจาลอง
ดวย GPD มขนตอนสาคญคอ การกาหนดคาเกณฑ (Threshold) ทเหมาะสมกบขอมลทนามาวเคราะห และ
การพจารณาความไมเปนอสระของขอมลคาสดขด ซงสามารถแกไขไดโดยการจดกลมคาสดขด (Declustering) ทมคาเกนกวาคาเกณฑ ดงนน การสรางแบบจาลองดวย GPD จงไดรบ
ความนยมอยางแพรหลายและเหมาะสาหรบวเคราะห
ขอมลดานอตวทยาและอทกวทยาเพอวเคราะหความ
รปท 1 การแจกแจงกมเบล ฟรเชท และไวลบล เมอกาหนด
α = 0
(A) (B)รปท 2 การเลอกคาสดขดสาหรบแบบจาลอง GEV (A)
และ GPD (B)
f (x)
x
319
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เสยหายของเหตการณรนแรงทมโอกาสเกดขนไดยาก (รายละเอยดเพมเตม [6] [7] [9] [10] [13] [14])
31 การแจกแจงคาสดขดวางนยทวไป (Generalized Extreme Value Distribution GEV) สมมตให Xi เมอ i = 1 2 n เปนตวแปรสมทอสระ
ตอกนและมฟงกชนหนาแนนความนาจะเปน F(xθ) เดยวกน คาสงสดของตวแปรสมคอ X(n) = Max(X1 X2 Xn ) ซงจะประยกตใชในเรองนในรปแบบของการแจกแจง
คาสดขดวางนยทวไป ทมพารามเตอรทกากบการเกดขน
ทงหมด 3 พารามเตอรคอ μ แสดงถงตาแหนง (Location) σ แสดงถงขนาด (Scale) และ ξ แสดงถงรปราง (Shape) สาหรบ GEV ถกพฒนาขนใน คศ 1955 โดย Jenkinson [15] สามารถเขยนฟงกชนการแจกแจงคาสดขดได 3 การแจกแจง ไดแก การแจกแจงกมเบล (Gumbel Distribution) การแจกแจงฟรเชท (Freacutechet Distribution) และการแจกแจง
ไวลบล (Weibull Distribution) ตอมาในป คศ 1978 Galambos [16] ไดสรางฟงกชนการแจกแจงสะสม (Cumulative Distribution Function CDF) ของ GEV ดงน
(1)
และสามารถเขยนฟงกชนการแจกแจงความนาจะเปน (Probability Distribution Function pdf) ของ GEV ดงน
(2)
สาหรบ
จากสมการท (1) และ (2) พบวา เมอ ξ = 0 เรยก
การแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงกมเบลrdquo เมอ ξ gt 0 เรยกการแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงฟรเซทrdquo และเมอ ξ lt 0 เรยกการแจกแจง
คาสดขดวางนยทวไปวา ldquoการแจกแจงไวลบลrdquo
สาหรบความสมพนธระหวางพารามเตอร μ และ σ กบโมเมนตท k ของสมการท (1) เปนดงน
ถากาหนด สามารถคานวณโมเมนตท 1 ของ
สมการท (1) ไดจาก
เมอ Γ(x) แทนฟงกชนแกมมา
กรณท ξ rarr 0 สามารถคานวณโมเมนตท 1 ไดจาก E(x) = μ + σξ เมอ ξ = 0577 เปนคาคงทออยเลอร (Euler Constant) และสามารถคานวณโมเมนตท 2 (ความแปรปรวน) ของสมการท (1) เมอกาหนด ดงน
และเมอ ξ rarr 0 พบวา
32 การแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) การวเคราะหแบบจาลองของคาสดขดดวย GEV ซงเปนวธทพจารณาขอมลทสงสดในแตละชวงคาบเวลาท
ผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลาน หรอวเคราะห (x) = 1 - F(x) เมอขอมลมจานวนมาก ทาไดโดยประยกตใชอนกรม
เทเลอร (Taylor Series Extension) กบสมการท (1) ซงสามารถเขยนฟงกชนใหมไดดงน
ซงจะลเขาส 1 ถา x rarr X F ดงนน
320
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เมอ เรยกฟงกชนนว า ldquoการแจกแจง
พาเรโตวางนยทวไปrdquo โดยปกตจะเหนวาเหตการณทเกดคาสดขด คา Xi จะม
คาสงกวาคา u (Threshold) ทกาหนด ถา u มคามากจะทาให
ฟงกชนการแจกแจงของ Xi - u มเงอนไขเมอ Xi gt u ดงน
(3)
สาหรบ เมอ จากสมการท (3) เปนการแจกแจงทอย ในกล ม
การแจกแจงเดยวกนกบการแจกแจงพาเรโต โดยคา σu เปนพารามเตอรแสดงขนาด เมอ u gt u0 พบวา σu = σu0+ ξ(u - u0) ดงนนคาพารามเตอรขนาด (ξ) จะ
เปลยนไป ยกเวนเมอ ξ = 0 การแจกแจง GPD จะไมม
การเปลยนแปลง การปรบพารามเตอรขนาดจะปรบโดย
สมการ เมอคา u0 คอคาตาทสดของ u และ
ตวประมาณของ และ ξ เปนคาคงท ซงสามารถเขยน
ฟงกชนความนาจะเปนของการแจกแจงพาเรโต ไดดงน
(4)
เมอ σ gt 0 และ -infin lt ξ lt infin
4 การประมาณคาพารามเตอร (Parameter Estimation) การประมาณพารามเตอรสาหรบ GEV และ GPD ในบทความนผ เขยนขอกลาวถงเฉพาะการประมาณ
คาพารามเตอรแบบจดดวยวธความนาจะเปนสงสด (Maximum Likelihood Estimation MLE) เทานน
ขนตอนการประมาณคาพารามเตอรดวยวธภาวะ
ความนาจะเปนสงสด มรายละเอยดดงน
ขนตอนท 1 พจารณาฟงกชนการแจกแจงความ
นาจะเปนของ GEV ในสมการท (2) ขนตอนท 2 สรางฟงกชนไลคลฮด (Likelihood
Function) ของฟงกชนการแจกแจงความนาจะเปนของ GEV ไดดงน
ขนตอนท 3 สรางฟงกชนลอคไลคลฮด (Log- likelihood Function) ของฟงกชนการแจกแจงความ
นาจะเปนของ GEV ทไดจากขนตอนท 2 ไดดงน
หรอ
ขนตอนท 4 ประมาณคาพารามเตอรดวยการหา
อนพนธยอย (Partial Derivative) จากฟงกชนทไดใน
ขนตอนท 3 และการประมาณพามเตอรสาหรบ GPD ดวยวธ MLE จะทาลกษณะเดยวกนกบการแจกแจง GEV จากฟงกชนการแจกแจงความนาจะเปนของ GPD ในสมการท (4) สามารถเขยนฟงกชนลอคไลคลฮดไดดงน
(5)
เมอกาหนดให k แทน จานวนขอมลทมคามากกวาคา u สาหรบการประมาณชวงความเชอมนสาหรบ
พารามเตอรนน มวธประมาณทนยมใชกนอยางแพรหลาย
ม 3 วธ คอ วธเชงเสนกากบปกตของตวประมาณวธประมาณ
ภาวะนาจะเปนสงสด (Asymptotic Normality of MLES) วธชวงความเชอมนแบบควรจะเปนโปรไฟล (Profile Likelihood Confidence Interval) และวธเดลตา (Delta Method) ซงผเขยนไมไดกลาวรายละเอยดไวในบทความน สามารถศกษารายละเอยดเพมเตมไดจาก [17]
321
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
5 การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด
ในทางปฏบตหากขอมลทนามาวเคราะหมาจาก
กระบวนการคงท ผ ว เคราะหสามารถประมาณคา
พารามเตอรและนามาอธบายความเปนไปของตวแปรสม
ไดอยางถกตอง แตถาหากขอมลทนามาวเคราะหมาจาก
กระบวนการทมการเปลยนแปลงขนอยกบเวลาแลวนน การจะนาคาพารามเตอรไปใชยอมเกดขอผดพลาดขนได ดงนนการหาแบบจาลองท เหมาะสมและหาระดบ
การเกดซาของขอมลสดขดโดยใชการแจกแจงคาสดขด
จงเปนอกแนวทางในการบรหารจดการและตดสนใจของ
นกวเคราะห
เมอนกวเคราะหไดแบบจาลองทเหมาะสมกบขอมล
มากกวาหนงตวแบบ การตรวจสอบความเหมาะสมของ
แบบจาลองจงมความสาคญอยางมาก สาหรบวธการตรวจ
สอบวธหนงซงนกวเคราะหมกใชการทดสอบตวแบบ คอ
การทดสอบอตราสวนควรจะเปน (Likelihood Ratio Test) โดยสถตทดสอบดงกลาวมการแจกแจงไคกาลงสอง (Chi-square Distribution) ดวยองศาอสระ v (Degree of Freedom v) เมอ v เทากบผลตางของจานวนพารามเตอร
ของตวแบบทตองการนามาเปรยบเทยบ
เมอไดตวแบบทดทสดสาหรบขอมลแลว ขนตอน
ถดมาคอ การทดสอบภาวะสารปสนทด (The Goodness of Fit) ของแบบจาลองทดทสด สามารถพจารณาจากกราฟ (Diagnostic Plots) ดงแสดงในรปท 3 ซงประกอบดวย กราฟควอนไทล (Quantile Plot) กราฟความนาจะเปน (Probability Plot) กราฟความหนาแนน (Density Plot) และกราฟระดบการเกดซา (Return Level Plot) หรอ
พจารณาจากสถตทดสอบสารปสนทดดวยสถตทดสอบ
โคโมโกรอฟสเมอรนอฟ (Kolmogorov-smirnov Test) หรอสถตทดสอบไคกาลงสอง (Chi-square Test) ไดเชนกน
6 คาบเวลาการเกดซา (Return Period) และการหา
ระดบการเกดซา (Return Level) เมอนกวเคราะหไดแบบจาลองทเหมาะสมทสด
ของขอมลแลว สงทตองวเคราะหตอมาคอ การหาระดบ
การเกดซาของคาสดขด โดยกาหนดให xT แทนระดบคา
ขอมลทสงกวาคาเฉลยในรอบ T ป (คาบเวลา) หมายถง
การวเคราะหความถของการเกดเหตการณคาสดขดในรป
ของความนาจะเปน หรอโอกาสทจะเกดเหตการณนนๆ ซงจะใชขอมลในอดตมาวเคราะห โดยใชหลกการของ
ทฤษฎคาสดขดเพอหาขนาดหรอ ปรมาณของคาสดขด
รปท 3 ตวอยางการพจารณากราฟตางๆ
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
316
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
Extreme Values Statistics
Piyapatr Busababodhin and Arun KeawmunLecturer Department of Mathematics Faculty of Science Mahasarakham University Maha Sarakham Thailand
Corresponding Author Tel 08-9542-6396 E-mail piyapatrbmsuacthReceived 15 July 2014 Accepted 15 January 2015 Published online 15 May 2015DOI 1014416jkmutnb201501003 copy 2015 King Mongkutrsquos University of Technology North Bangkok All Rights Reserved
AbstractOne of the greatest achievements of modeling is to find an optimal model for the data If the extreme value
is included an analyst usually cuts them out from the data because of its complexity In practice if an analyst wants to know the extreme eventrsquos probability which there is extreme values in the tailed The statistical tool which is very popular which is called ldquoExtreme Value Theoryrdquo This article aims to give a sample self-contained introduction to the motivations and basic ideas behind the development of extreme value theory Also briefly covered are the inference statistics of extreme value and its distribution such as generalized extreme value distribution and generalized Pareto distribution theory how to check and find optimal extreme value modeling and return period and return level
Keywords Extreme Value Theory Generalized Extreme Value Distribution Generalized Pareto Distribution Return Level Return Period
Please cite this article as P Busababodhin and A Keawmun ldquoExtreme Values Statisticsrdquo J KMUTNB Vol 25 No 2 pp 315 - 324 May - Aug 2015 (in Thai) httpdxdoiorg1014416jkmutnb201501003
317
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
1 บทนา
ทฤษฎคาสดขด (Extreme Value Theorem) เปน
ทฤษฎทกลาวถงคณสมบตของเหตการณทมตวแปรสม
ซงจดอยในลกษณะทเรยกวา ldquoคาสดขดrdquo อาจจะเปนคา
สงสดหรอตาสดกได พรอมทงศกษารปแบบการแจกแจง
ความนาจะเปนของตวแปรส มเหลาน การวเคราะห
ขอมลเมอขอมลมคาสดขด (Extreme Value) เกดขน นกวเคราะหสวนใหญจะตดขอมลสวนนนทงไปไมนามา
พจารณา เนองจากมความซบซอนและยงยากในการวเคราะห แตในความเปนจรงถาตองการทราบถงความนาจะเปน
ในการเกดขนของเหตการณทมค าสงสดหรอตาสด
ซงอยในสวนของปลายหางซงมคานอยมาก อาทเชน ปรมาณนาฝนสงสด-ตาสดในแตละวน ความเรวลมสงสด
ในรอบเดอน อณหภมสงสด-ตาสดในแตละวน เปนตน กสามารถทาได
การศกษาทฤษฎคาสดขดเรมตนมาตงแตทศวรรษท 19 และไดถกพฒนามาอยางตอเนองโดยนกคณตศาสตร ในป คศ 2000 Kotz และ Nadaraja [1] ไดกลาววาการ
แจกแจงคาสดขดไดถกคนพบครงแรกในป คศ 1709 โดย Bernulli และถกประยกตใชครงแรกโดย Fuller ในป คศ 1914 ซงในชวงระยะเวลาสบปทผานมามงานวจย
ทเกยวของกบสถตของคาสดขดถกตพมพเผยแพรเปน
จานวนมาก ซงงานวจยเหลานไดสรปความรพนฐานและ
เครองมอทใชสาหรบวเคราะหคาสดขดในเบองตน เพอ
ใชประกอบการตดสนใจและหาแนวทางในการปองกน
และแกไขสถานการณตางๆ เชน ดานเศรษฐศาสตร ไดนา
ทฤษฎคาสดขดชวยประเมนคาและราคาของการทาประกน (Insurance) เมอพจารณาโอกาสของเหตการณทกอให
เกดความหายนะอยางใหญหลวงทอาจจะเกดขน ถงแม
ในความเปนจรงแลวเหตการณเหลานมโอกาสจะเกดขน
ไดยากกตาม หรอใชทฤษฎนเพอประมาณมลคาของ
ความเสยง (Value at Risk VaR) ในสถาบนการเงน
และบรษททมการลงทนดานหลกทรพยหรอสนทรพย (รายละเอยดเพมเตม [2] - [5]) ดานอทกวทยา ใชทฤษฎ
คาสดขดเพอตรวจสอบความเสยงของเหตการณรนแรง
ทางสงแวดลอมทจะเกดขน เชน การหาความสงของ
คลนในทะเลเพอปองกนการเกดนาทวมของพนทชายฝง การหาปรมาณนาฝนสงสดเพอปองกนการเกดนาทวม (รายละเอยดเพมเตม [6] - [8]) ดานวศวกรรม ประยกตใช
ทฤษฎคาสดขดเพอหาขอบเขตของความตานทานของ
วตถเพอคานวณการเสอมสภาพของผลตภณฑอนเนองจาก
การขยายตวอยางชาๆ ของรอยแตกตามระยะเวลา
การใชงานในเชงพลวต (Dynamic) และความเชอถอ
ไดในการกอสรางอาคาร เชน การสรางสะพาน อปกรณ
ขดเจาะนามน และใชในการประมาณคาระดบมลพษ
ทเกดขน (รายละเอยดเพมเตม [9] - [11]) โดยหวขอถดไปผเขยนไดกลาวถงความเปนมา
ของคาสดขด การแจกแจงของคาสดขด การประมาณคา
พารามเตอร การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด และคาบเวลาการเกดซาและการหาระดบ
การเกดซา ตามลาดบ
2 ความเปนมาของคาสดขด
เหตการณสดขด (Extreme Events) คอเหตการณ
ของตวแปรสมทมโอกาสเกดขนมากกวาคาคาดหวงของ
ตวแปรสม สมมตให Xi เมอ i = 12n เปนตวแปรสม
ทอสระตอกน และมฟ งก ชนความนาจะเปนสะสม F(xθ) equiv Pr(Xi le x) เดยวกน กาหนดใหคาสงสดของ
ตวแปรสม คอ X(n) = Max(X1 X2 Xn ) ทมฟงกชน
การแจกแจงเปน Fn (x) ซงมความสมพนธกบ F(xθ) โดยมเงอนไขดงตอไปน
Fn (n) equiv Pr(X(n) le x) equiv Pr(X1 le x X2 le x Xn le x) equiv Pr(X1 le x) Pr(X2 le x) Pr(Xn le x) equiv Fn (x)
เมอ n rarr infin พบวา Pr(X(n) le x) ลเขาส F(xθ) และ x(n) = (X(n) - bn)an เปนฟงกชนการแจกแจงความนาจะเปน
แบบนอนดเจนเนอเรต (Non-degenerate Distribution) ของ F(xθ) โดยท an และ bn เปนคาคงท ดงนน
318
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
Pr(X(n) le x) = Pr((X(n) - bn)an le x) = Pr(X(n) le an x + bn) = F n(an x + bn) rarr F(x) เมอ n rarr infin
อาจจะเรยกทฤษฎคาสดขดวา ldquoทฤษฎสามแบบrdquo (Three Types Theorem) ตามลกษณะของลมตการแจกแจง
ของฟงกชน F(xθ) ตามรปท 1 [12] ดงน
แบบท 1 กมเบล (Gumbel Type) F(x) = exp(-exp(-x))เมอ -infin lt x lt infin แบบท 2 ฟรเชท (Freacutechet Type) F(x) = exp(-x-a)เมอ -infin lt x lt infin และ a gt 0พบวาถา F(x) = 0 เมอ x lt 0 แบบท 3 ไวลบล (Weibull Type) F(x) = exp(-(-x)-a)เมอ -infin lt x lt infinและ a gt 0พบวาถา F(x) = 1 เมอ x gt 0
3 การแจกแจงของคาสดขด
การวเคราะหแบบจาลองคาสดขดดวยทฤษฎคาสดขด สามารถแบงลกษณะการแจกแจงของคาสดขดไดเปน 2 ประเภทตามลกษณะของการเลอกขอมลคาสดขดทนามา
วเคราะห ดงแสดงในรปท 2 ไดแก การแจกแจงคาสดขด
วางนยทวไป (Generalized Extreme Value Distribution GEV) และการแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) ซงการสรางแบบจาลองดวย GEV เหมาะสาหรบวเคราะหคาสดขดในชวงคาบเวลาท
สนใจ เชน รายป รายเดอน รายไตรมาส หรอรายสปดาห เปนตน ซงคาสงเกตทรวบรวมไวควรจะมจานวนมากกวา 30 ปขนไป โดยจะเลอกขอมลทสงสดในแตละชวงคาบเวลา
ทผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลานเมอขอมลมจานวนมาก หรอ
ขอมลเกบรวบรวมเปนรายวน การสรางแบบจาลองดวย GPD จะมความเหมาะสมกวา GEV เนอง GPD จะอธบาย
ลกษณะขอมลทมการแจกแจงแบบมหางทหนก (Heavy-tailed Distribution) ไดดกวา และจานวนคาสดขดท
นามาวเคราะหดวย GPD จะมจานวนมากกวาขอมลท
นามาวเคราะหดวย GEV ซงสามารถลดความไมแนนอน
ทเกดขนจากการสมตวอยางได การสรางแบบจาลอง
ดวย GPD มขนตอนสาคญคอ การกาหนดคาเกณฑ (Threshold) ทเหมาะสมกบขอมลทนามาวเคราะห และ
การพจารณาความไมเปนอสระของขอมลคาสดขด ซงสามารถแกไขไดโดยการจดกลมคาสดขด (Declustering) ทมคาเกนกวาคาเกณฑ ดงนน การสรางแบบจาลองดวย GPD จงไดรบ
ความนยมอยางแพรหลายและเหมาะสาหรบวเคราะห
ขอมลดานอตวทยาและอทกวทยาเพอวเคราะหความ
รปท 1 การแจกแจงกมเบล ฟรเชท และไวลบล เมอกาหนด
α = 0
(A) (B)รปท 2 การเลอกคาสดขดสาหรบแบบจาลอง GEV (A)
และ GPD (B)
f (x)
x
319
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เสยหายของเหตการณรนแรงทมโอกาสเกดขนไดยาก (รายละเอยดเพมเตม [6] [7] [9] [10] [13] [14])
31 การแจกแจงคาสดขดวางนยทวไป (Generalized Extreme Value Distribution GEV) สมมตให Xi เมอ i = 1 2 n เปนตวแปรสมทอสระ
ตอกนและมฟงกชนหนาแนนความนาจะเปน F(xθ) เดยวกน คาสงสดของตวแปรสมคอ X(n) = Max(X1 X2 Xn ) ซงจะประยกตใชในเรองนในรปแบบของการแจกแจง
คาสดขดวางนยทวไป ทมพารามเตอรทกากบการเกดขน
ทงหมด 3 พารามเตอรคอ μ แสดงถงตาแหนง (Location) σ แสดงถงขนาด (Scale) และ ξ แสดงถงรปราง (Shape) สาหรบ GEV ถกพฒนาขนใน คศ 1955 โดย Jenkinson [15] สามารถเขยนฟงกชนการแจกแจงคาสดขดได 3 การแจกแจง ไดแก การแจกแจงกมเบล (Gumbel Distribution) การแจกแจงฟรเชท (Freacutechet Distribution) และการแจกแจง
ไวลบล (Weibull Distribution) ตอมาในป คศ 1978 Galambos [16] ไดสรางฟงกชนการแจกแจงสะสม (Cumulative Distribution Function CDF) ของ GEV ดงน
(1)
และสามารถเขยนฟงกชนการแจกแจงความนาจะเปน (Probability Distribution Function pdf) ของ GEV ดงน
(2)
สาหรบ
จากสมการท (1) และ (2) พบวา เมอ ξ = 0 เรยก
การแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงกมเบลrdquo เมอ ξ gt 0 เรยกการแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงฟรเซทrdquo และเมอ ξ lt 0 เรยกการแจกแจง
คาสดขดวางนยทวไปวา ldquoการแจกแจงไวลบลrdquo
สาหรบความสมพนธระหวางพารามเตอร μ และ σ กบโมเมนตท k ของสมการท (1) เปนดงน
ถากาหนด สามารถคานวณโมเมนตท 1 ของ
สมการท (1) ไดจาก
เมอ Γ(x) แทนฟงกชนแกมมา
กรณท ξ rarr 0 สามารถคานวณโมเมนตท 1 ไดจาก E(x) = μ + σξ เมอ ξ = 0577 เปนคาคงทออยเลอร (Euler Constant) และสามารถคานวณโมเมนตท 2 (ความแปรปรวน) ของสมการท (1) เมอกาหนด ดงน
และเมอ ξ rarr 0 พบวา
32 การแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) การวเคราะหแบบจาลองของคาสดขดดวย GEV ซงเปนวธทพจารณาขอมลทสงสดในแตละชวงคาบเวลาท
ผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลาน หรอวเคราะห (x) = 1 - F(x) เมอขอมลมจานวนมาก ทาไดโดยประยกตใชอนกรม
เทเลอร (Taylor Series Extension) กบสมการท (1) ซงสามารถเขยนฟงกชนใหมไดดงน
ซงจะลเขาส 1 ถา x rarr X F ดงนน
320
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เมอ เรยกฟงกชนนว า ldquoการแจกแจง
พาเรโตวางนยทวไปrdquo โดยปกตจะเหนวาเหตการณทเกดคาสดขด คา Xi จะม
คาสงกวาคา u (Threshold) ทกาหนด ถา u มคามากจะทาให
ฟงกชนการแจกแจงของ Xi - u มเงอนไขเมอ Xi gt u ดงน
(3)
สาหรบ เมอ จากสมการท (3) เปนการแจกแจงทอย ในกล ม
การแจกแจงเดยวกนกบการแจกแจงพาเรโต โดยคา σu เปนพารามเตอรแสดงขนาด เมอ u gt u0 พบวา σu = σu0+ ξ(u - u0) ดงนนคาพารามเตอรขนาด (ξ) จะ
เปลยนไป ยกเวนเมอ ξ = 0 การแจกแจง GPD จะไมม
การเปลยนแปลง การปรบพารามเตอรขนาดจะปรบโดย
สมการ เมอคา u0 คอคาตาทสดของ u และ
ตวประมาณของ และ ξ เปนคาคงท ซงสามารถเขยน
ฟงกชนความนาจะเปนของการแจกแจงพาเรโต ไดดงน
(4)
เมอ σ gt 0 และ -infin lt ξ lt infin
4 การประมาณคาพารามเตอร (Parameter Estimation) การประมาณพารามเตอรสาหรบ GEV และ GPD ในบทความนผ เขยนขอกลาวถงเฉพาะการประมาณ
คาพารามเตอรแบบจดดวยวธความนาจะเปนสงสด (Maximum Likelihood Estimation MLE) เทานน
ขนตอนการประมาณคาพารามเตอรดวยวธภาวะ
ความนาจะเปนสงสด มรายละเอยดดงน
ขนตอนท 1 พจารณาฟงกชนการแจกแจงความ
นาจะเปนของ GEV ในสมการท (2) ขนตอนท 2 สรางฟงกชนไลคลฮด (Likelihood
Function) ของฟงกชนการแจกแจงความนาจะเปนของ GEV ไดดงน
ขนตอนท 3 สรางฟงกชนลอคไลคลฮด (Log- likelihood Function) ของฟงกชนการแจกแจงความ
นาจะเปนของ GEV ทไดจากขนตอนท 2 ไดดงน
หรอ
ขนตอนท 4 ประมาณคาพารามเตอรดวยการหา
อนพนธยอย (Partial Derivative) จากฟงกชนทไดใน
ขนตอนท 3 และการประมาณพามเตอรสาหรบ GPD ดวยวธ MLE จะทาลกษณะเดยวกนกบการแจกแจง GEV จากฟงกชนการแจกแจงความนาจะเปนของ GPD ในสมการท (4) สามารถเขยนฟงกชนลอคไลคลฮดไดดงน
(5)
เมอกาหนดให k แทน จานวนขอมลทมคามากกวาคา u สาหรบการประมาณชวงความเชอมนสาหรบ
พารามเตอรนน มวธประมาณทนยมใชกนอยางแพรหลาย
ม 3 วธ คอ วธเชงเสนกากบปกตของตวประมาณวธประมาณ
ภาวะนาจะเปนสงสด (Asymptotic Normality of MLES) วธชวงความเชอมนแบบควรจะเปนโปรไฟล (Profile Likelihood Confidence Interval) และวธเดลตา (Delta Method) ซงผเขยนไมไดกลาวรายละเอยดไวในบทความน สามารถศกษารายละเอยดเพมเตมไดจาก [17]
321
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
5 การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด
ในทางปฏบตหากขอมลทนามาวเคราะหมาจาก
กระบวนการคงท ผ ว เคราะหสามารถประมาณคา
พารามเตอรและนามาอธบายความเปนไปของตวแปรสม
ไดอยางถกตอง แตถาหากขอมลทนามาวเคราะหมาจาก
กระบวนการทมการเปลยนแปลงขนอยกบเวลาแลวนน การจะนาคาพารามเตอรไปใชยอมเกดขอผดพลาดขนได ดงนนการหาแบบจาลองท เหมาะสมและหาระดบ
การเกดซาของขอมลสดขดโดยใชการแจกแจงคาสดขด
จงเปนอกแนวทางในการบรหารจดการและตดสนใจของ
นกวเคราะห
เมอนกวเคราะหไดแบบจาลองทเหมาะสมกบขอมล
มากกวาหนงตวแบบ การตรวจสอบความเหมาะสมของ
แบบจาลองจงมความสาคญอยางมาก สาหรบวธการตรวจ
สอบวธหนงซงนกวเคราะหมกใชการทดสอบตวแบบ คอ
การทดสอบอตราสวนควรจะเปน (Likelihood Ratio Test) โดยสถตทดสอบดงกลาวมการแจกแจงไคกาลงสอง (Chi-square Distribution) ดวยองศาอสระ v (Degree of Freedom v) เมอ v เทากบผลตางของจานวนพารามเตอร
ของตวแบบทตองการนามาเปรยบเทยบ
เมอไดตวแบบทดทสดสาหรบขอมลแลว ขนตอน
ถดมาคอ การทดสอบภาวะสารปสนทด (The Goodness of Fit) ของแบบจาลองทดทสด สามารถพจารณาจากกราฟ (Diagnostic Plots) ดงแสดงในรปท 3 ซงประกอบดวย กราฟควอนไทล (Quantile Plot) กราฟความนาจะเปน (Probability Plot) กราฟความหนาแนน (Density Plot) และกราฟระดบการเกดซา (Return Level Plot) หรอ
พจารณาจากสถตทดสอบสารปสนทดดวยสถตทดสอบ
โคโมโกรอฟสเมอรนอฟ (Kolmogorov-smirnov Test) หรอสถตทดสอบไคกาลงสอง (Chi-square Test) ไดเชนกน
6 คาบเวลาการเกดซา (Return Period) และการหา
ระดบการเกดซา (Return Level) เมอนกวเคราะหไดแบบจาลองทเหมาะสมทสด
ของขอมลแลว สงทตองวเคราะหตอมาคอ การหาระดบ
การเกดซาของคาสดขด โดยกาหนดให xT แทนระดบคา
ขอมลทสงกวาคาเฉลยในรอบ T ป (คาบเวลา) หมายถง
การวเคราะหความถของการเกดเหตการณคาสดขดในรป
ของความนาจะเปน หรอโอกาสทจะเกดเหตการณนนๆ ซงจะใชขอมลในอดตมาวเคราะห โดยใชหลกการของ
ทฤษฎคาสดขดเพอหาขนาดหรอ ปรมาณของคาสดขด
รปท 3 ตวอยางการพจารณากราฟตางๆ
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
317
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
1 บทนา
ทฤษฎคาสดขด (Extreme Value Theorem) เปน
ทฤษฎทกลาวถงคณสมบตของเหตการณทมตวแปรสม
ซงจดอยในลกษณะทเรยกวา ldquoคาสดขดrdquo อาจจะเปนคา
สงสดหรอตาสดกได พรอมทงศกษารปแบบการแจกแจง
ความนาจะเปนของตวแปรส มเหลาน การวเคราะห
ขอมลเมอขอมลมคาสดขด (Extreme Value) เกดขน นกวเคราะหสวนใหญจะตดขอมลสวนนนทงไปไมนามา
พจารณา เนองจากมความซบซอนและยงยากในการวเคราะห แตในความเปนจรงถาตองการทราบถงความนาจะเปน
ในการเกดขนของเหตการณทมค าสงสดหรอตาสด
ซงอยในสวนของปลายหางซงมคานอยมาก อาทเชน ปรมาณนาฝนสงสด-ตาสดในแตละวน ความเรวลมสงสด
ในรอบเดอน อณหภมสงสด-ตาสดในแตละวน เปนตน กสามารถทาได
การศกษาทฤษฎคาสดขดเรมตนมาตงแตทศวรรษท 19 และไดถกพฒนามาอยางตอเนองโดยนกคณตศาสตร ในป คศ 2000 Kotz และ Nadaraja [1] ไดกลาววาการ
แจกแจงคาสดขดไดถกคนพบครงแรกในป คศ 1709 โดย Bernulli และถกประยกตใชครงแรกโดย Fuller ในป คศ 1914 ซงในชวงระยะเวลาสบปทผานมามงานวจย
ทเกยวของกบสถตของคาสดขดถกตพมพเผยแพรเปน
จานวนมาก ซงงานวจยเหลานไดสรปความรพนฐานและ
เครองมอทใชสาหรบวเคราะหคาสดขดในเบองตน เพอ
ใชประกอบการตดสนใจและหาแนวทางในการปองกน
และแกไขสถานการณตางๆ เชน ดานเศรษฐศาสตร ไดนา
ทฤษฎคาสดขดชวยประเมนคาและราคาของการทาประกน (Insurance) เมอพจารณาโอกาสของเหตการณทกอให
เกดความหายนะอยางใหญหลวงทอาจจะเกดขน ถงแม
ในความเปนจรงแลวเหตการณเหลานมโอกาสจะเกดขน
ไดยากกตาม หรอใชทฤษฎนเพอประมาณมลคาของ
ความเสยง (Value at Risk VaR) ในสถาบนการเงน
และบรษททมการลงทนดานหลกทรพยหรอสนทรพย (รายละเอยดเพมเตม [2] - [5]) ดานอทกวทยา ใชทฤษฎ
คาสดขดเพอตรวจสอบความเสยงของเหตการณรนแรง
ทางสงแวดลอมทจะเกดขน เชน การหาความสงของ
คลนในทะเลเพอปองกนการเกดนาทวมของพนทชายฝง การหาปรมาณนาฝนสงสดเพอปองกนการเกดนาทวม (รายละเอยดเพมเตม [6] - [8]) ดานวศวกรรม ประยกตใช
ทฤษฎคาสดขดเพอหาขอบเขตของความตานทานของ
วตถเพอคานวณการเสอมสภาพของผลตภณฑอนเนองจาก
การขยายตวอยางชาๆ ของรอยแตกตามระยะเวลา
การใชงานในเชงพลวต (Dynamic) และความเชอถอ
ไดในการกอสรางอาคาร เชน การสรางสะพาน อปกรณ
ขดเจาะนามน และใชในการประมาณคาระดบมลพษ
ทเกดขน (รายละเอยดเพมเตม [9] - [11]) โดยหวขอถดไปผเขยนไดกลาวถงความเปนมา
ของคาสดขด การแจกแจงของคาสดขด การประมาณคา
พารามเตอร การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด และคาบเวลาการเกดซาและการหาระดบ
การเกดซา ตามลาดบ
2 ความเปนมาของคาสดขด
เหตการณสดขด (Extreme Events) คอเหตการณ
ของตวแปรสมทมโอกาสเกดขนมากกวาคาคาดหวงของ
ตวแปรสม สมมตให Xi เมอ i = 12n เปนตวแปรสม
ทอสระตอกน และมฟ งก ชนความนาจะเปนสะสม F(xθ) equiv Pr(Xi le x) เดยวกน กาหนดใหคาสงสดของ
ตวแปรสม คอ X(n) = Max(X1 X2 Xn ) ทมฟงกชน
การแจกแจงเปน Fn (x) ซงมความสมพนธกบ F(xθ) โดยมเงอนไขดงตอไปน
Fn (n) equiv Pr(X(n) le x) equiv Pr(X1 le x X2 le x Xn le x) equiv Pr(X1 le x) Pr(X2 le x) Pr(Xn le x) equiv Fn (x)
เมอ n rarr infin พบวา Pr(X(n) le x) ลเขาส F(xθ) และ x(n) = (X(n) - bn)an เปนฟงกชนการแจกแจงความนาจะเปน
แบบนอนดเจนเนอเรต (Non-degenerate Distribution) ของ F(xθ) โดยท an และ bn เปนคาคงท ดงนน
318
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
Pr(X(n) le x) = Pr((X(n) - bn)an le x) = Pr(X(n) le an x + bn) = F n(an x + bn) rarr F(x) เมอ n rarr infin
อาจจะเรยกทฤษฎคาสดขดวา ldquoทฤษฎสามแบบrdquo (Three Types Theorem) ตามลกษณะของลมตการแจกแจง
ของฟงกชน F(xθ) ตามรปท 1 [12] ดงน
แบบท 1 กมเบล (Gumbel Type) F(x) = exp(-exp(-x))เมอ -infin lt x lt infin แบบท 2 ฟรเชท (Freacutechet Type) F(x) = exp(-x-a)เมอ -infin lt x lt infin และ a gt 0พบวาถา F(x) = 0 เมอ x lt 0 แบบท 3 ไวลบล (Weibull Type) F(x) = exp(-(-x)-a)เมอ -infin lt x lt infinและ a gt 0พบวาถา F(x) = 1 เมอ x gt 0
3 การแจกแจงของคาสดขด
การวเคราะหแบบจาลองคาสดขดดวยทฤษฎคาสดขด สามารถแบงลกษณะการแจกแจงของคาสดขดไดเปน 2 ประเภทตามลกษณะของการเลอกขอมลคาสดขดทนามา
วเคราะห ดงแสดงในรปท 2 ไดแก การแจกแจงคาสดขด
วางนยทวไป (Generalized Extreme Value Distribution GEV) และการแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) ซงการสรางแบบจาลองดวย GEV เหมาะสาหรบวเคราะหคาสดขดในชวงคาบเวลาท
สนใจ เชน รายป รายเดอน รายไตรมาส หรอรายสปดาห เปนตน ซงคาสงเกตทรวบรวมไวควรจะมจานวนมากกวา 30 ปขนไป โดยจะเลอกขอมลทสงสดในแตละชวงคาบเวลา
ทผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลานเมอขอมลมจานวนมาก หรอ
ขอมลเกบรวบรวมเปนรายวน การสรางแบบจาลองดวย GPD จะมความเหมาะสมกวา GEV เนอง GPD จะอธบาย
ลกษณะขอมลทมการแจกแจงแบบมหางทหนก (Heavy-tailed Distribution) ไดดกวา และจานวนคาสดขดท
นามาวเคราะหดวย GPD จะมจานวนมากกวาขอมลท
นามาวเคราะหดวย GEV ซงสามารถลดความไมแนนอน
ทเกดขนจากการสมตวอยางได การสรางแบบจาลอง
ดวย GPD มขนตอนสาคญคอ การกาหนดคาเกณฑ (Threshold) ทเหมาะสมกบขอมลทนามาวเคราะห และ
การพจารณาความไมเปนอสระของขอมลคาสดขด ซงสามารถแกไขไดโดยการจดกลมคาสดขด (Declustering) ทมคาเกนกวาคาเกณฑ ดงนน การสรางแบบจาลองดวย GPD จงไดรบ
ความนยมอยางแพรหลายและเหมาะสาหรบวเคราะห
ขอมลดานอตวทยาและอทกวทยาเพอวเคราะหความ
รปท 1 การแจกแจงกมเบล ฟรเชท และไวลบล เมอกาหนด
α = 0
(A) (B)รปท 2 การเลอกคาสดขดสาหรบแบบจาลอง GEV (A)
และ GPD (B)
f (x)
x
319
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เสยหายของเหตการณรนแรงทมโอกาสเกดขนไดยาก (รายละเอยดเพมเตม [6] [7] [9] [10] [13] [14])
31 การแจกแจงคาสดขดวางนยทวไป (Generalized Extreme Value Distribution GEV) สมมตให Xi เมอ i = 1 2 n เปนตวแปรสมทอสระ
ตอกนและมฟงกชนหนาแนนความนาจะเปน F(xθ) เดยวกน คาสงสดของตวแปรสมคอ X(n) = Max(X1 X2 Xn ) ซงจะประยกตใชในเรองนในรปแบบของการแจกแจง
คาสดขดวางนยทวไป ทมพารามเตอรทกากบการเกดขน
ทงหมด 3 พารามเตอรคอ μ แสดงถงตาแหนง (Location) σ แสดงถงขนาด (Scale) และ ξ แสดงถงรปราง (Shape) สาหรบ GEV ถกพฒนาขนใน คศ 1955 โดย Jenkinson [15] สามารถเขยนฟงกชนการแจกแจงคาสดขดได 3 การแจกแจง ไดแก การแจกแจงกมเบล (Gumbel Distribution) การแจกแจงฟรเชท (Freacutechet Distribution) และการแจกแจง
ไวลบล (Weibull Distribution) ตอมาในป คศ 1978 Galambos [16] ไดสรางฟงกชนการแจกแจงสะสม (Cumulative Distribution Function CDF) ของ GEV ดงน
(1)
และสามารถเขยนฟงกชนการแจกแจงความนาจะเปน (Probability Distribution Function pdf) ของ GEV ดงน
(2)
สาหรบ
จากสมการท (1) และ (2) พบวา เมอ ξ = 0 เรยก
การแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงกมเบลrdquo เมอ ξ gt 0 เรยกการแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงฟรเซทrdquo และเมอ ξ lt 0 เรยกการแจกแจง
คาสดขดวางนยทวไปวา ldquoการแจกแจงไวลบลrdquo
สาหรบความสมพนธระหวางพารามเตอร μ และ σ กบโมเมนตท k ของสมการท (1) เปนดงน
ถากาหนด สามารถคานวณโมเมนตท 1 ของ
สมการท (1) ไดจาก
เมอ Γ(x) แทนฟงกชนแกมมา
กรณท ξ rarr 0 สามารถคานวณโมเมนตท 1 ไดจาก E(x) = μ + σξ เมอ ξ = 0577 เปนคาคงทออยเลอร (Euler Constant) และสามารถคานวณโมเมนตท 2 (ความแปรปรวน) ของสมการท (1) เมอกาหนด ดงน
และเมอ ξ rarr 0 พบวา
32 การแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) การวเคราะหแบบจาลองของคาสดขดดวย GEV ซงเปนวธทพจารณาขอมลทสงสดในแตละชวงคาบเวลาท
ผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลาน หรอวเคราะห (x) = 1 - F(x) เมอขอมลมจานวนมาก ทาไดโดยประยกตใชอนกรม
เทเลอร (Taylor Series Extension) กบสมการท (1) ซงสามารถเขยนฟงกชนใหมไดดงน
ซงจะลเขาส 1 ถา x rarr X F ดงนน
320
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เมอ เรยกฟงกชนนว า ldquoการแจกแจง
พาเรโตวางนยทวไปrdquo โดยปกตจะเหนวาเหตการณทเกดคาสดขด คา Xi จะม
คาสงกวาคา u (Threshold) ทกาหนด ถา u มคามากจะทาให
ฟงกชนการแจกแจงของ Xi - u มเงอนไขเมอ Xi gt u ดงน
(3)
สาหรบ เมอ จากสมการท (3) เปนการแจกแจงทอย ในกล ม
การแจกแจงเดยวกนกบการแจกแจงพาเรโต โดยคา σu เปนพารามเตอรแสดงขนาด เมอ u gt u0 พบวา σu = σu0+ ξ(u - u0) ดงนนคาพารามเตอรขนาด (ξ) จะ
เปลยนไป ยกเวนเมอ ξ = 0 การแจกแจง GPD จะไมม
การเปลยนแปลง การปรบพารามเตอรขนาดจะปรบโดย
สมการ เมอคา u0 คอคาตาทสดของ u และ
ตวประมาณของ และ ξ เปนคาคงท ซงสามารถเขยน
ฟงกชนความนาจะเปนของการแจกแจงพาเรโต ไดดงน
(4)
เมอ σ gt 0 และ -infin lt ξ lt infin
4 การประมาณคาพารามเตอร (Parameter Estimation) การประมาณพารามเตอรสาหรบ GEV และ GPD ในบทความนผ เขยนขอกลาวถงเฉพาะการประมาณ
คาพารามเตอรแบบจดดวยวธความนาจะเปนสงสด (Maximum Likelihood Estimation MLE) เทานน
ขนตอนการประมาณคาพารามเตอรดวยวธภาวะ
ความนาจะเปนสงสด มรายละเอยดดงน
ขนตอนท 1 พจารณาฟงกชนการแจกแจงความ
นาจะเปนของ GEV ในสมการท (2) ขนตอนท 2 สรางฟงกชนไลคลฮด (Likelihood
Function) ของฟงกชนการแจกแจงความนาจะเปนของ GEV ไดดงน
ขนตอนท 3 สรางฟงกชนลอคไลคลฮด (Log- likelihood Function) ของฟงกชนการแจกแจงความ
นาจะเปนของ GEV ทไดจากขนตอนท 2 ไดดงน
หรอ
ขนตอนท 4 ประมาณคาพารามเตอรดวยการหา
อนพนธยอย (Partial Derivative) จากฟงกชนทไดใน
ขนตอนท 3 และการประมาณพามเตอรสาหรบ GPD ดวยวธ MLE จะทาลกษณะเดยวกนกบการแจกแจง GEV จากฟงกชนการแจกแจงความนาจะเปนของ GPD ในสมการท (4) สามารถเขยนฟงกชนลอคไลคลฮดไดดงน
(5)
เมอกาหนดให k แทน จานวนขอมลทมคามากกวาคา u สาหรบการประมาณชวงความเชอมนสาหรบ
พารามเตอรนน มวธประมาณทนยมใชกนอยางแพรหลาย
ม 3 วธ คอ วธเชงเสนกากบปกตของตวประมาณวธประมาณ
ภาวะนาจะเปนสงสด (Asymptotic Normality of MLES) วธชวงความเชอมนแบบควรจะเปนโปรไฟล (Profile Likelihood Confidence Interval) และวธเดลตา (Delta Method) ซงผเขยนไมไดกลาวรายละเอยดไวในบทความน สามารถศกษารายละเอยดเพมเตมไดจาก [17]
321
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
5 การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด
ในทางปฏบตหากขอมลทนามาวเคราะหมาจาก
กระบวนการคงท ผ ว เคราะหสามารถประมาณคา
พารามเตอรและนามาอธบายความเปนไปของตวแปรสม
ไดอยางถกตอง แตถาหากขอมลทนามาวเคราะหมาจาก
กระบวนการทมการเปลยนแปลงขนอยกบเวลาแลวนน การจะนาคาพารามเตอรไปใชยอมเกดขอผดพลาดขนได ดงนนการหาแบบจาลองท เหมาะสมและหาระดบ
การเกดซาของขอมลสดขดโดยใชการแจกแจงคาสดขด
จงเปนอกแนวทางในการบรหารจดการและตดสนใจของ
นกวเคราะห
เมอนกวเคราะหไดแบบจาลองทเหมาะสมกบขอมล
มากกวาหนงตวแบบ การตรวจสอบความเหมาะสมของ
แบบจาลองจงมความสาคญอยางมาก สาหรบวธการตรวจ
สอบวธหนงซงนกวเคราะหมกใชการทดสอบตวแบบ คอ
การทดสอบอตราสวนควรจะเปน (Likelihood Ratio Test) โดยสถตทดสอบดงกลาวมการแจกแจงไคกาลงสอง (Chi-square Distribution) ดวยองศาอสระ v (Degree of Freedom v) เมอ v เทากบผลตางของจานวนพารามเตอร
ของตวแบบทตองการนามาเปรยบเทยบ
เมอไดตวแบบทดทสดสาหรบขอมลแลว ขนตอน
ถดมาคอ การทดสอบภาวะสารปสนทด (The Goodness of Fit) ของแบบจาลองทดทสด สามารถพจารณาจากกราฟ (Diagnostic Plots) ดงแสดงในรปท 3 ซงประกอบดวย กราฟควอนไทล (Quantile Plot) กราฟความนาจะเปน (Probability Plot) กราฟความหนาแนน (Density Plot) และกราฟระดบการเกดซา (Return Level Plot) หรอ
พจารณาจากสถตทดสอบสารปสนทดดวยสถตทดสอบ
โคโมโกรอฟสเมอรนอฟ (Kolmogorov-smirnov Test) หรอสถตทดสอบไคกาลงสอง (Chi-square Test) ไดเชนกน
6 คาบเวลาการเกดซา (Return Period) และการหา
ระดบการเกดซา (Return Level) เมอนกวเคราะหไดแบบจาลองทเหมาะสมทสด
ของขอมลแลว สงทตองวเคราะหตอมาคอ การหาระดบ
การเกดซาของคาสดขด โดยกาหนดให xT แทนระดบคา
ขอมลทสงกวาคาเฉลยในรอบ T ป (คาบเวลา) หมายถง
การวเคราะหความถของการเกดเหตการณคาสดขดในรป
ของความนาจะเปน หรอโอกาสทจะเกดเหตการณนนๆ ซงจะใชขอมลในอดตมาวเคราะห โดยใชหลกการของ
ทฤษฎคาสดขดเพอหาขนาดหรอ ปรมาณของคาสดขด
รปท 3 ตวอยางการพจารณากราฟตางๆ
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
318
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
Pr(X(n) le x) = Pr((X(n) - bn)an le x) = Pr(X(n) le an x + bn) = F n(an x + bn) rarr F(x) เมอ n rarr infin
อาจจะเรยกทฤษฎคาสดขดวา ldquoทฤษฎสามแบบrdquo (Three Types Theorem) ตามลกษณะของลมตการแจกแจง
ของฟงกชน F(xθ) ตามรปท 1 [12] ดงน
แบบท 1 กมเบล (Gumbel Type) F(x) = exp(-exp(-x))เมอ -infin lt x lt infin แบบท 2 ฟรเชท (Freacutechet Type) F(x) = exp(-x-a)เมอ -infin lt x lt infin และ a gt 0พบวาถา F(x) = 0 เมอ x lt 0 แบบท 3 ไวลบล (Weibull Type) F(x) = exp(-(-x)-a)เมอ -infin lt x lt infinและ a gt 0พบวาถา F(x) = 1 เมอ x gt 0
3 การแจกแจงของคาสดขด
การวเคราะหแบบจาลองคาสดขดดวยทฤษฎคาสดขด สามารถแบงลกษณะการแจกแจงของคาสดขดไดเปน 2 ประเภทตามลกษณะของการเลอกขอมลคาสดขดทนามา
วเคราะห ดงแสดงในรปท 2 ไดแก การแจกแจงคาสดขด
วางนยทวไป (Generalized Extreme Value Distribution GEV) และการแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) ซงการสรางแบบจาลองดวย GEV เหมาะสาหรบวเคราะหคาสดขดในชวงคาบเวลาท
สนใจ เชน รายป รายเดอน รายไตรมาส หรอรายสปดาห เปนตน ซงคาสงเกตทรวบรวมไวควรจะมจานวนมากกวา 30 ปขนไป โดยจะเลอกขอมลทสงสดในแตละชวงคาบเวลา
ทผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลานเมอขอมลมจานวนมาก หรอ
ขอมลเกบรวบรวมเปนรายวน การสรางแบบจาลองดวย GPD จะมความเหมาะสมกวา GEV เนอง GPD จะอธบาย
ลกษณะขอมลทมการแจกแจงแบบมหางทหนก (Heavy-tailed Distribution) ไดดกวา และจานวนคาสดขดท
นามาวเคราะหดวย GPD จะมจานวนมากกวาขอมลท
นามาวเคราะหดวย GEV ซงสามารถลดความไมแนนอน
ทเกดขนจากการสมตวอยางได การสรางแบบจาลอง
ดวย GPD มขนตอนสาคญคอ การกาหนดคาเกณฑ (Threshold) ทเหมาะสมกบขอมลทนามาวเคราะห และ
การพจารณาความไมเปนอสระของขอมลคาสดขด ซงสามารถแกไขไดโดยการจดกลมคาสดขด (Declustering) ทมคาเกนกวาคาเกณฑ ดงนน การสรางแบบจาลองดวย GPD จงไดรบ
ความนยมอยางแพรหลายและเหมาะสาหรบวเคราะห
ขอมลดานอตวทยาและอทกวทยาเพอวเคราะหความ
รปท 1 การแจกแจงกมเบล ฟรเชท และไวลบล เมอกาหนด
α = 0
(A) (B)รปท 2 การเลอกคาสดขดสาหรบแบบจาลอง GEV (A)
และ GPD (B)
f (x)
x
319
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เสยหายของเหตการณรนแรงทมโอกาสเกดขนไดยาก (รายละเอยดเพมเตม [6] [7] [9] [10] [13] [14])
31 การแจกแจงคาสดขดวางนยทวไป (Generalized Extreme Value Distribution GEV) สมมตให Xi เมอ i = 1 2 n เปนตวแปรสมทอสระ
ตอกนและมฟงกชนหนาแนนความนาจะเปน F(xθ) เดยวกน คาสงสดของตวแปรสมคอ X(n) = Max(X1 X2 Xn ) ซงจะประยกตใชในเรองนในรปแบบของการแจกแจง
คาสดขดวางนยทวไป ทมพารามเตอรทกากบการเกดขน
ทงหมด 3 พารามเตอรคอ μ แสดงถงตาแหนง (Location) σ แสดงถงขนาด (Scale) และ ξ แสดงถงรปราง (Shape) สาหรบ GEV ถกพฒนาขนใน คศ 1955 โดย Jenkinson [15] สามารถเขยนฟงกชนการแจกแจงคาสดขดได 3 การแจกแจง ไดแก การแจกแจงกมเบล (Gumbel Distribution) การแจกแจงฟรเชท (Freacutechet Distribution) และการแจกแจง
ไวลบล (Weibull Distribution) ตอมาในป คศ 1978 Galambos [16] ไดสรางฟงกชนการแจกแจงสะสม (Cumulative Distribution Function CDF) ของ GEV ดงน
(1)
และสามารถเขยนฟงกชนการแจกแจงความนาจะเปน (Probability Distribution Function pdf) ของ GEV ดงน
(2)
สาหรบ
จากสมการท (1) และ (2) พบวา เมอ ξ = 0 เรยก
การแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงกมเบลrdquo เมอ ξ gt 0 เรยกการแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงฟรเซทrdquo และเมอ ξ lt 0 เรยกการแจกแจง
คาสดขดวางนยทวไปวา ldquoการแจกแจงไวลบลrdquo
สาหรบความสมพนธระหวางพารามเตอร μ และ σ กบโมเมนตท k ของสมการท (1) เปนดงน
ถากาหนด สามารถคานวณโมเมนตท 1 ของ
สมการท (1) ไดจาก
เมอ Γ(x) แทนฟงกชนแกมมา
กรณท ξ rarr 0 สามารถคานวณโมเมนตท 1 ไดจาก E(x) = μ + σξ เมอ ξ = 0577 เปนคาคงทออยเลอร (Euler Constant) และสามารถคานวณโมเมนตท 2 (ความแปรปรวน) ของสมการท (1) เมอกาหนด ดงน
และเมอ ξ rarr 0 พบวา
32 การแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) การวเคราะหแบบจาลองของคาสดขดดวย GEV ซงเปนวธทพจารณาขอมลทสงสดในแตละชวงคาบเวลาท
ผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลาน หรอวเคราะห (x) = 1 - F(x) เมอขอมลมจานวนมาก ทาไดโดยประยกตใชอนกรม
เทเลอร (Taylor Series Extension) กบสมการท (1) ซงสามารถเขยนฟงกชนใหมไดดงน
ซงจะลเขาส 1 ถา x rarr X F ดงนน
320
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เมอ เรยกฟงกชนนว า ldquoการแจกแจง
พาเรโตวางนยทวไปrdquo โดยปกตจะเหนวาเหตการณทเกดคาสดขด คา Xi จะม
คาสงกวาคา u (Threshold) ทกาหนด ถา u มคามากจะทาให
ฟงกชนการแจกแจงของ Xi - u มเงอนไขเมอ Xi gt u ดงน
(3)
สาหรบ เมอ จากสมการท (3) เปนการแจกแจงทอย ในกล ม
การแจกแจงเดยวกนกบการแจกแจงพาเรโต โดยคา σu เปนพารามเตอรแสดงขนาด เมอ u gt u0 พบวา σu = σu0+ ξ(u - u0) ดงนนคาพารามเตอรขนาด (ξ) จะ
เปลยนไป ยกเวนเมอ ξ = 0 การแจกแจง GPD จะไมม
การเปลยนแปลง การปรบพารามเตอรขนาดจะปรบโดย
สมการ เมอคา u0 คอคาตาทสดของ u และ
ตวประมาณของ และ ξ เปนคาคงท ซงสามารถเขยน
ฟงกชนความนาจะเปนของการแจกแจงพาเรโต ไดดงน
(4)
เมอ σ gt 0 และ -infin lt ξ lt infin
4 การประมาณคาพารามเตอร (Parameter Estimation) การประมาณพารามเตอรสาหรบ GEV และ GPD ในบทความนผ เขยนขอกลาวถงเฉพาะการประมาณ
คาพารามเตอรแบบจดดวยวธความนาจะเปนสงสด (Maximum Likelihood Estimation MLE) เทานน
ขนตอนการประมาณคาพารามเตอรดวยวธภาวะ
ความนาจะเปนสงสด มรายละเอยดดงน
ขนตอนท 1 พจารณาฟงกชนการแจกแจงความ
นาจะเปนของ GEV ในสมการท (2) ขนตอนท 2 สรางฟงกชนไลคลฮด (Likelihood
Function) ของฟงกชนการแจกแจงความนาจะเปนของ GEV ไดดงน
ขนตอนท 3 สรางฟงกชนลอคไลคลฮด (Log- likelihood Function) ของฟงกชนการแจกแจงความ
นาจะเปนของ GEV ทไดจากขนตอนท 2 ไดดงน
หรอ
ขนตอนท 4 ประมาณคาพารามเตอรดวยการหา
อนพนธยอย (Partial Derivative) จากฟงกชนทไดใน
ขนตอนท 3 และการประมาณพามเตอรสาหรบ GPD ดวยวธ MLE จะทาลกษณะเดยวกนกบการแจกแจง GEV จากฟงกชนการแจกแจงความนาจะเปนของ GPD ในสมการท (4) สามารถเขยนฟงกชนลอคไลคลฮดไดดงน
(5)
เมอกาหนดให k แทน จานวนขอมลทมคามากกวาคา u สาหรบการประมาณชวงความเชอมนสาหรบ
พารามเตอรนน มวธประมาณทนยมใชกนอยางแพรหลาย
ม 3 วธ คอ วธเชงเสนกากบปกตของตวประมาณวธประมาณ
ภาวะนาจะเปนสงสด (Asymptotic Normality of MLES) วธชวงความเชอมนแบบควรจะเปนโปรไฟล (Profile Likelihood Confidence Interval) และวธเดลตา (Delta Method) ซงผเขยนไมไดกลาวรายละเอยดไวในบทความน สามารถศกษารายละเอยดเพมเตมไดจาก [17]
321
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
5 การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด
ในทางปฏบตหากขอมลทนามาวเคราะหมาจาก
กระบวนการคงท ผ ว เคราะหสามารถประมาณคา
พารามเตอรและนามาอธบายความเปนไปของตวแปรสม
ไดอยางถกตอง แตถาหากขอมลทนามาวเคราะหมาจาก
กระบวนการทมการเปลยนแปลงขนอยกบเวลาแลวนน การจะนาคาพารามเตอรไปใชยอมเกดขอผดพลาดขนได ดงนนการหาแบบจาลองท เหมาะสมและหาระดบ
การเกดซาของขอมลสดขดโดยใชการแจกแจงคาสดขด
จงเปนอกแนวทางในการบรหารจดการและตดสนใจของ
นกวเคราะห
เมอนกวเคราะหไดแบบจาลองทเหมาะสมกบขอมล
มากกวาหนงตวแบบ การตรวจสอบความเหมาะสมของ
แบบจาลองจงมความสาคญอยางมาก สาหรบวธการตรวจ
สอบวธหนงซงนกวเคราะหมกใชการทดสอบตวแบบ คอ
การทดสอบอตราสวนควรจะเปน (Likelihood Ratio Test) โดยสถตทดสอบดงกลาวมการแจกแจงไคกาลงสอง (Chi-square Distribution) ดวยองศาอสระ v (Degree of Freedom v) เมอ v เทากบผลตางของจานวนพารามเตอร
ของตวแบบทตองการนามาเปรยบเทยบ
เมอไดตวแบบทดทสดสาหรบขอมลแลว ขนตอน
ถดมาคอ การทดสอบภาวะสารปสนทด (The Goodness of Fit) ของแบบจาลองทดทสด สามารถพจารณาจากกราฟ (Diagnostic Plots) ดงแสดงในรปท 3 ซงประกอบดวย กราฟควอนไทล (Quantile Plot) กราฟความนาจะเปน (Probability Plot) กราฟความหนาแนน (Density Plot) และกราฟระดบการเกดซา (Return Level Plot) หรอ
พจารณาจากสถตทดสอบสารปสนทดดวยสถตทดสอบ
โคโมโกรอฟสเมอรนอฟ (Kolmogorov-smirnov Test) หรอสถตทดสอบไคกาลงสอง (Chi-square Test) ไดเชนกน
6 คาบเวลาการเกดซา (Return Period) และการหา
ระดบการเกดซา (Return Level) เมอนกวเคราะหไดแบบจาลองทเหมาะสมทสด
ของขอมลแลว สงทตองวเคราะหตอมาคอ การหาระดบ
การเกดซาของคาสดขด โดยกาหนดให xT แทนระดบคา
ขอมลทสงกวาคาเฉลยในรอบ T ป (คาบเวลา) หมายถง
การวเคราะหความถของการเกดเหตการณคาสดขดในรป
ของความนาจะเปน หรอโอกาสทจะเกดเหตการณนนๆ ซงจะใชขอมลในอดตมาวเคราะห โดยใชหลกการของ
ทฤษฎคาสดขดเพอหาขนาดหรอ ปรมาณของคาสดขด
รปท 3 ตวอยางการพจารณากราฟตางๆ
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
319
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เสยหายของเหตการณรนแรงทมโอกาสเกดขนไดยาก (รายละเอยดเพมเตม [6] [7] [9] [10] [13] [14])
31 การแจกแจงคาสดขดวางนยทวไป (Generalized Extreme Value Distribution GEV) สมมตให Xi เมอ i = 1 2 n เปนตวแปรสมทอสระ
ตอกนและมฟงกชนหนาแนนความนาจะเปน F(xθ) เดยวกน คาสงสดของตวแปรสมคอ X(n) = Max(X1 X2 Xn ) ซงจะประยกตใชในเรองนในรปแบบของการแจกแจง
คาสดขดวางนยทวไป ทมพารามเตอรทกากบการเกดขน
ทงหมด 3 พารามเตอรคอ μ แสดงถงตาแหนง (Location) σ แสดงถงขนาด (Scale) และ ξ แสดงถงรปราง (Shape) สาหรบ GEV ถกพฒนาขนใน คศ 1955 โดย Jenkinson [15] สามารถเขยนฟงกชนการแจกแจงคาสดขดได 3 การแจกแจง ไดแก การแจกแจงกมเบล (Gumbel Distribution) การแจกแจงฟรเชท (Freacutechet Distribution) และการแจกแจง
ไวลบล (Weibull Distribution) ตอมาในป คศ 1978 Galambos [16] ไดสรางฟงกชนการแจกแจงสะสม (Cumulative Distribution Function CDF) ของ GEV ดงน
(1)
และสามารถเขยนฟงกชนการแจกแจงความนาจะเปน (Probability Distribution Function pdf) ของ GEV ดงน
(2)
สาหรบ
จากสมการท (1) และ (2) พบวา เมอ ξ = 0 เรยก
การแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงกมเบลrdquo เมอ ξ gt 0 เรยกการแจกแจงคาสดขดวางนยทวไปวา ldquoการแจกแจงฟรเซทrdquo และเมอ ξ lt 0 เรยกการแจกแจง
คาสดขดวางนยทวไปวา ldquoการแจกแจงไวลบลrdquo
สาหรบความสมพนธระหวางพารามเตอร μ และ σ กบโมเมนตท k ของสมการท (1) เปนดงน
ถากาหนด สามารถคานวณโมเมนตท 1 ของ
สมการท (1) ไดจาก
เมอ Γ(x) แทนฟงกชนแกมมา
กรณท ξ rarr 0 สามารถคานวณโมเมนตท 1 ไดจาก E(x) = μ + σξ เมอ ξ = 0577 เปนคาคงทออยเลอร (Euler Constant) และสามารถคานวณโมเมนตท 2 (ความแปรปรวน) ของสมการท (1) เมอกาหนด ดงน
และเมอ ξ rarr 0 พบวา
32 การแจกแจงพาเรโตวางนยทวไป (Generalized Pareto Distribution GPD) การวเคราะหแบบจาลองของคาสดขดดวย GEV ซงเปนวธทพจารณาขอมลทสงสดในแตละชวงคาบเวลาท
ผวเคราะหสนใจ แตถาตองการวเคราะหการแจกแจงของ
ปลายหางของขอมลเหลาน หรอวเคราะห (x) = 1 - F(x) เมอขอมลมจานวนมาก ทาไดโดยประยกตใชอนกรม
เทเลอร (Taylor Series Extension) กบสมการท (1) ซงสามารถเขยนฟงกชนใหมไดดงน
ซงจะลเขาส 1 ถา x rarr X F ดงนน
320
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เมอ เรยกฟงกชนนว า ldquoการแจกแจง
พาเรโตวางนยทวไปrdquo โดยปกตจะเหนวาเหตการณทเกดคาสดขด คา Xi จะม
คาสงกวาคา u (Threshold) ทกาหนด ถา u มคามากจะทาให
ฟงกชนการแจกแจงของ Xi - u มเงอนไขเมอ Xi gt u ดงน
(3)
สาหรบ เมอ จากสมการท (3) เปนการแจกแจงทอย ในกล ม
การแจกแจงเดยวกนกบการแจกแจงพาเรโต โดยคา σu เปนพารามเตอรแสดงขนาด เมอ u gt u0 พบวา σu = σu0+ ξ(u - u0) ดงนนคาพารามเตอรขนาด (ξ) จะ
เปลยนไป ยกเวนเมอ ξ = 0 การแจกแจง GPD จะไมม
การเปลยนแปลง การปรบพารามเตอรขนาดจะปรบโดย
สมการ เมอคา u0 คอคาตาทสดของ u และ
ตวประมาณของ และ ξ เปนคาคงท ซงสามารถเขยน
ฟงกชนความนาจะเปนของการแจกแจงพาเรโต ไดดงน
(4)
เมอ σ gt 0 และ -infin lt ξ lt infin
4 การประมาณคาพารามเตอร (Parameter Estimation) การประมาณพารามเตอรสาหรบ GEV และ GPD ในบทความนผ เขยนขอกลาวถงเฉพาะการประมาณ
คาพารามเตอรแบบจดดวยวธความนาจะเปนสงสด (Maximum Likelihood Estimation MLE) เทานน
ขนตอนการประมาณคาพารามเตอรดวยวธภาวะ
ความนาจะเปนสงสด มรายละเอยดดงน
ขนตอนท 1 พจารณาฟงกชนการแจกแจงความ
นาจะเปนของ GEV ในสมการท (2) ขนตอนท 2 สรางฟงกชนไลคลฮด (Likelihood
Function) ของฟงกชนการแจกแจงความนาจะเปนของ GEV ไดดงน
ขนตอนท 3 สรางฟงกชนลอคไลคลฮด (Log- likelihood Function) ของฟงกชนการแจกแจงความ
นาจะเปนของ GEV ทไดจากขนตอนท 2 ไดดงน
หรอ
ขนตอนท 4 ประมาณคาพารามเตอรดวยการหา
อนพนธยอย (Partial Derivative) จากฟงกชนทไดใน
ขนตอนท 3 และการประมาณพามเตอรสาหรบ GPD ดวยวธ MLE จะทาลกษณะเดยวกนกบการแจกแจง GEV จากฟงกชนการแจกแจงความนาจะเปนของ GPD ในสมการท (4) สามารถเขยนฟงกชนลอคไลคลฮดไดดงน
(5)
เมอกาหนดให k แทน จานวนขอมลทมคามากกวาคา u สาหรบการประมาณชวงความเชอมนสาหรบ
พารามเตอรนน มวธประมาณทนยมใชกนอยางแพรหลาย
ม 3 วธ คอ วธเชงเสนกากบปกตของตวประมาณวธประมาณ
ภาวะนาจะเปนสงสด (Asymptotic Normality of MLES) วธชวงความเชอมนแบบควรจะเปนโปรไฟล (Profile Likelihood Confidence Interval) และวธเดลตา (Delta Method) ซงผเขยนไมไดกลาวรายละเอยดไวในบทความน สามารถศกษารายละเอยดเพมเตมไดจาก [17]
321
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
5 การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด
ในทางปฏบตหากขอมลทนามาวเคราะหมาจาก
กระบวนการคงท ผ ว เคราะหสามารถประมาณคา
พารามเตอรและนามาอธบายความเปนไปของตวแปรสม
ไดอยางถกตอง แตถาหากขอมลทนามาวเคราะหมาจาก
กระบวนการทมการเปลยนแปลงขนอยกบเวลาแลวนน การจะนาคาพารามเตอรไปใชยอมเกดขอผดพลาดขนได ดงนนการหาแบบจาลองท เหมาะสมและหาระดบ
การเกดซาของขอมลสดขดโดยใชการแจกแจงคาสดขด
จงเปนอกแนวทางในการบรหารจดการและตดสนใจของ
นกวเคราะห
เมอนกวเคราะหไดแบบจาลองทเหมาะสมกบขอมล
มากกวาหนงตวแบบ การตรวจสอบความเหมาะสมของ
แบบจาลองจงมความสาคญอยางมาก สาหรบวธการตรวจ
สอบวธหนงซงนกวเคราะหมกใชการทดสอบตวแบบ คอ
การทดสอบอตราสวนควรจะเปน (Likelihood Ratio Test) โดยสถตทดสอบดงกลาวมการแจกแจงไคกาลงสอง (Chi-square Distribution) ดวยองศาอสระ v (Degree of Freedom v) เมอ v เทากบผลตางของจานวนพารามเตอร
ของตวแบบทตองการนามาเปรยบเทยบ
เมอไดตวแบบทดทสดสาหรบขอมลแลว ขนตอน
ถดมาคอ การทดสอบภาวะสารปสนทด (The Goodness of Fit) ของแบบจาลองทดทสด สามารถพจารณาจากกราฟ (Diagnostic Plots) ดงแสดงในรปท 3 ซงประกอบดวย กราฟควอนไทล (Quantile Plot) กราฟความนาจะเปน (Probability Plot) กราฟความหนาแนน (Density Plot) และกราฟระดบการเกดซา (Return Level Plot) หรอ
พจารณาจากสถตทดสอบสารปสนทดดวยสถตทดสอบ
โคโมโกรอฟสเมอรนอฟ (Kolmogorov-smirnov Test) หรอสถตทดสอบไคกาลงสอง (Chi-square Test) ไดเชนกน
6 คาบเวลาการเกดซา (Return Period) และการหา
ระดบการเกดซา (Return Level) เมอนกวเคราะหไดแบบจาลองทเหมาะสมทสด
ของขอมลแลว สงทตองวเคราะหตอมาคอ การหาระดบ
การเกดซาของคาสดขด โดยกาหนดให xT แทนระดบคา
ขอมลทสงกวาคาเฉลยในรอบ T ป (คาบเวลา) หมายถง
การวเคราะหความถของการเกดเหตการณคาสดขดในรป
ของความนาจะเปน หรอโอกาสทจะเกดเหตการณนนๆ ซงจะใชขอมลในอดตมาวเคราะห โดยใชหลกการของ
ทฤษฎคาสดขดเพอหาขนาดหรอ ปรมาณของคาสดขด
รปท 3 ตวอยางการพจารณากราฟตางๆ
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
320
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
เมอ เรยกฟงกชนนว า ldquoการแจกแจง
พาเรโตวางนยทวไปrdquo โดยปกตจะเหนวาเหตการณทเกดคาสดขด คา Xi จะม
คาสงกวาคา u (Threshold) ทกาหนด ถา u มคามากจะทาให
ฟงกชนการแจกแจงของ Xi - u มเงอนไขเมอ Xi gt u ดงน
(3)
สาหรบ เมอ จากสมการท (3) เปนการแจกแจงทอย ในกล ม
การแจกแจงเดยวกนกบการแจกแจงพาเรโต โดยคา σu เปนพารามเตอรแสดงขนาด เมอ u gt u0 พบวา σu = σu0+ ξ(u - u0) ดงนนคาพารามเตอรขนาด (ξ) จะ
เปลยนไป ยกเวนเมอ ξ = 0 การแจกแจง GPD จะไมม
การเปลยนแปลง การปรบพารามเตอรขนาดจะปรบโดย
สมการ เมอคา u0 คอคาตาทสดของ u และ
ตวประมาณของ และ ξ เปนคาคงท ซงสามารถเขยน
ฟงกชนความนาจะเปนของการแจกแจงพาเรโต ไดดงน
(4)
เมอ σ gt 0 และ -infin lt ξ lt infin
4 การประมาณคาพารามเตอร (Parameter Estimation) การประมาณพารามเตอรสาหรบ GEV และ GPD ในบทความนผ เขยนขอกลาวถงเฉพาะการประมาณ
คาพารามเตอรแบบจดดวยวธความนาจะเปนสงสด (Maximum Likelihood Estimation MLE) เทานน
ขนตอนการประมาณคาพารามเตอรดวยวธภาวะ
ความนาจะเปนสงสด มรายละเอยดดงน
ขนตอนท 1 พจารณาฟงกชนการแจกแจงความ
นาจะเปนของ GEV ในสมการท (2) ขนตอนท 2 สรางฟงกชนไลคลฮด (Likelihood
Function) ของฟงกชนการแจกแจงความนาจะเปนของ GEV ไดดงน
ขนตอนท 3 สรางฟงกชนลอคไลคลฮด (Log- likelihood Function) ของฟงกชนการแจกแจงความ
นาจะเปนของ GEV ทไดจากขนตอนท 2 ไดดงน
หรอ
ขนตอนท 4 ประมาณคาพารามเตอรดวยการหา
อนพนธยอย (Partial Derivative) จากฟงกชนทไดใน
ขนตอนท 3 และการประมาณพามเตอรสาหรบ GPD ดวยวธ MLE จะทาลกษณะเดยวกนกบการแจกแจง GEV จากฟงกชนการแจกแจงความนาจะเปนของ GPD ในสมการท (4) สามารถเขยนฟงกชนลอคไลคลฮดไดดงน
(5)
เมอกาหนดให k แทน จานวนขอมลทมคามากกวาคา u สาหรบการประมาณชวงความเชอมนสาหรบ
พารามเตอรนน มวธประมาณทนยมใชกนอยางแพรหลาย
ม 3 วธ คอ วธเชงเสนกากบปกตของตวประมาณวธประมาณ
ภาวะนาจะเปนสงสด (Asymptotic Normality of MLES) วธชวงความเชอมนแบบควรจะเปนโปรไฟล (Profile Likelihood Confidence Interval) และวธเดลตา (Delta Method) ซงผเขยนไมไดกลาวรายละเอยดไวในบทความน สามารถศกษารายละเอยดเพมเตมไดจาก [17]
321
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
5 การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด
ในทางปฏบตหากขอมลทนามาวเคราะหมาจาก
กระบวนการคงท ผ ว เคราะหสามารถประมาณคา
พารามเตอรและนามาอธบายความเปนไปของตวแปรสม
ไดอยางถกตอง แตถาหากขอมลทนามาวเคราะหมาจาก
กระบวนการทมการเปลยนแปลงขนอยกบเวลาแลวนน การจะนาคาพารามเตอรไปใชยอมเกดขอผดพลาดขนได ดงนนการหาแบบจาลองท เหมาะสมและหาระดบ
การเกดซาของขอมลสดขดโดยใชการแจกแจงคาสดขด
จงเปนอกแนวทางในการบรหารจดการและตดสนใจของ
นกวเคราะห
เมอนกวเคราะหไดแบบจาลองทเหมาะสมกบขอมล
มากกวาหนงตวแบบ การตรวจสอบความเหมาะสมของ
แบบจาลองจงมความสาคญอยางมาก สาหรบวธการตรวจ
สอบวธหนงซงนกวเคราะหมกใชการทดสอบตวแบบ คอ
การทดสอบอตราสวนควรจะเปน (Likelihood Ratio Test) โดยสถตทดสอบดงกลาวมการแจกแจงไคกาลงสอง (Chi-square Distribution) ดวยองศาอสระ v (Degree of Freedom v) เมอ v เทากบผลตางของจานวนพารามเตอร
ของตวแบบทตองการนามาเปรยบเทยบ
เมอไดตวแบบทดทสดสาหรบขอมลแลว ขนตอน
ถดมาคอ การทดสอบภาวะสารปสนทด (The Goodness of Fit) ของแบบจาลองทดทสด สามารถพจารณาจากกราฟ (Diagnostic Plots) ดงแสดงในรปท 3 ซงประกอบดวย กราฟควอนไทล (Quantile Plot) กราฟความนาจะเปน (Probability Plot) กราฟความหนาแนน (Density Plot) และกราฟระดบการเกดซา (Return Level Plot) หรอ
พจารณาจากสถตทดสอบสารปสนทดดวยสถตทดสอบ
โคโมโกรอฟสเมอรนอฟ (Kolmogorov-smirnov Test) หรอสถตทดสอบไคกาลงสอง (Chi-square Test) ไดเชนกน
6 คาบเวลาการเกดซา (Return Period) และการหา
ระดบการเกดซา (Return Level) เมอนกวเคราะหไดแบบจาลองทเหมาะสมทสด
ของขอมลแลว สงทตองวเคราะหตอมาคอ การหาระดบ
การเกดซาของคาสดขด โดยกาหนดให xT แทนระดบคา
ขอมลทสงกวาคาเฉลยในรอบ T ป (คาบเวลา) หมายถง
การวเคราะหความถของการเกดเหตการณคาสดขดในรป
ของความนาจะเปน หรอโอกาสทจะเกดเหตการณนนๆ ซงจะใชขอมลในอดตมาวเคราะห โดยใชหลกการของ
ทฤษฎคาสดขดเพอหาขนาดหรอ ปรมาณของคาสดขด
รปท 3 ตวอยางการพจารณากราฟตางๆ
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
321
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
5 การตรวจสอบความเหมาะสมของแบบจาลอง
คาสดขด
ในทางปฏบตหากขอมลทนามาวเคราะหมาจาก
กระบวนการคงท ผ ว เคราะหสามารถประมาณคา
พารามเตอรและนามาอธบายความเปนไปของตวแปรสม
ไดอยางถกตอง แตถาหากขอมลทนามาวเคราะหมาจาก
กระบวนการทมการเปลยนแปลงขนอยกบเวลาแลวนน การจะนาคาพารามเตอรไปใชยอมเกดขอผดพลาดขนได ดงนนการหาแบบจาลองท เหมาะสมและหาระดบ
การเกดซาของขอมลสดขดโดยใชการแจกแจงคาสดขด
จงเปนอกแนวทางในการบรหารจดการและตดสนใจของ
นกวเคราะห
เมอนกวเคราะหไดแบบจาลองทเหมาะสมกบขอมล
มากกวาหนงตวแบบ การตรวจสอบความเหมาะสมของ
แบบจาลองจงมความสาคญอยางมาก สาหรบวธการตรวจ
สอบวธหนงซงนกวเคราะหมกใชการทดสอบตวแบบ คอ
การทดสอบอตราสวนควรจะเปน (Likelihood Ratio Test) โดยสถตทดสอบดงกลาวมการแจกแจงไคกาลงสอง (Chi-square Distribution) ดวยองศาอสระ v (Degree of Freedom v) เมอ v เทากบผลตางของจานวนพารามเตอร
ของตวแบบทตองการนามาเปรยบเทยบ
เมอไดตวแบบทดทสดสาหรบขอมลแลว ขนตอน
ถดมาคอ การทดสอบภาวะสารปสนทด (The Goodness of Fit) ของแบบจาลองทดทสด สามารถพจารณาจากกราฟ (Diagnostic Plots) ดงแสดงในรปท 3 ซงประกอบดวย กราฟควอนไทล (Quantile Plot) กราฟความนาจะเปน (Probability Plot) กราฟความหนาแนน (Density Plot) และกราฟระดบการเกดซา (Return Level Plot) หรอ
พจารณาจากสถตทดสอบสารปสนทดดวยสถตทดสอบ
โคโมโกรอฟสเมอรนอฟ (Kolmogorov-smirnov Test) หรอสถตทดสอบไคกาลงสอง (Chi-square Test) ไดเชนกน
6 คาบเวลาการเกดซา (Return Period) และการหา
ระดบการเกดซา (Return Level) เมอนกวเคราะหไดแบบจาลองทเหมาะสมทสด
ของขอมลแลว สงทตองวเคราะหตอมาคอ การหาระดบ
การเกดซาของคาสดขด โดยกาหนดให xT แทนระดบคา
ขอมลทสงกวาคาเฉลยในรอบ T ป (คาบเวลา) หมายถง
การวเคราะหความถของการเกดเหตการณคาสดขดในรป
ของความนาจะเปน หรอโอกาสทจะเกดเหตการณนนๆ ซงจะใชขอมลในอดตมาวเคราะห โดยใชหลกการของ
ทฤษฎคาสดขดเพอหาขนาดหรอ ปรมาณของคาสดขด
รปท 3 ตวอยางการพจารณากราฟตางๆ
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
322
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
ทจะเกดขนทคาบเวลาการเกดซา เชน คาสงสดหรอ
คาตาสดของปรมาณนาฝน คาความเรวลมสงสด เปนตน
ความถของการเกดเหตการณคาสดขดคานวณจาก
ความถสมพทธของเหตการณ เชน ในจานวนชดขอมลคา
สดขดจานวน N คา ถามจานวนขอมลทอยในชวงเกดเหต
การณใดๆ อย n คา จะมความถสมพทธของเหตการณ
นนเทากบ และถามจานวนชดขอมลทวดไดมากพอ ความถสมพทธจะมคาเขาใกลความนาจะเปนของการเกด
เหตการณ ใน คศ 1958 Gumbel [18] ไดเสนอทฤษฎการ
แจกแจงความถในรปสมการทวไปสาหรบโอกาสทจะเกด
เหตการณ X ทมคานอยกวาหรอเทากบ x หรอ P(X le x) นนคอ
F(X) = P(X le x) = 1 - P(X ge x) = 1 - เมอ T คอคาบเวลาหรอรอบปการเกดซา
ตวอยาง การหาระดบการเกดซาสาหรบการออกแบบ
โครงการทางวศวกรรมแหลงนาตางๆ นยมเรยกกนวา ระดบการเกดซา xT คอตาแหนงของขอมล (Quantiles) เมอ p คอความนาจะเปนของเหตการณท x gt xT โดยเฉลย 1 ครงในทกๆ T ป ซง T คอรอบปหรอคาบเวลาการเกดซา
ทมความสมพนธกบ p โดยท T = และเขยนฟงกชน
สะสมของระดบการเกดซาไดวา F(xT) = 1 - จะเหนไดวา
รอบปการเกดซา T แทจรงแลวคอจานวนรอบปทเกด
เหตการณภยพบต x gt xT เกดขนโดยเฉลย 1 ครงนนเอง
61 ระดบการเกดซาสาหรบการแจกแจงคาสดขด
วางนยทวไป สามารถคานวณระดบการเกดซา ณ คาบเวลา T ทสนใจของ GEV ดงน
62 ระดบการเกดซาสาหรบการแจกแจงพาเรโต
วางนยทวไป
สาหรบ GPD ซงมพารามเตอร σ และ ξ เมอมขอมล
ทมคาสงกวาคา u นนแสดงวา X gt u ซงสามารถเขยน
สมการทวไปสาหรบโอกาสทจะเกดเหตการณดงกลาว
ไดดงน
โดยกาหนดให ζu = Pr(X gt u) ดงนน ระดบการเกดซา หมายถง คาเฉลยของคาทสงเกนกวาคา u ทกๆ คาสงเกต ณ คาบเวลา T ทสนใจ นนคอ
และสามารถจดรปสมการระดบการเกดซาสาหรบ
การแจกแจงพาเรโตวางนยทวไป ไดดงน
ถา
สาหรบ T = N times ny เมอ ny คอจานวนคาสงเกตตอป และ N เปนจานวนป
7 สรป
จากทผ เขยนไดกลาวถงสถตของคาสดขดโดย
ไดกลาวถงทฤษฎคาสดขด ผานการแจกแจงของคาสดขด
ทงการแจกแจง GEV และ GPD และการเลอกคาสดขด
ทถกนามาวเคราะหในการแจกแจงทงสองแบบ รวมทง
การหาระดบการเกดซาสาหรบการแจกแจง GEV และ GPD ซงเปนหวใจสาคญในการศกษาแบบจาลองคาสดขด อยางไรกตามยงมรายละเอยดของทฤษฎคาสดขด
อกหลายประเดนทผเขยนไมไดกลาวในบทความน อาท
เชน วธการแกปญหาการเลอกคาเกณฑทเหมาะสม
สาหรบการวเคราะห GPD การประมาณคาพารามเตอร
ดวยวธของเบย (Bayesian Methods) และการเปรยบเทยบ
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
323
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
แบบจาลองตางๆ เพอหาแบบจาลองทเหมาะสมสาหรบ
ขอมลทนามาวเคราะหดวยเกณฑสารสนเทศของ Akaike (Akaikersquos Information Criterion AIC) และเกณฑ
สารสนเทศเบส (Bayesian Information Criterion BIC) เปนตน
ในปจจบนมนกวจยพฒนาทฤษฎคาสดขดอยาง
ตอเนอง พรอมทงเปรยบเทยบแบบจาลองของการแจกแจง
คาสดขดกบการแจกแจงแบบมหางทหนกอนๆ เชน การแจกแจงแคปปา (Kappa Distribution) และการแจกแจง
เวคบย (Wakeby Distribution) ซงมพารามเตอรทกากบ
การเกดขน 4 และ 5 พารามเตอร ตามลาดบ อยางไรกตาม
มงานวจยหลายเรองไดขอสรปวาแบบจาลองทเหมาะสม
ทสดสาหรบขอมลทมคาสดขดรวมอย โดยเฉพาะขอมล
ดานอตนยมวทยาและอทกวทยา คอแบบจาลองของ
การแจกแจงคาสดขด (รายละเอยดเพมเตม [1] [6] [7] [9]) ดงนนจงเปนประเดนทนาสนใจสาหรบนกวเคราะห
ทจะทราบเกยวกบสถตคาสดขดเพอเปนความรเบองตน
ในการประยกตใชทฤษฎตางๆ เพอวเคราะหขอมลได
อยางมประสทธภาพและถกตอง
เอกสารอางอง
[1] S Kotz and S Nadaraja Extreme Value Distributions Theory and Applications Singapore Imperial College Press 2000
[2] P Embrecht C Kluppelberg and T Mikosch Modeling extremal events for insurance and finance Berlin Springer Verlag 1997
[3] B Erik and H Rootzen ldquoUnivariate and bivariate GPD methods for predicting extreme wind storm lossesrdquo Insurance Mathematics and Economics vol 44 pp 345-356 2009
[4] B Finkenstadt and H Rootzen Extreme values in finance telecommunications and the environment London Chapman and HallCRC Press 2004
[5] J Beirlant et al Statistics of Extremes Theory and Applications New York John Wiley amp Sons 2004
[6] T An and MD Pandey ldquoA comparison of methods of extreme wind speed estimationrdquo Technical note Journal of Wind Engineering and Industrial Aerodynamics vol 93 pp 535-545 2005
[7] RW Katz MB Parlange and P Naveau ldquoStatistics of extremes in hydrologyrdquo Advanced Water Resources vol 25 pp 1287-1304 2002
[8] S Nadarajah and D Choi ldquoMaximum daily rainfall in South Koreardquo Journal of Earth System Science vol 116 no 4 pp 311-320 2007
[9] L Rajaram Statistical Models in Environmental and Life Sciences Florida University of South Florida 2006
[10] V Storch and FW Awiers Statistical analysis in climate research Cambridge Cambridge University Press 2001
[11] MR Leadbetter G Lindgren and H Rootzen Extremes and related properties of randorn sequences and processes New York Springer Verlag 1983
[12] S Coles An introduction to statistical modeling of extreme values London Springer Verlag 2001
[13] BB Brabson and JP Palutikof ldquoTests of the generalized Pareto distribution for predicting extreme wind speedsrdquo Journal of Applied Meteorology vol 39 pp 1627-1640 1999
[14] RD Reiss and M Thomas Statistical analysis of extreme values with applications to insurance finance hydrology and other fields Basel Birkhauser 2001
[15] AF Jenkinson ldquoThe frequency distribution of the annual maximum (or minimum) values of
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958
324
The Journal of KMUTNB Vol 25 No 2 May - Aug 2015วารสารวชาการพระจอมเกลาพระนครเหนอ ปท 25 ฉบบท 2 พค - สค 2558
meteorological elementsrdquo Quarterly Journal of the Royal Meteorological Society vol 81 pp 158-171 1955
[16] J Galambos The asymptotic theory of extreme order statistics New York Wiley 1978
[17] S Coles and S Nadaraja An Introduction to Statistical Modeling of Extreme Values Great Britain Springer-Varlag London Limited 2001
[18] EJ Gumbel Statistics of Extremes New York Columbia University Press 1958