6
1 AbstrakIndonesia berada dalam kawasan yang dilalui garis khatulistiwa dan masuk kedaerah lautan pasifik sehingga Indonesia sangat rentan sekali terjadi iklim ekstrim dan mengalami gangguan cuaca yang mengakibatkan menurunnya ketahanan pangan. Kejadian curah hujan ekstrim perlu diidentifikasi untuk meminimalkan kerugian akibat kejadian tersebut. Penelitian ini dilakukan di lima kabupaten yang merupakan sentra produksi padi yaitu Kabupaten Jember, Kabupaten Bojonegoro, Kabupaten Lamongan, Kabupaten Banyuwangi, dan Kabupaten Ngawi. Metode statistika yang digunakan untuk mengidentifikasi adanya kejadian ekstrim yaitu Extreme Value Theory (EVT). Pada penelitian ini pendekatan dengan metode Peaks Over Threshold (POT) digunakan untuk menentukan nilai return level atau nilai maksimum yang terjadi dalam periode waktu tertentu. Perhitungan return level menggunakan parameter dari distribusi EVT, khususnya Generalized Pareto Distribution (GPD) yang dipilih. Syarat utama dalam menduga parameter distribusi GPD adalah urutan data ekstrim harus independen. Namun dalam kasus nyata syarat ini seringkali terlanggar, yaitu urutan data dependen, sehingga akan mengurangi kesahihan kesimpulan. Oleh karena penelitian ini mengkaji analisis data ekstrim dependen dengan memodelkan parameter distribusi GPD, yang selanjutnya digunakan perhitungan return level. Hasil penelitian menunjukkan bahwa nilai dugaan return level model parameter POT-GPD memiliki kinerja yang baik. Hal ini ditunjukkan oleh nilai RMSE lebih kecil daripada dugaan return level nonmodel. Kata Kunci—Data ekstrem dependen, Extreme Value Theory, Peaks Over Threshold, Return Level I. PENDAHULUAN ndonesia memiliki iklim tropis yang dilewati oleh garis khatulistiwa dan termasuk ke dalam pengaruh kawasan laut pasifik sehingga menerima energi matahari yang lebih luas sepanjang tahun. Hal tersebut menyebabkan Indonesia sangat rentan dengan terjadinya iklim ekstrim dan gangguan cuaca. Iklim ekstrim memberikan dampak yang besar seperti timbulnya wabah penyakit, gangguan kesehatan, naiknya permukaan air laut, ketahanan pangan yang mengakibatkan menurunnya produksi pertanian atau gagal panen, banjir, tanah longsor, dan kerawanan sosial lainnya. Informasi dan pengetahuan khususnya dalam faktor cuaca dan iklim tentang perilaku nilai-nilai ekstrim sangat dibutuhkan untuk mengetahui perilaku nilai ekstrim agar produksi tanaman pangan bisa dimaksimalkan dan kerugian bisa diminimalkan. Penanganan dampak kerugian produksi pertanian akibat iklim dengan memodelkan nilai ekstrim dan menentukan return level (nilai maksimum) dalam periode waktu ulang tertentu, sehingga dapat menentukan waktu tanam yang sesuai.Metode yang digunakan pada penelitian sebelumnya untuk mengidentifikasi iklim ekstrim (curah hujan) y aitu Extreme Value Theory (EVT) dengan dua pendekatan Block Maxima (BM) yang mengikuti distribusi Generalized Extreme Value (GEV) dan Peaks Over Threshold (POT)yang mengikuti distribusi Generalized Pareto Distribution (GPD). Wahyudi [1] yang membandingkan dua pendekatan antara BM dan POT. Kesimpulan penelitian tersebut adalah menggunakan pendekatan POT memberikan hasil yang lebih sesuai dibandingkan dengan BM untuk curah hujan di Ngawi. Perhitungan return level menggunakan parameter dari distribusi EVT yang dipilih. Oleh karena itu pendugaan parameter distribusi EVT harus tepat, sehingga diperoleh nilai return level yang tepat pula. Syarat utama dalam menduga parameter distribusi EVT adalah urutan data ekstrim harus independen. Namun dalam kasus nyata syarat ini seringkali terlanggar, yaitu urutan data dependen, sehingga akan mengurangi kesahihan kesimpulan. Eastoe [2] melakukan penelitian untuk data ozon, dalam penelitiannya dinyatakan bahwa terdapat banyak model statistik dan metode inferensia yang ada digunakan untuk data ekstrim yang univariat dan independen, namun pada beberapa aplikasi juga terdapat data yang dependen. Berdasarkan uraian tersebut maka penelitimenggunakan Extreme Value Theory untuk mengatasi data curah hujan ekstrim yang dependen di daerah sentra produksi padi di Jawa Timur. Salah satu pendekatan yang digunakan untuk menduga parameter distribusi EVT dengan data ekstrim dependen adalah memodelkan parameter sesuai dengan pola data menurut runtun waktunya. Terdapat tiga permasalahan dalam penelitian ini yaitu bagaimana karakteristik curah hujan ekstrim di Jawa Timur khususnya Kabupaten Banyuwangi, Bojonegoro, Jember, Ngawi, dan Lamongan dengan pendekatan POT, bagaimana bentuk model pa rameter POT-GPD pada data ekstrim dependen curah hujan di lima kabupaten tersebut, dan bererapa nilai return level curah hujan ekstrim di lima kabupaten tersebut. Analisis Data Ekstrim Dependen (Non Stationary) Pada Kasus Curah Hujan Ekstrim Di Jawa Timur Dengan Pendekatan Peaks Over Threshold. Yuli Kurniawati dan Sutikno Jurusan Statistika,FMIPA, ITS, Institut Teknologi Sepuluh Nopember (ITS) Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia e-mail : [email protected] I

Analisis Data Ekstrim Dependen ( Pada Kasus Curah Hujan ...digilib.its.ac.id/public/ITS-paper-34952-1309100098-Paper.pdf · bentuk model parameter POT-GPD pada data ekstrim dependen

Embed Size (px)

Citation preview

1

Abstrak—Indonesia berada dalam kawasan yang dilalui garis khatulistiwa dan masuk kedaerah lautan pasifik sehingga Indonesia sangat rentan sekali terjadi iklim ekstrim dan mengalami gangguan cuaca yang mengakibatkan menurunnya ketahanan pangan. Kejadian curah hujan ekstrim perlu diidentifikasi untuk meminimalkan kerugian akibat kejadian tersebut. Penelitian ini dilakukan di lima kabupaten yang merupakan sentra produksi padi yaitu Kabupaten Jember, Kabupaten Bojonegoro, Kabupaten Lamongan, Kabupaten Banyuwangi, dan Kabupaten Ngawi. Metode statistika yang digunakan untuk mengidentifikasi adanya kejadian ekstrim yaitu Extreme Value Theory (EVT). Pada penelitian ini pendekatan dengan metode Peaks Over Threshold (POT) digunakan untuk menentukan nilai return level atau nilai maksimum yang terjadi dalam periode waktu tertentu. Perhitungan return level menggunakan parameter dari distribusi EVT, khususnya Generalized Pareto Distribution (GPD) yang dipilih. Syarat utama dalam menduga parameter distribusi GPD adalah urutan data ekstrim harus independen. Namun dalam kasus nyata syarat ini seringkali terlanggar, yaitu urutan data dependen, sehingga akan mengurangi kesahihan kesimpulan. Oleh karena penelitian ini mengkaji analisis data ekstrim dependen dengan memodelkan parameter distribusi GPD, yang selanjutnya digunakan perhitungan return level. Hasil penelitian menunjukkan bahwa nilai dugaan return level model parameter POT-GPD memiliki kinerja yang baik. Hal ini ditunjukkan oleh nilai RMSE lebih kecil daripada dugaan return level nonmodel.

Kata Kunci—Data ekstrem dependen, Extreme Value Theory,

Peaks Over Threshold, Return Level

I. PENDAHULUAN ndonesia memiliki iklim tropis yang dilewati oleh garis khatulistiwa dan termasuk ke dalam pengaruh kawasan laut pasifik sehingga menerima energi matahari yang lebih luas sepanjang tahun. Hal tersebut menyebabkan

Indonesia sangat rentan dengan terjadinya iklim ekstrim dan gangguan cuaca. Iklim ekstrim memberikan dampak yang besar seperti timbulnya wabah penyakit, gangguan kesehatan, naiknya permukaan air laut, ketahanan pangan yang mengakibatkan menurunnya produksi pertanian atau gagal panen, banjir, tanah longsor, dan kerawanan sosial lainnya. Informasi dan pengetahuan khususnya dalam faktor cuaca dan iklim tentang perilaku nilai-nilai ekstrim sangat

dibutuhkan untuk mengetahui perilaku nilai ekstrim agar produksi tanaman pangan bisa dimaksimalkan dan kerugian bisa diminimalkan.

Penanganan dampak kerugian produksi pertanian akibat iklim dengan memodelkan nilai ekstrim dan menentukan return level (nilai maksimum) dalam periode waktu ulang tertentu, sehingga dapat menentukan waktu tanam yang sesuai.Metode yang digunakan pada penelitian sebelumnya untuk mengidentifikasi iklim ekstrim (curah hujan) y aitu Extreme Value Theory (EVT) dengan dua pendekatan Block Maxima (BM) yang mengikuti distribusi Generalized Extreme Value (GEV) dan Peaks Over Threshold (POT)yang mengikuti distribusi Generalized Pareto Distribution (GPD). Wahyudi [1] yang membandingkan dua pendekatan antara BM dan POT. Kesimpulan penelitian tersebut adalah menggunakan pendekatan POT memberikan hasil yang lebih sesuai dibandingkan dengan BM untuk curah hujan di Ngawi. Perhitungan return level menggunakan parameter dari distribusi EVT yang dipilih. Oleh karena itu pendugaan parameter distribusi EVT harus tepat, sehingga diperoleh nilai return level yang tepat pula. Syarat utama dalam menduga parameter distribusi EVT adalah urutan data ekstrim harus independen. Namun dalam kasus nyata syarat ini seringkali terlanggar, yaitu urutan data dependen, sehingga akan mengurangi kesahihan kesimpulan. Eastoe [2] melakukan penelitian untuk data ozon, dalam penelitiannya dinyatakan bahwa terdapat banyak model statistik dan metode inferensia yang ada digunakan untuk data ekstrim yang univariat dan independen, namun pada beberapa aplikasi juga terdapat data yang dependen. Berdasarkan uraian tersebut maka penelitimenggunakan Extreme Value Theory untuk mengatasi data curah hujan ekstrim yang dependen di daerah sentra produksi padi di Jawa Timur. Salah satu pendekatan yang digunakan untuk menduga parameter distribusi EVT dengan data ekstrim dependen adalah memodelkan parameter sesuai dengan pola data menurut runtun waktunya.

Terdapat tiga permasalahan dalam penelitian ini yaitu bagaimana karakteristik curah hujan ekstrim di Jawa Timur khususnya Kabupaten Banyuwangi, Bojonegoro, Jember, Ngawi, dan Lamongan dengan pendekatan POT, bagaimana bentuk model pa rameter POT-GPD pada data ekstrim dependen curah hujan di lima kabupaten tersebut, dan bererapa nilai return level curah hujan ekstrim di lima kabupaten tersebut.

Analisis Data Ekstrim Dependen (Non Stationary) Pada Kasus Curah Hujan Ekstrim Di Jawa

Timur Dengan Pendekatan Peaks Over Threshold.

Yuli Kurniawati dan Sutikno Jurusan Statistika,FMIPA, ITS, Institut Teknologi Sepuluh Nopember (ITS)

Jl. Arief Rahman Hakim, Surabaya 60111 Indonesia e-mail : [email protected]

I

2

II. TINJAUAN PUSTAKA

A. Metode Peaks Over Threshold (POT) Metode POT merupakan salah satu metode dari EVT

untuk mengidentifikasi nilai ekstrim selain metode BM . Metode POT adalah metode EVT yang mengidentifikasi nilai ekstrim dengan menggunakan patokan atau disebut threshold (u). Data yang melebihi patokan tersebut akan diidentifikasi sebagai nilai ekstrim. Gambar 1 menunjukkan pemilihan nilai ekstrim dengan menggunakan nilai patokan (threshold). Gambar 1 menunjukkan pengamatan xi, i= 1, 2, 3, 4,....n akan menjadi data nilai ekstrim pada metode POT. Apabila nilai threshold semakin tinggi maka nilai kelebihan (x-u) yang diperoleh dari POT ini akan mengikuti GPD.

Gambar 1 Pengambilan Sampel Data dalam Metode POT

GPD merupakan aplikasi teorema Picklands, Dalkema dan Denhaan Gilli dan Kellezi [3] yang menyatakan semakin besar nilai threshold (u) maka fungsi distribusi akan mendekati GPD yang memiliki Probability Density Function (PDF) sebagai berikut.

𝑓𝑓(𝑥𝑥) =

⎩⎪⎨

⎪⎧ 1𝜎𝜎 �1 +

𝜉𝜉𝑥𝑥𝜎𝜎 �

−1𝜉𝜉−1

, 𝜉𝜉 ≠ 0

1𝜎𝜎 exp �−

𝑥𝑥𝜎𝜎� , 𝜉𝜉 = 0

(1)

Cumulative Distribution Function (CDF) dari GPD adalah sebagai berikut:

𝐹𝐹(𝑥𝑥) =

⎩⎪⎨

⎪⎧1 − �1 +

𝜉𝜉𝑥𝑥𝜎𝜎 �

−1𝜉𝜉

, 0 ≤ 𝑥𝑥 < −𝜎𝜎𝜉𝜉 jika𝜉𝜉 < 0

0 ≤ 𝑥𝑥 < ∞ jika𝜉𝜉 > 0

1 − exp �−𝑥𝑥𝜎𝜎� , 0 ≤ 𝑥𝑥 < ∞ jika𝜉𝜉 = 0

� (2)

Dimana 𝜎𝜎= parameter skala 𝜉𝜉= parameter bentuk (shape) / tail index

Generalized pareto distribution juga dibedakan menjadi tiga tipe jika dilihat dari nilai parameter bentuk (𝜉𝜉) yaitu: 1. Tipe 1 berdistribusi Eksponensial jika nilai 𝜉𝜉=0 2. Tipe 2 berdistribusi Pareto jika nilai 𝜉𝜉>0 3. Tipe 3 berdistribusi Pareto tipe 2 /Beta jika nilai 𝜉𝜉<0

Penentuan nilai thresholdterdapat beberapa cara diantaranya adalah Mean Residual Life Plot (MRLP), metode persentase, dan Sample Mean Excess Function (SMEF). Metode penentuan nilai threshold yang lebih mudah digunakan dan sering digunakan adalah metode persentase dan dalam penelitian ini digunakan metode presentase untuk penentuan nilai threshold. Penentuan nilai threshold dengan menggunakan metode persentase didapatkan dengan cara sebagai berikut. 1. Mengurutkan data dari yang terbesar hingga yang

terkecil. 2. Menghitung jumlah data ekstrim

𝑘𝑘 = 10% x 𝑛𝑛

dimana 𝑘𝑘= jumlah data ekstrim 𝑛𝑛= jumlah data.

3. Menentukan nilai threshold (u) yaitu 𝑢𝑢 = 𝑘𝑘 + 1. Berdasarkan Coles-Davidson [4] menyatakan bahwa

data yang berada dalam threshold yaitu sekitar 10% dari keseluruhan data yang sudah diurutkan dari yang paling besar sampai terkecil. Hal ini dikarenakan berdasarkan kajian analisis sensitivitas, menyatakan bahwa apabila ada sedikit pergeseran terhadap threshold maka taksiran parameter yang dihasilkan tidak akan terpengaruh oleh pergeseran tersebut.

B. Uji Kesesuaian Distribusi Pemeriksaan distribusi dilakukan dengan uji

Kolmogorov-Smirnov. Pengujian ini dilakukan dengan menyesuaikan fungsi distribusi empiris (berdasarkan sampel) )(xFn dengan distribusi teoritis tertentu (sesuai yang dihipotesiskan) )(0 xF . Uji Hipotesis

H0: )(xFn = F0 (x) (Data mengikuti distribusi teoritis F0(x))

H1: )(xFn ≠ F0 (x) (Data tidak mengikuti distribusi teoritis F0(x))

Statistik Uji: )()( 0 xFxFSupD n

x−= (3)

Daerah Kritis : Tolak H0 jika Dhitung> Dα C. Return Level

Return level merupakan nilai maksimum pada periode yang akan datang. Nilai return level memberikan informasi yang sangat penting dalam aplikasi di bidang asuransi, ekonomi atau financial, dan juga di bidang pertanian. Pada bidang pertanian nilai return level dari data curah hujan akan memberikan informasi waktu tanam yang sesuai untuk varietas tanaman pangan tertentu. Sehingga ketika curah hujan ekstrim dapat ditentukan varietas tanaman apa yang sesuai dan adaptif terhadap keadaan yang ekstrim tersebut. Selain itu informasi nilai return level data curah hujan juga dapat digunakan untuk mengantisipasi adanya banjir. Persamaan return level untuk GPD adalah sebagai berikut.

𝑥𝑥𝑚𝑚 = 𝑢𝑢 +𝜎𝜎�𝜉𝜉�(𝑚𝑚𝜁𝜁𝑢𝑢𝜃𝜃)𝜉𝜉 − 1� (4)

D. Extreme of Dependent Banyak teori yang diterapkan sejauh ini mengasumsikan

independensi data ekstrim, hal ini terjadi ketika melihat nilai-nilai ekstrim yang cenderung konstan selama beberapa pengamatan atau stasioner Gilleland dan Katz [5]. Hal tersebut memungkinkan terdapat parameter dengan variasi fungsi waktu untuk data series yang nonstationer.

Model untuk skala parameter GPD adalah sebagai berikut :

log𝜎𝜎(𝑡𝑡) =𝜎𝜎0 + 𝜎𝜎1𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡𝑁𝑁 � − 𝜎𝜎2𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡𝑁𝑁 � (5)

E. Kriterian Pemilihan Model yang Sesuai Root Mean Square Error (RMSE) dalam penilitian ini

digunakan sebagai kriteria dalam pemilihan metode yang sesuai. RMSE berguna untuk mengetahui akar kesalahan rata-rata kuadrat dari setiap metode.

3

RMSE = �1𝑡𝑡 �

(𝑥𝑥𝑠𝑠 − 𝑥𝑥�𝑠𝑠)2𝑡𝑡

𝑠𝑠=1

(6)

III. METODOLOGI PENELITIAN

A. Sumber Data Data yang digunakan dalam penelitian ini adalah data

sekunder, yang diperoleh dari Badan Meteorologi Klimatologi dan Geofisika (BMKG). Data ini berupa data curah hujan harian di beberapa pos pengukuran di Kabupaten Jember (Pos Ajung), Bojonegoro (Pos Cawak), Lamongan (Pos Sukodadi), Banyuwangi (Pos Maelang), dan Ngawi (Pos Mantingan) pada periode 1981 sampai 2010.

B. Variabel Penelitian Variabel yang digunakan dalam penelitian ini adalah

data curah hujan harian. Data dibagi menjadi dua periode yaitu periode pertama dari tahun 1981 hingga tahun 1990 dan periode kedua dari tahun 1990 hingga 2010. Alasan data curah hujan dibagi menjadi dua periode yaitu untuk mengidentifikasi adanya perubahan iklim dan untuk mengetahui perbedaan nilai return level pada periode satu dan periode dua. Data curah hujan tersebut akan dibagi menjadi empat triwulan. Triwulan yang pertama meliputi bulan Desember, Januari, dan Februari (DJF),triwulan kedua meliputi bulan Maret, April, dan Mei (MAM), Juni, Juli, dan Agustus (JJA) mewakili triwulan ketiga. Bulan September, Oktober, dan November (SON) mewakili triwulan ke empat.

C. Langkah Analisis Langkah-langkah analisis data yang dilakukan dalam

penelitian ini ialah sebagai berikut : 1. a. Mendeskripsikan data curah hujan dengan statistika

deskriptif dan pola sebaran curah hujan mengikuti pola monsun atau tidak. b. Mengidentifikasi data curah hujan di masing masing kabupaten untuk mengetahui adanya data berekor gemuk dan nilai ekstrim dengan histogram dan normality plot. c. Mengidentifikasi data curah hujan stasioner atau tidak.

2. a. Pengambilan data ekstrim denganmetodePOT b. Mengidentifikasi data curah hujan pada masing- masing kabupaten membentuk pola siklik atau linier tren. c. Melakukan transformasi data yang sesuai dengan data curah hujan. d. Mencari nilai estimasi parameter distribusi GPD untuk data yang diasumsikan independen (non model) dan data yang dependen atau memiliki suatu pola tertentu (model). e. Melakukan fitting distribusi untuk data ekstrim yang berada diatas nilai threshold. f. Pemeriksaan kesesuaian distribusi dengan uji Kolmogorov-Smirnov. g. Memodelkan parameter distribusi GPD dari nilai estimasi parameter model.

3. a. Data curah hujan ekstrim pada masing-masing pos (semua triwulan DJF,MAM, JJA, SON dijadikan satu) yang telah didapatkan dengan menggunakan metode Peaks Over Threshold (POT) dipisahkan dari data curah hujan lainnya. b. Menentukan periode ulangnya.

IV. HASIL DAN PEMBAHASAN Pada hasil dan pembahasan ini akan dibahas lebih mendalam mengenai identifikasi dependensi, hasil estimasi parameter, dan model POT-GPD dari Pos Ajung.

A. Gambaran Umum Curah Hujan di Lima Pos Pengamatan

Gambaran umum curah hujan di lima pos pengamatan akan disajikan dalam bentuk deskripsi umum, diagram batang yang menunjukkan pola curah hujan dimasing-masing kabupaten, histogram dan normality probability plot nya untuk mengidentifikasi adanya heavy tail, dan time series plot untuk mengetahui data stationary atau non- stationary.

Statistika deskripstif dari curah hujan kelima pos pengamatan disajikan pada Tabel1. Tabel1 menunjukkan bahwa rata-rata curah hujan harian selama 30 tahun dari kelima pos pengamatan memiliki nilai yang hampir sama. Pos Ajung memiliki rata rata curah hujan harian tertinggi dibandingkan ke empat pos lainnya yaitu sebesar 6.144 mm/hari. Rata rata curah hujan harian di Pos Cawak, Pos Sukodadi, Pos Maelang, dan Pos Mantingan berturut-turut adalah 4.320 mm/hari; 4.225 mm/hari; 4.314 mm/hari; dan 5.847 mm/hari. Tabel 1Nilai Rata-Rata, Standar Deviasi, Minimumdan Maksimum Curah

Hujan di Lima Pos Pengamatan Pos Pengamatan

Rata-rata (mm/hari) Std Dev Min (mm/hari) Max (mm/hari)

Ajung 6.144 14.343 0 157 Cawak Sukodadi Maelang Mantingan

4.320 4.225 4.314 5.847

12.456 11.385 12.685 14.846

0 0 0 0

165 140 213 221

Pola curah hujan di lima pos pengamatan dapat diidentifikasi dengan menggunakan diagram batang dari nilai rata-rata per bulan curah hujan harian di masing-masing pos pengamatan pada tahun 1981 sampai dengan tahun 2010.

12

9

6

3

0

Desem

ber

Nopem

ber

Oktobe

r

Septe

mber

Agustus

Juli

Juni

Mei

Apri l

Mare

t

Febr

uari

J anu

ari

8

6

4

2

0

Desem

ber

Nope

mber

Oktob

er

Septe

mber

Agus

tus

Juli

JuniMei

Apri l

Maret

Febr

uari

Janu

ari

8

6

4

2

0

Desem

ber

Nope

mber

Oktob

er

Septe

mber

Agus

tusJuli

JuniMei

Apri l

Maret

Febr

uari

Janu

ar i

12

9

6

3

0

10.0

7.5

5.0

2.5

0.0

Jember

Bulan

Bojonegoro Lamongan

Bany uwangi Ngaw i

Pola Curah Hujan Harian Jember, Bojonegoro, Lamongan, Banyuwangi, Ngawi

Gambar 2Pola Curah Hujan Harian di Lima Pos Pengamatan.

Kelima pos pengamatan memiliki pola curah hujan harian

monsun (berbentuk U) dengan satu puncak musim hujan. Identifikasi adanya data berekor dan data ekstrim pada

curah hujan harian di lima kabupaten ini dapat diketahui melalui histogram dan normallity probability plot.

154

132

110886644220

8000

6000

4000

2000

0

154

132

110886644220

8000

6000

4000

2000

0

140

120

100806040200

8000

6000

4000

2000

0

196

168

140

1128456280

8000

6000

4000

2000

0

210

180

150

1209060300

8000

6000

4000

2000

0

Jember

Frek

uens

i

Bojonegoro Lamongan

Banyuwangi Ngawi

Histogram Jember, Bojonegoro, Lamongan, Banyuwangi, Ngawi

Gambar 3 Histogram Curah Hujan Harian di Lima Pos

Pengamatan.

4

35302520151050

160

140

120

100

80

60

40

20

0

Hari

jem

ber

Gambar 3 mengindikasikan adanya nilai ekstrim atau data berekor (heavy tail) pada data curah hujan harian di lima pos pengamatan pada tahun 1981 hingga tahun 2010. Hal tersebut dapat diketahui melalui ekor distribusi yang turun secara lambat.

160800

99.99

99

90

50

10

1

0.01

160800

99.99

99

90

50

10

1

0.01

160800

99.99

99

90

50

10

1

0.01

2001000

99.99

99

90

50

10

1

0.01

2001000

99.99

99

90

50

10

1

0.01

Jember

Pers

en

Bojonegoro Lamongan

Banyuwangi Ngawi

Normality Probability Plot Jember, Bojonegoro, Lamongan, Banyuwangi, Ngaw

Gambar 4Normality Probability Plot Curah Hujan Harian di

Lima Pos Pengamatan. Gambar 4 m enunjukkan jika curah hujan harian di lima

pos pengamatan tidak mengikuti distribusi normal karena sebagian besar sebaran titik–titik tidak mengikuti garis linier. Hasil histogram dan normality probability plotmenunjukkan bahwa pola data curah hujan di lima pos pengamatan tidak berdistribusi normal dan adanya pola data berekor.

Pada penelitian ini perlu diketahui dependensi dan kestationeran dari data curah hujan pada masing-masing pos pengamatan. Indikasi adanya dependensi data dapat diketahui apabila data curah hujan harian membentuk suatu pola tertentu. Dependensi yang dimaksudkan disini adalah terjadi dependensi antar waktu pada setiap triwulan sehingga pada triwulan yang sama pada periode selanjutnya cenderung memiliki pola yang sama.

Gambar 5Pola Data Curah Hujan Harian di Pos Ajung.

Pola data curah hujan harian di Pos Ajung membentuk pola siklik. Hal tersebut menunjukkan banwa data curah hujan harian mengalami dependensi antar waktu. Data curah hujan harian di keempat pos lainnya juga membentuk pola siklik. Pola siklik yang terbentuk pada data curah hujan harian di lima pos pengamatan dipengaruhi dengan waktu tertentu (𝑡𝑡).

Data ekstrim pada masing masing triwulan baik untuk periode 1 maupun 2 da ri Pos Ajung juga membentuk pola siklik seperti yang terlihat pada Gambar 6.

100

75

50

165110551

150

100

50

120

80

40

120

80

40

100

50

0

165110551

80

40

0

165110551

150

100

50

150

100

50

djf1 djf2 mam1

mam2 jja1 jja2

son1 son2

Time Series Plot Data Ekstrim Jember

Gambar 6 Pola Data Ekstrim Curah Hujan Harian Pos Ajung

berdasarkan Waktu Gambar 7 merupakan plot Autocorrelation (ACF) dari

data ekstrim pada Pos Ajung. Apabila nilai ACF dari suatu data kurang dari batas bawah atau lebih dari batas atas fungsi autocorrelation, maka dikatakan bahwa data bersifat dependen. plot Autocorrelation (ACF) dari data ekstrim pada Pos Ajung. Apabila nilai ACF dari suatu data kurang dari batas bawah atau lebih dari batas atas fungsi autocorrelation, maka dikatakan bahwa data bersifat dependen.Gambar 7 menunjukkan terdapat beberapa nilai ACF pada beberapa triwulan melebihi batas atas, hal ini berarti data ekstrim memiliki korelasi yang kuat dengan nilai ekstrim satu tahun sebelumnya atau sesudahnya. Data ekstrim curah hujan harian di Pos Ajung bersifat dependen. Begitu juga dengan data ekstrim di empat pos lainnya juga terdapat beberapa lag yang keluar dari batas atas dan bawahnya

Gambar 7 Plot Autocorrelation Data Ekstrim Curah Hujan Harian Pos Ajung berdasarkan Waktu

Kestationeran data masing-masing pos pengamatan dapat diketahui melalui time series plot dari data curah hujan harian. Gambar 8 merupakan time series plot untuk data curah hujan harian di Pos Ajung.

222018161412108642

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for djf1(with 5% significance limits for the autocorrelations)

222018161412108642

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for jja2(with 5% significance limits for the autocorrelations)

222018161412108642

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for mam1(with 5% significance limits for the autocorrelations)

454035302520151051

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for mam2(with 5% significance limits for the autocorrelations)

1110987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for jja1(with 5% significance limits for the autocorrelations)

222018161412108642

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for jja2(with 5% significance limits for the autocorrelations)

10987654321

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for son1(with 5% significance limits for the autocorrelations)

2624222018161412108642

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

Lag

Aut

ocor

rela

tion

Autocorrelation Function for son2(with 5% significance limits for the autocorrelations)

5

9864876876726576548043843288219210961

160

140

120

100

80

60

40

20

0

Pengamatan

Jem

ber

Time Series Plot

Gambar 8Time Series PlotData Curah Hujan Harian di Pos

Ajung Gambar 8 menunjukkan bahwa data curah hujan harian di

Pos Ajung tidak stationer. Time series plot dari keempat pos pengamatan yang lainnya juga menunjukkan jika data tidak stationer dan tidak random.

B. Penentuan Nilai Threshold Model parameter distribusi GPD dapat terbentuk setelah

mengetahui nilai estimasi parameter dari masing-masing triwulan. Penentukan nilai threshold untuk masing-masing triwulan dengan menggunakan metode presentase. Langkah selanjutnya setelah mendapatkan nilai threshold yaitu melakukan transformasi data. Transformasi yang digunakan pada data curah hujan harian di lima pos pengamatan ini yaitu tansformasi trigonometri karena data membentuk pola siklik. Data yang telah ditransformasi selanjutnya di analisis dengan menggunakan pendekatan metode POT sehingga mendapatkan nilai estimasi parameter untuk masing-masing triwulan baik untuk periode 1 m aupun periode 2. Nilai threshold pada Pos Ajung disajikan pada Tabel 2.

Tabel 2Nilai Threshold Pos Ajung Triwulan Karakteristik Periode 1 Periode 2

DJF 𝑁𝑁 Threshold(𝑢𝑢) Jumlah pengamatan diatas threshold(𝑛𝑛𝑢𝑢)

902 32 83

1805 38 172

MAM 𝑁𝑁 Threshold(𝑢𝑢) Jumlah pengamatan diatas threshold(𝑛𝑛𝑢𝑢)

920 23 92

1840 22 183

JJA 𝑁𝑁 Threshold(𝑢𝑢) Jumlah pengamatan diatas threshold(𝑛𝑛𝑢𝑢)

920 2 87

1840 0

140 SON 𝑁𝑁

Threshold(𝑢𝑢) Jumlah pengamatan diatas threshold(𝑛𝑛𝑢𝑢)

910 16 90

1820 16 170

C. Estimasi Parameter GPD Setelah mengetahui nilai threshold nya yaitu melakukan

transformasi trigonometri pada data curah hujan pada masing-masing triwulan baik pada periode 1 maupun periode 2 untuk mengetahui nilai estimasi parameter skala dan nilai estimasi parameter bentuk pada masing-masing kabupaten. Berikut ini pada Tabel 3 merupakan nilai estimasi parameter skala dan parameter bentuk pada pos Ajung (kabupaten Jember)

Tabel 3 Nilai Estimasi Parameter GPD di Pos Ajung Triwulan Parameter Periode 1 Periode 2 DJF 𝜎𝜎�0

𝜎𝜎�1 𝜎𝜎�2 𝜉𝜉0 𝜉𝜉1 𝜉𝜉2

Tipe Distribusi

18.91 0.010 5.790

-0.030 -0.002 -0.130

Beta

22.230 0.110 6.650

-0.026 -0.002 -0.126

Beta MAM 𝜎𝜎�0

𝜎𝜎�1 𝜎𝜎�2 𝜉𝜉0 𝜉𝜉1 𝜉𝜉2

Tipe Distribusi

19.450 0.124 7.220

-0.013 -0.002 -0.113

Beta

15.050 0.070 4.120 0.056

-0.001 -0.044 Pareto

Triwulan Parameter Periode 1 Periode 2 JJA 𝜎𝜎�0

𝜎𝜎�1 𝜎𝜎�2 𝜉𝜉0 𝜉𝜉1 𝜉𝜉2

Tipe Distribusi

8.951 0.046 2.680 0.179 0.001 0.079

Pareto

12.677 0.073 4.262 0.090

-0.0003 -0.001 Pareto

SON 𝜎𝜎�0 𝜎𝜎�1 𝜎𝜎�2 𝜉𝜉0 𝜉𝜉1 𝜉𝜉2

Tipe Distribusi

14.099 0.072 4.212 0.089

-0.0002 -0.010 Pareto

18.466 0.097 5.634 0.033

-0.001 -0.060 Pareto

Nilai estimasi parameter skala pada masing-masing triwulan baik pada periode 1 maupun periode 2 di masing-masing pos pengamatan dipergunakan untuk membentuk model parameter POT-GPD seperti pada persamaan 5. Nilai estimasi parameter bentuk dan skala nantinya juga dipergunakan untuk menghitung nilai return level untuk masing-masing pos pengamatan.

D. Uji Kolmogorov Smirnov Uji kesesuaian distribusi dilakukan terlebih dahulu untuk

mengetahui data sudah mengikuti distribusi generalized pareto atau tidak.

Tabel 4Hasil Uji Kolmogorov-Smirnovdi Lima Pos Pengamatan Kabupaten Triwulan Dhitung Dtabel

Jember

DJF(1) (2)

0.116 0103

0.149 0.104

MAM (1) (2)

0.117 0.066

0.142 0.101

JJA (1) (2)

0.101 0.097

0.146 0.115

SON (1) (2)

0.119 0.053

0.143 0.104

Bojonegoro

DJF (1) (2)

0.145 0.074

0.148 0.103

MAM (1) (2)

0.143 0.082

0.144 0.100

JJA (1) (2)

0.180 0.067

0.194 0.127

SON (1) (2)

0.091 0.098

0.144 0.100

Lamongan

DJF (1) (2)

0.070 0.071

0.148 0.101

MAM (1) (2)

0.113 0.099

0.143 0.103

JJA (1) (2)

0.123 0.076

0.147 0.125

SON (1) (2)

0.139 0.080

0.145 0.101

Banyuwangi

DJF (1) (2)

0.058 0.047

0.144 0.103

MAM (1) (2)

0.078 0.041

0.143 0.102

JJA (1) (2)

0.176 0.110

0.209 0.147

SON (1) (2)

0.208 0.091

0.212 0.131

Ngawi

DJF (1) (2)

0.093 0.104

0.145 0.104

MAM (1) (2)

0.118 0.097

0.142 0.102

JJA (1) (2)

0.063 0.124

0.148 0.128

SON (1) (2)

0.063 0.066

0.145 0.104

Tabel 4 m enunjukkan jika semua nilai Dhitung<Dtabel sehingga dapat disimpulkan jika seluruh data curah hujan pada semua triwulan baik pada periode 1 maupun periode 2 di lima pos pengamatan telah mengikuti distribusi GPD.

E. Model Parameter Distribusi GPD Curah Hujan Ekstrim di Lima Kabupaten

Data curah hujan harian di Pos Ajung telah mengikuti distribusi GPD sehingga bisa dilakukan pemodelan distribusi GPD. Nilai estimasi parameter pada Tabel 3 disubstitusikanke dalam persamaan umum 5, sehingga didapatkan model parameter sebagai berikut. 1. Model parameter triwulan DJF Periode 1 Pos Ajung :

6

log𝜎𝜎�(𝑡𝑡) = 18.91 + 0.0996 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 5.79𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

2. Model parameter triwulan DJF Periode 2 Pos Ajung :

log𝜎𝜎�(𝑡𝑡) = 22.23 + 0.11 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 6.65 𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

3. Model parameter triwulan MAM Periode 1 Pos Ajung :

log𝜎𝜎�(𝑡𝑡) = 19.45 + 0.124 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 7.22 𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

4. Model parameter triwulan MAM Periode 2 Pos Ajung :

log𝜎𝜎�(𝑡𝑡) = 15.05 + 0.07 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 4.12 𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

5. Model parameter triwulan JJA Periode 1 Pos Ajung :

log𝜎𝜎�(𝑡𝑡) = 8.951 + 0.046 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 2.68 𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

6. Model parameter triwulan JJA Periode 2 Pos Ajung :

log𝜎𝜎�(𝑡𝑡) = 12.677 + 0.073 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 4.26 𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

7. Model parameter triwulan SON Periode 1 Pos Ajung :

log𝜎𝜎�(𝑡𝑡) = 14.1 + 0.07 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 4.21 𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

8. Model parameter triwulan SON Periode 2 Pos Ajung :

log𝜎𝜎�(𝑡𝑡) = 18.47 + 0.1 𝑐𝑐𝑐𝑐𝑐𝑐 �2𝜋𝜋𝑡𝑡

365.25� − 5.6 𝑐𝑐𝑠𝑠𝑛𝑛 �

2𝜋𝜋𝑡𝑡365.25

F. Return Level Nilai estimasi curah hujan pada periode waktu tertentu

dapat diketahui melalui nilai return level. Nilai estimasi return level untuk masing-masing kabupaten periode 1 dan 2 diperoleh dengan mensubstitusikan nilai estimasi parameter yang diperoleh menggunakan metode MLE kedalam persamaan 4. Nilai return level yang diduga dalam penelitian ini sampai dengan 3 pe riode mendatang. Nilai estimasi return level dari model estimasi parameter GPD disajikan pada Tabel 5.

Tabel 5 Nilai Return Level Model Parameter POT-GPD di Lima Pos Pengamatan

Triwulan m Jember Bojonegoro Lamongan Banyuwangi Ngawi DJF 1 DJF 2

1 2 3 1 2 3

106.72 113.43 118.14 127.29 135.31 140.96

100.71 104.50 107.02 103.79 109.86 114.08

89.17 95.07 99.27 87.67 93.06 96.83

115.12 124.56 131.47 111.07 119.53 125.66

132.89 143.69 151.49 120.10 128.48 134.43

MAM1 MAM2

1 2 3 1 2 3

104.18 111.62 116.87 94.89

102.74 108.42

90.78 95.35 98.39

109.18 115.77 120.25

82.66 89.53 94.45 86.68 93.59 98.54

103.66 115.63 124.65 118.53 128.21 135.10

111.20 120.85 127.82 253.09 277.46 295.05

JJA 1 JJA 2

1 2 3 1 2 3

58.72 66.75 72.82 61.37 68.89 74.39

56.55 63.29 68.13 22.60 25.36 27.36

51.23 61.44 69.63

114.46 158.83 199.90

86..00 119.90 151.28 34.61 41.85 47.61

80.71 94.65

105.60 54.77 62.07 67.45

SON 1 SON 2

1 2 3 1 2 3

89.48 98.01

104.25 99.69

108.36 114.58

57.72 62.03 65.01

209.08 247.87 278.75

75.60 83.52 89.27

107.18 116.06 122.30

48.39 53.96 57.90 86.94 96.55

103.40

84.72 91.56 96.43

100.17 108.63 114.68

Nilai RMSE return level yang didapatkan dari model

parameter POT-GPD tersebut dibandingkan nilai RMSE return leveldari data yang diasumsikan independen (non model) untuk mengetahui metode mana yang lebih sesuai.Hasil perbandingan RMSE disajikan pada Tabel 6 berikut. Tabel 6 Nilai RMSE Return Level Model Parameter POT dan Non Model

Kabupaten Triwulan Non Model Model Jember DJF

MAM JJA SON

4.97 44.35 91.75 53.80

6.21 38.37 50.16 52.96

Kabupaten Triwulan Non Model Model Bojonegoro DJF

MAM JJA SON

8.55 38.36 66.58 44.14

4.29 42.03 52.16 38.30

Lamongan DJF

MAM JJA SON

10.49 56.30

143.70 83.46

11.35 43.93 50.09 57.09

Banyuwangi DJF MAM JJA SON

32.36 107.15 90.68 63.90

24.84 67.93

111.56 44.03

Ngawi DJF MAM JJA SON

46.85 71.26

168.22 73.59

31.32 51.65 72.30 42.14

Tabel 6 menunjukkan bahwa nilai RMSE yang dihasilkan dari nilai return level model parameter POT-GPD lebih kecil dibandingkan nilai return level non model. Hal ini berarti nilai dugaan yang dihasilkan model parameter lebih mendekati nilai aktual, sehingga dalam perhitungan return level lebih baik menggunakan nilai estimasi parameter model POT-GPD.

V. KESIMPULAN DAN SARAN Identifikasi curah hujan ekstrim di lima pos pengamatan

menunjukkan bahwa semua pola curah hujan di lima kabupaten m embentuk pola monsun dengan satu puncak musim hujan. Lima pos pengamatan memiliki data yang berdistibusi tidak normal dan memiliki pola data berekor. Data curah hujan ekstrim di lima pos pengamatan tidak random (dependen) karena semua data mengikuti suatu pola tertentu dan tidak stationer.

Estimasi parameter non model menghasilkan suatu nilai estimasi parameter skala dan parameter bentuk tanpa terbentuk suatu model khusus. Estimasi parameter model menghasilkan nilai estimasi parameter skala yang digunakan untuk membentuk model POT-GPD, Kabupaten Jember, Bojonegoro, Lamongan, Banyuwangi, dan Ngawi setiap triwulan baik pada periode 1 maupun periode 2 memiliki model POT-GPD masing-masing

Hasil return levelmodel parameter POT-GPD lebih mendekati nilai yang sesungguhnya daripada nilai return level tidak menggunakan model.

Saran yang diberikan untuk penelitian selanjutnya berdasarkan penelitian yang telah dilakukan adalah perlu dilakukan uji dependensi data yang lebih dalam. Sebaiknya menggunakan variabel lain yang mempengaruhi curah hujan sehingga penentuan nilai return level bisa lebih akurat benar-benar mendekati nilai sesungguhnya.

DAFTAR PUSTAKA [1] Wahyudi (2012). Identifikasi Curah Hujan Ekstrrem di Kabupaten

Ngawi Menggunakan Generalized Extreme Value dan Generalized Pareto Distribution. Surabaya: Statistika, Institut Teknologi Sepuluh Nopember.

[2] Eastoe, E. (2007). Statistical models for dependent and non-stationary extreme events.

[3] Gilli,M., Kellezi,E. (2003). An Application of Extreme Value Theory for Measuring Risk. Elsevier Science.

[4] Coles, S. (2001). An Introduction to Statistical Modelling of Extreme Values. London: Spinger-Verlag.

[5] Gilleland, E. and Katz,R.W. (2006). Analyzing Seasonal to Interannual Extreme Weather and Climate Variability with the Extremes Toolkit (extRemes). 18th Conference on Climate Variability and C hange, 86th American Meteorological Society (AMS) Annual Meeting. Atlanta.