Upload
harryndra-aufandi-rahardyan
View
97
Download
4
Embed Size (px)
Citation preview
HG2 1. Maha Willy Chandra2. Okti Giffari3. Laras Ragil K. P.4. Harryndra Aufandi Rahardyan5. Ilham Rahman Arifin6. Ginasesharita Hardiyanti7. Nadira Apriliani
Kesalahan-Kesalahan di Statistik
Lingkup Bahasan Kesalahan di Statistik Kesalahan di Sampling Kesalahan Analisis Data Penggunaan Kata-kata Multi Tafsir Kesimpulan yang Salah Kesalahan Visualisasi
Statistik sangat bermanfaat bagi kita untuk mengetahui atau memprediksi suatu kejadian sehingga dapat menjadi pedoman bagi kita dalam mengambil keputusan.
Tahapan ketika bekerja dengan data:1. Mengumpulka2. Mengorganisasi3. Menganalisis4. Mempresentasikan 5. Menyimpulkan data
Namun terkadang ditemukan kesalahan dalam statistik, umumnya kesalah ini disebabkan oleh:
1. Kekeliruan2. Ketidaktahuan3. Kekurangtelitian dalam bekerja
Namun tidak bisa dipungkiri bahwa beberapa kesalahan terjadi karena kesengajaan demi kepentingan individu, keleompok, dll. Oleh karena itu harus teliti dan hati-hati sebelum menerima data tersebut.
Kesalahan di Sampling
Jenis kesalahan dalam statistik secara umum dikelompokkan dalam:
1. Kesalahan pemilihan metode sampling. 2. Kesalahan dalam pengolahan dan analisis
data. 3. Kesalahan dalam pemilihan kata ketika
memberikan pernyataan untuk menafsirkan data.
4. Kesalahan dalam meyimpulkan suatu hasil statistik.
5. Kesalahan dalam memvisualisasikan data.
Di statistik, kesalahan yang sering terjadi ketika sampling adalah metode pemilihan sampel dan jumlah sampel. Untuk menanggapi kesalahan ini maka sebelum kita menerima hasil atau kenyataan ini, kita perlu bersikap kritis.
Sampel yang baik adalah yang representatif. Sampel yang buruk adalah sampel bias.
Jumlah sampel yang baik adalah yang mencukupi untuk menggambarkan sifat dan karakter populasi yang diwakilinya.
Contoh 1 kesalahan sampling Pernyataan statistik“Lebih dari 70% mahasiswa UI suka mengendarai sepeda di
lingkungan kampus.” Sebelum menerima pernyataan tersebut, perlu adanya sikap berpikir kritis. Analisis beberapa pertanyaan tersebut:
Apakah surveinya dilakukan pada semua mahasiswa UI atau sebagian mahasiswa saja? Jika survei dilakukan untuk semua mahasiswa UI, maka data tersebut akurat (di sini kita asumsikan kuisioner yang digunakan sudah baik).
Jika sebagian mahasiswa saja yang disurvei, mahasiswa seperti apa yang dijadikan sampel? Sampel yang baik adalah yang representatif. Sampel yang buruk adalah sampel bias.
Berapa jumlah mahasiswa yang dijadikan sampel? Tidak ada aturan jumlah sampel minimum. Jumlah sampel yang baik adalah yang mencukupi untuk menggambarkan sifat dan karakter populasi yang diwakilinya.
Contoh 2 kesalahan sampling
Sebuah perusahaan permen karet mengeluarkan pernyataan: “ Empat dari lima dokter gigi merekomendasikan permen karet bebas gula untuk pasien yang suka mengunyah permen.”
Analisis: Berapa jumlah dokter gigi yang disurvei? Seandainya hanya 5 atau mungkin 10 dokter gigi yang disurvei, fakta ini belum dapat diterima. Sangat mungkin hasilnya akan berbeda jika ada 100 dokter yang disurvei.
Contoh 3 kesalahan sampling
Sebuah produsen sepak bola mengklaim, bolanya (bola A) lebih baik dari pada bola B (produk perusahaan saingannya), karena setelah diuji dengan menendangnya, bola A dapat meluncur lebih cepat dan jauh dibandingkan dengan bola B.
Analisis Klaim ini terlalu ceroboh, sebab hanya diuji untuk satu bola saja. Disamping itu kecepatan meluncur dan jangkauan luncur bola dipengaruhi oleh banyak faktor, seperti kekasaran permukaan lapangan, arah angin, apakah tendangan untuk kedua bola identik, dll. Sehingga agar datanya akurat perlu dilakukan eksperimen yang berulang, agar diperoleh data statistik yang representatif.
Kesalahan Analisis Data
Analisis nilai rata-rata
Sebuah perusahaan mengeluarkan pernyataan: “Gaji rata-rata karyawan di perusahaan kami adalah lebih dari 3 juta per bulan.” Dalam suatu pernyataan kita harus kritis. Dan perlu ditanyakan:
1. Bagaimana pengolahan datanya, apakah sudah benar atau ada ketidaktelitian dalam perhitungannya?
2. Apakah yang dimaksud dengan rata-rata di sini? Apakah mean, median, atau mode?
3. Pada kasus ini kita tidak perlu mempermasalahkan metode samplingnya, sebab setiap perusahaan pasti mempunyai daftar gaji yang lengkap, sehingga data yang digunakan adalah populasi.
Jika dilakukan perhitungan untuk data di atas, diperoleh: nilai mean = 3,035 juta, median = 2 juta, dan mode = 2 juta.
Jadi pernyataan di atas telah menggunakan mean untuk menyatakan gaji rata-rata. Apakah nilai mean ini representatif untuk gaji karyawan? Jumlah karyawan adalah 21 dan mayoritas berkedudukan staf dengan gaji 2 juta. Nilai mean sangat sensitif dipengaruhi oleh gaji Direksi dan Manager yang ekstrim besar. Jika kita tinjau nilai median yang 2 juta, nilai inilah yang mewakili gaji kebanyakan karyawan.
Kesimpulannya, gaji rata-rata ini sebaiknya dinyatakan dengan median bukan mean.
Jabatan Jumlah karyawan Gaji (Rp.)/bulan
Direksi 2 10.000.000
Manager 4 5.000.000
Staf 10 2.000.000
Pembantu 5 750.000
Analisis nilai deviasi
Sebuah perusahaan A mengeluarkan pernyataan: “Layar LCD kami mempunyai waktu hidup 80.000 jam, lebih unggul dari pada layar LCD lainnya yang rata-rata hanya punya waktu hidup 75.000 jam.”
Sebagai konsumen yang baik kita tidak boleh langsung mempercayai pernyataan ini, dan langsung memutuskan berdasarkan pernyataan yang ada. Kita harus bersikap kritis, misalnya mempertanyakan bagaimana metode pengujian dan analisi datanya sehingga sampai mendapatkan data waktu hidup. Dan bagaimana dengan sebaran datanya?
Berfikir kritis untuk Contoh kasus seperti ini dapat lebih difokuskan pada sebaran datanya
Contoh Analisis nilai deviasi
Pada waktu kampanye politik sering diungkapkan berbagai macam hasil survei atau poling untuk tujuan mendapatkan simpati atau dukungan masa yang lebih banyak. Sebagai contoh, sebuah lembaga survei menampilkan grafik hasil surveinya untuk beberapa partai menjelang pemilu. Lembaga tersebut membuat pernyataan:
“Partai A akan memenangkan pemilu dengan suara 40%, sesuai dengan hasil survei terakhir ini.”
Kita perlu kristis dalam membaca hasil survei ini. Bagaimana dengan deviasi datanya. Seandainya survei mempunyai deviasi 2%, maka Partai A dapat mempunyai suara 38% - 42%, sedangkan Partai C mendapatkan suara 35% - 39%.
Secara statistik suara Partai A dan C tidak berbeda karena ada daerah data yang bertindih (overlap), sehingga ada kemungkinan Partai C yang menang.
Penggunaan kata-kata multi tafsir
Kita sering menjumpai kata-kata multi tafsir dalam pernyataan statistik
Pada umumnya kata-kata ini dipilih untuk tujuan propaganda atau iklan.
Contoh:Sebuah perusahaan mie instan menyatakan: “DEF adalah mie terlezat di Indonesia.” Analisis: kata terlezat sangat relatif. Rasa lezat tidak dapat didefinisikan dengan pasti karena mengandung unsur subyektif.
Ketika menjumpai kata-kata multi tafsir yang dikaitkan dengan data kuantitatif, kita harus hati-hati dan kritis. Pernyataan pada contoh 6 mungkin didukung dengan data yang benar, tetapi penyampaiannya dalam bentuk pernyataan mempunyai maksud propaganda menggiring opini masyarakat untuk maksud tertentu.
AnalisisSurvei yang dilakukan oleh perusahaan mie DEF dan melibatkan mie merek lainnya menunjukkan mie DEF yang paling disukai. Walaupun demikian selera/rasa lezat dari setiap orang bisa berbeda, demikian juga faktor lainnya yang mempengaruhi hasil survei misalnya penyajian, metode memasak, dll. belum dipertimbangkan.
Kesimpulan yang salah
Kesalahan dalam pengambilan kesimpulan ini dapat terjadi karena kekurangfahaman seseorang terhadap permasalahan atau mungkin disebabkan oleh kekurangan penalaran berlogika.
Contoh 1 pengambilan kesimpulan yang tidak tepat
Sebuah perusahaan desinfektan melakukan eksperimen, produknya mampu membunuh 5000 kuman di laboratorium hanya dalam waktu 5 detik. Kemudian ia mengeluarkan pernyataan: “Gunakanlah desinfektan A untuk mencegah flu.”
Kita perlu bersikap kritis terhadap pernyataan ini. Memang benar banyak kuman yang dapat dibunuh oleh desinfektan ini, tetapi apakah kuman flu yang ada disekitar kita termasuk yang diujicobakan di laboratorium?
Tidak semua kuman flu telah mereka uji, sehingga tidak boleh diambil kesimpulan yang bersifat umum.
Contoh 2 pengambilan kesimpulan yang tidak tepat
Sebuah perusahaan mengeluarkan pernyataan: “Handuk Q lebih berat dari pada handuk lainnya, sehingga dapat menyerap air lebih banyak.”
Berat handuk tidak ada kaitannya dengan kemampuan handuk menyerap air. Kemampuan serapan air ditentukan oleh absorbansi bahan handuk, bukan beratnya. Sebagai analogi: Batu lebih berat dari pada sepon, tetapi sepon mudah sekali menyerap air dibandingkan batu.
Kesalahan Visualisasi
Visualisasi dapat memberikan kesan positif atau negatif.
Perbedaan skala sumbu tegak pada suatu grafik akan mempengaruhi kesan yang terlihat pada gambar. Misalnya pada data yang sama grafik A memiliki skala 30-80 dan grafik B memiliki skala 50-54, maka perubahan sedikit akan terlihat lebih besar pada grafik B dibandingkan dengan grafik A.
Visualisasi dapat memberika kesan yang salah
Visualisasi dapat memberikan kesan terhadap hasil, bahkan bisa menyebabkan kesimpulan yang salah pada data.
Kesalahan yang dapat disebabkan oleh visualisasi data:1. Pemilihan skala
Kesan pola grafik yang sangat berbeda ini dapat menjerumuskan kita pada suatu kesimpulan yang salah, jika kurang cermat dan berhati-hati.
2. Visualisasi 2D atau 3D Kita harus berhati-hati dalam visualisasi 3D. Efek 3D indah dilihat tetapi dapat memberikan kesan yang salah. Grafik 2D memberikan visualisasi yang lebih akurat
3. Perbandingan bentuk Contohnya adalah visualisasi gambar bujur sangkar dan kubus. Gambar bujur sangkar akan menunjukkan perkembangan yang lebih sedikit dibandingkan dengan gambar kubus.
4. Kesalahan persentasi data Misalnya dalam penyajian grafik pie yang mana jumlah prosentase harus 100%, namun terkadang ada kesalahan dalam jumlah prosentase.
5. Keakuratan grafikSemakin banyak sampel data yang digunakan maka semakin akurat pula grafik yang terbentuk.
Kesimpulan Statistik sangat bermanfaat untuk
mempelajari dan memprediksi suatu masalah, namun terkadang di dalam setatistik terdapat beberapa masalah yang akan membuat data dalam statistik tidak akurat. Oleh karena itu kita harus teliti dan hati-hati sebelum menerima data atau fakta statistik.
MPKT Home Group 21. Maha Willy Chandra2. Okti Giffari3. Laras Ragil K. P.4. Harryndra Aufandi Rahardyan5. Ilham Rahman Arifin6. Ginasesharita Hardiyanti7. Nadira Apriliani
Survey Mahasiswa
Survey #1Survey Pertama meliputi
Waktu TidurWaktu BelajarAcara TV FavoritMakanan Favorit
Waktu TidurWaktu Tidur Frekuensi
5 Jam 16 Jam 57 Jam 1
Waktu tidur menggunakan Mean karena data berupa angka.
• Pusat kecondongan waktu tidur = 6 jam
Okti
Lara
s
Willy
Ilham
02468
Series 1
Series 1Axis Title
Waktu Belajar
Okti
Nadira
Lara
s
Harry
ndra
Will
yGin
a
Ilham
0
2
4
6
8
10
12
Series 1
Series 1
Axis Title
Waktu belajar menggunakan Mean karena data berupa angka.
• Pusat kecondongan waktu belajar = 7 jam
Waktu Belajar Frekuensi
4 Jam 15 Jam 16 Jam 17 Jam 18 Jam 1
10 Jam 2
Acara TV FavoritAcara TV Frekuen
siFilm 5
Talkshow 1Musik 1
Talkshow Musik Sinetron Film Berita0
1
2
3
4
5
6
Grafik Acara Tv Favorit
Jum
lah/o
rang
•Acara tv menggunakan mode karena data berupa item.
• Pusat kecondongan acara tv = film
Makanan Favorit
Makanan Favorite
Frekuensi
Sushi 2Nasi Goreng 3
Rendang 1Pizza 1
•Makanan favorite menggunakan mode karena data berupa item.
• Pusatkecondongan makanan favorite = nasigoreng
Sushi Nasi Goreng Pizza Rendang0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
Grafik Makanan Favorit
Jum
lah/o
rang
Survey #2Asal BapakIjazah BapakPekerjaan BapakBiaya Hidup perBulan
Asal BapakAsal Bapak Frekuensi
Surabaya 1Jakarta 1
Palembang 1Banjarnegar
a1
Madiun 1Medan 2
Palembang Jakarta Medan Banjarnegara Surabaya Madiun0
0.5
1
1.5
2
2.5
Grafik Asal Kelahiran Bapak
Jum
lah/o
rang
•Asal bapak menggunakan mode karena data berupa item
• Pusat kecondongan asal bapak = medan
Ijazah Bapak
S1 S2 D3 SMK0
0.5
1
1.5
2
2.5
3
3.5
Grafik Ijazah Bapak
Jum
lah/o
rang
Ijazah Bapak
Frekuensi
S1 3S2 1
SMK 2D3 1
•ijazah bapak menggunakan mode karena data berupa item
• Pusat kecondongan ijazah bapak = s1
Swasta Wiraswasta0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
Grafik Pekerjaan Bapak
Jum
lah/o
rang
Pekerjaan Bapak
Pekerjaan Bapak
Frekuensi
Pegawai Swasta
5
Wiraswasta 2
•Pekerjaan bapak menggunakan mode karena data berupa item
• Pusat kecondongan pekerjaan bapak = wiraswasta
Biaya hidup perbulan
Okti
Nadira
Lara
s
Harry
ndra
WillyGin
a
Ilham
0
1,500,000
Grafik Biaya Hidup per Bulan
Ru
pia
h
Biaya Hidup per Bulan
Frekuensi
1,5 jt 21 jt 3
900 ribu 1700 ribu 1
•Biaya hidup menggunakan mean karena data berup angka• Pusat kecondongan biaya hidup = 1 jt/bln
Survey #3Umur Berat BadanTinggi BadanUkuran Sepatu
Umur
1616.5
1717.5
1818.5
1919.5 Grafik Umur
Tah
un
Umur Frekuensi
17 tahun 118 tahun 519 tahun 1
•umur menggunakan mean karena data merupakan angka
• Pusat kecondongan umur = 18 tahun
Berat Badan
Berat Badan Frekuensi
43 kg 145 kg 152 kg 180 kg 188 kg 194 kg 1
114 kg 1
•Berat badan menggunakan mean karena data merupakan angka
• Pusat kecondongan berat badan = 73,7 kg
Okti Nadira Laras Harryndra Willy Gina Ilham0
20
40
60
80
100
120
Grafik Berat Badan
Kg
Tinggi BadanTinggi Badan
Frekuensi
156 cm 1160 cm 1164 cm 1165 cm 1173 cm 1175 cm 1180 cm 1
•tinggi badan menggunakan mean karena data merupakan angka
• Pusat kecondongan tinggi badan = 167,5 cm
Okti Nadira Laras Harryndra Willy Gina Ilham140
145
150
155
160
165
170
175
180
185
Grafik Tinggi Badan
Cm
Ukuran Sepatu
Ukuran Sepatu
Frekuensi
39 140 141 244 245 1
•ukuran sepatu menggunakan mean karena data merupakan angka
• Pusat kecondongan ukuran sepatu = 42
Okti Nadira Laras Harryndra Willy Gina Ilham36
38
40
42
44
46
Grafik Ukuran Sepatu
EU
R
Kesimpulan Ikatan antara data dan hasil survey
Tidak ada kaitan antara survey karena sangatlah berbeda antara karateristik gaya hidup, karateristik keluarga dan karateristik tubuh
Jenis Distribusi Dari data yang didapat bentuk dari distribusi berikut adalah distribusi
Frekuensi,dan karena data-data yang didapat diambil dari data sampel maka disebut juga distribusi Sampel
Penyebaran data untuk setiap seri data hasil survey Survey #1 :
Waktutidur = 2 jam Waktubelajar = 6 jam
Survey #2 ; Biayahidup = 800 rb/bln
Survey #3 : Beratbadan = 71 kg Tinggibadan = 24 cm Ukuransepatu = 6 Umur = 2 tahun
Kesimpulan Grafik Survey #1: karakteristik gaya hidup Grafikwaktutidur
Kesimpulan: berdasarkan grafik hasil survey dapat disimpulkan bahwa rata-rata waktu tidur seseorang sekitar 6 jam.
Grafikwaktubelajar Kesimpulan:
berdasarkan grafik hasil survey, kesimpulannya adalah waktu belajar seseorangber variasi. Waktu belajar yaitu antara 4 jam sampai dengan yang paling lama 10 jam.
Grafikmakananfavorit Kesimpulan:
berdasarkan grafik, kesimpulannya yaitu kebanyakan makanan favorit orang-orang adalah rending, sedangkan yang paling sedikit menjadi makanan favorit adalah pizza.
Grafikacara TV favorit Kesimpulan:
berdasarkan grafik diatas dapat disimpulkan bahwa acara TV yang menjadi terfavorit yaitu film. Sedangkan talkshow, sinetron dan berita tidak menjadi acara favorit.
Kesimpulan Grafik Survey #2: karakteristik Keluarga Grafik asal kelahiran bapak
Kesimpulan: berdasarkan grafik hasil survey, asal kelahiran bapak dari sample yang diambil bervariasi. Namun yang berasal dari Medan lebih banyak.
Grafik Pekerjaan bapak Kesimpulan:
berdasarkan grafik, kesimpulannya adalah pekerjaan bapak dari sample yang diambil kebanyakan adalah seorang pegawai swasta daripada wiraswasta
Grafik Ijazah bapak Kesimpulan:
dari grafik dapat disimpulkan bahwa rata rata ijazah terakhir bapak dari sample yang diambil. Kebanyakan adalah yang bergelar S1
Grafik biaya hidup perbulan Kesimpulan:
dari grafik hasil survey, kesimpulan dari biaya hidup seseorang perbulan bervariasi. Rata-rata sekitar 1 juta perbulan, sedangkan yang paling banyak biaya hidupnya yaitu 1.5 juta perbulan dan yang paling sedikit 700 ribu perbulan.
Kesimpulan Grafik Survey #3: karakteristik TubuhGrafik Berat badan
Kesimulan: dari grafik dibawah dapat disimpulkan bahwa berat badan bervariasai dari 40 kilogram sampai 110 kilogram
Grafik tinggi badanKesimpulan:
darigrafikhasil survey dapatdiketahuibahwatinggibadan yang menjadi sample bervariasi. Dari yang terpendek 155 cm sampaitertinggi 180 cm
Grafik ukuran sepatuKesimpulan:
dari data kesimpulannyaa dalah rata rata ukuran sepatud ari yang sample teliti adalah bervariasi dari ukuran 39 sampai dengan 45
Grafik umurKesimpulan:
dari data yang diambil kesimpulannya adalah bahwa sample yang kami ambil rata rata berumur 18 tahun.
Kesimpulan keseluruhan survey Kesimpulan survey 1
Berdasarkan data, kesimpulan terhadap karakteristik gaya hidup bahwa walaupun Waktu tidur seseorang rata rata 6 jam tetapi waktu belajarnya bervariasi. Namun kebanyakan dari mereka sama-sama memiliki acara tv favorit yaitu film, dan makanan favorit yaitu rendang
Kesimpulan survey 2 Berdasarkan grafik hasil data, kesimpulan pada
karakteristik keluarga yaitu grafik mengenai pekerjaan bapakdan ijazah bapak saling berhubungan dengan biaya hidup kita selama sebulan. Namu tidak memiliki hubungan dengan daerah asal bapak
Kesimpulan survey 3 Berdasarkan grafik hasil data, kesimpulan dari
karakteristik tubuh yaitu berat badan, tinggi badan, dan ukuran sepatu seseorangtidak berhubung andengan umur mereka.Banyak umur yang namun berbeda berat badannya atau tinggi badannya, karena pertumbuhan seseorang berbeda-beda.