Ngunandiko.108
Statistik
Pada kesempatan ini,
Ngunandiko ingin membahas dan merenungkan tentang “Statistik”. Sebagaimana
diketahui statistik adalah kumpulan data dalam bentuk angka maupun bukan
angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang
menggambarkan atau berkaitan dengan suatu masalah tertentu.
Untuk lebih memahami arti
“statistik” berikut ini adalah beberapa pengertian statistik yang dikemukakan
oleh para ahli sbb :
- James J Asher (1929 –.... ); menurutnya statistik itu berkaitan dengan suatu langkah atau metode dalam menarik sebuah kesimpulan dari hasil uji coba.
- Sutrisno Hadi (1931 – 2008) ; mengemukakan statistik adalah salah satu cara untuk mengolah data & menarik sebuah kesimpulan serta keputusan yang logis dari sebuah pengolahan data.
- KOMPASIANA.com ; statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu.
Statistik yang diperoleh dengan cara/prosedure yang benar dan disimpulkan dengan cara yang benar akan dapat menghasikan kekuatan yang dahsyat layaknya kekuatan “bom atom”. Namun jika diperoleh dan disimpulkan dengan cara salah akan menghasilkan hal-hal yang menyesatkan.
Sebagai contoh dapat dilihat tabel (daftar) statistik penduduk
kota XXX di Eropa (bukan sebenarnya) berikut ini :
KOMPOSISI
ANAK PENDUDUK KOTA XXX
|
||||||||
Anak
|
Putih (Eropa)
|
Kuning (China)
|
Coklat/hitam (India
etc)
|
Total Anak
Penduduk Kota XXX
|
||||
Ke-1
|
500.002
|
1.201
|
3.003
|
505.206
|
||||
Ke-2
|
481.000
|
2.201
|
3.001
|
486.202
|
||||
Ke-3
|
51
|
2.188
|
2.980
|
5.219
|
||||
Ke-4
|
0.00
|
2.186
|
2.810
|
4.996
|
||||
Ke-5
|
0.00
|
1.282
|
79
|
2.261
|
||||
Ke-6
|
0.00
|
2.099
|
0.00
|
2.099
|
||||
Ke-7
|
0.00
|
2.087
|
0.00
|
2.087
|
||||
Ke-8
|
0.00
|
317
|
0.00
|
317
|
||||
Total
|
981.053
|
97.30%
|
15.461
|
1.50%
|
11.873
|
1.20%
|
1.008.387
|
100%
|
Penduduk kota XXX tersebut
terdiri dari berbagai keturunan yaitu
Eropa (berkulit putih), China (berkulit kuning) dan India dll (berkulit
coklat/hitam). Komposisi anak penduduk kota XXX terlihat seperti pada tabel
diatas.
Dari tabel statistik tersebut
diatas, orang dapat membuat sedikitnya dua kesimpulan sebagai berikut :
Pertama bahwa penduduk kota XXX , jika memiliki anak maka :
- anak ke-1 s/d ke-3 anaknya berkulit putih, kuning, dan berkulit coklat/hitam ;
- anak ke-4 dan ke-5 berkulit kuning dan berkulit coklat/hitam ; dan
- anak ke-6, ke-7 dan seterusnya berkulit kuning ;
Kedua bahwa penduduk kota
XXX – apakah mereka orang Eropa, orang China ataupun India dll – , jika memiliki anak ke-6, ke-7 atau lebih, maka
anaknya berkulit kuning (anaknya menjadi China).
Sudah barang tentu
kesimpulan pertama adalah benar dan kesimpulan kedua dapat menyesatkan atau
tidak benar.
Dalam praktek disamping kesimpulan tidak benar semacam itu,
kita juga seringkali salah (silap) dalam mengambil dan menyusun data statistik
yang berakibat menyesatkan. Baik sengaja
maupun tidak.
Seperti diketahui para penguasa
sejak dahulu kala dalam menjalankan pemerintahan selalu ingin tahu fakta keadaan
wilayah-wilayah yang mereka kuasai seperti :
- jumlah penduduk ;
- luas wilayah ;
- luas sawah dan kebun;
- banyaknya kilang atau pabrik ;
- jumlah kota-kota ; dan
- lain-lain.
Pada masa sekarang orang
tertarik untuk melihat lebih banyak fakta daripada pada masa yang lalu, kini orang
juga ingin mengetahui misalnya:
- jumlah panen padi setiap tahun :
- jumlah produksi minyak mentah setiap tahun ;
- jumlah produksi mobil setiap tahun ; dan lain-lain.
Bahkan selain itu orang juga
ingin mengetahui misalnya berapa banyak kemenangan/kekalahan
kesebelasan sepak bola negaranya dan lain-lain semacam itu.
Selain para penguasa – seperti telah dikemukakan diatas – banyak perusahaan mengumpulkan data yang dipakainya
membantu kelancaran produksi, pemasaran dll. Misalnya perusahaan “Pakaian Jadi
(Garment)” ingin tahu data tentang :
- produksi bahan baku pakaian jadi (tekstil) setiap tahun;
- produksi pakain jadi setiap tahun;
- warna dan ukuran produk (pakaian jadi) yang terjual setiap tahun;
- di daerah mana saja produk pakaian jadi terjual dll.
Sudah barang tentu untuk
pengumpulan data itu – supaya data yang
diperoleh sesuai dengan kebutuhan – diperlukan orang yang terlatih dalam berbagai pengetahuan khususnya matematika.
Orang seperti itu disebut ahli statistik (statisticians).
Dalam mejalankan pekerjaannya
itu, ahli statistik sering menggunakan komputer dan peralatan pembantu lainnya.
Seperti diketahui komputer dapat melakukan banyak perhitungan dalam beberapa
detik, yang jika perhitungan itu dilakukan secara manual bisa bertahun-tahun.
Dimuka telah dikemukakan bahwa data statistik yang benar akan
memberi hasil yang memiliki kekuatan. Hal itu akan terjadi jika data itu selain
benar (nyata), juga disusun menurut cara/prosedure
yang benar, dan disimpulkan secara benar pula.
Sebelum membahas lebih lanjut, mungkin ada baiknya jika kita menjelaskan
terlebih dahulu pengertian “statistika” dan “statistik”. Statistika merupakan
ilmu yang berkenaan dengan data, sedang statistik adalah data dan informasi
hasil penerapan algoritma. Algoritma disini
adalah prosedure langkah demi langkah untuk penghitungan.
Statistika menggunakan kumpulan
data untuk :
- mendeskripsikan lebih lanjut data dan kemudian menarik suatu kesimpulan, ini dinamakan statistika deskriptif (Descriptive Statistics).
- melakukan generalisasi data meramal atau menduga dan kemudian menarik suatu kesimpulan, ini dinamakan statistika inferensia (Inferential Statistics).
Dalam kesempatan ini ingin dikemukakan secara singkat beberapa pengertian
yang sering digunakan dalam “statistika” maupun “statistik” antara lain sbb :
- Rata-rata (average)
- Rata-rata (mean).
Rata-rata (mean) atau arithmetic average adalah jumlah dari
semua angka dalam suatu seri dibagi dengan banyaknya angka dalam seri tersebut.
Misalnya satu seri data sbb :
9, 12, 7, 6, 5, 8, 14, 14, 15,
(9 +
12 + 7 + 6 + 5 + 8 +
14 + 14 + 15 ) = 90
Rata-rata (mean) : 90 : 9 = 10
- Kecenderungan (mode).
Kecenderungan (mode) adalah nilai (angka) yang muncul paling sering di
satu seri data, misalnya :
13, 13, 13, 13, 14, 14,
16, 18, 21, 22
Mode : 13, 13, 13, 13
- Angka tengah (median).
13, 13, 13, 13, 14, 14,
16, 18, 21, 22
Median : 14, 14
DATA
|
FREQUENSI
|
13
|
3
|
14
|
2
|
16
|
1
|
18
|
1
|
21
|
1
|
22
|
1
|
Median = 14
Berikut ini adalah contoh menghitung median yang lebih kompleks, misalnya ada 26 orang mahasiswa terpilih sebagai sampel dalam penelitian kesehatan di sebuah universitas.
Mahasiswa yang terpilih tersebut diukur berat
badannya. Hasil pengukuran berat badan disajikan dalam bentuk data berkelompok
seperti di bawah ini.
Berat badan
(kg)
|
Frekuensi
(X)
|
40 – 50
|
3
|
51 – 55
|
2
|
56 – 60
|
4
|
61 – 65
|
5
|
66 – 70
|
6
|
71 – 75
|
4
|
76 – 80
|
1
|
81 – 85
|
1
|
Selanjutnya terlebih dahulu dibuat tabel untuk
menghitung frekuensi kumulatif data. Tabelnya adalah sebagai berikut.
Berat badan
(kg)
|
Frekuensi
(X)
|
Frekuensi kwantitatif
(X)
|
45 – 50
|
3
|
3
|
51 – 55
|
2
|
5
|
56 – 60
|
4
|
9
|
61 - 65
|
5
|
14
|
66 – 70
|
6
|
20
|
71 – 75
|
4
|
24
|
76 – 80
|
1
|
25
|
81 – 85
|
1
|
26
|
Jumlah data adalah 26, sehingga mediannya
terletak di antara data ke 13 dan 14. Data ke-13 dan 14 ini berada pada kelas
interval ke-4 (61 – 65). Kelas interval ke-4 ini kita sebut kelas median.
median berat badan mahasiswa adalah 64,5
kg.
- Sampel, populasi, dan probabilitas
- sample adalah sebagai bagian kecil dari anggota populasi yang diambil menurut prosedur tertentu yang dapat mewakili populasinya ;
Mengenai sampel ini dapat
di gambarkan sbb : misalnya kita memiliki kotak yang berisi 1.000 (seribu) bola
lampu listrik. Beberapa lampu mungkin tidak bekerja (tidak menyala). Kita bisa
menguji semua lampu itu, tapi pengujian itu akan memakan waktu yang lama. Namun
kita dapat mengujinya dengan beberapa
beberapa lampu saja, katakanlah 50 (lima pulah) lampu. Dengan menguji setiap lampu dari 50 lampu tersebut, dan jika
semua 50 lampu itu baik (menyala), maka kita dapat mengatakan bahwa semua lampu
(1.000 bola lampu) adalah baik. Sedangkan 50 lampu yang kita uji tersebut
disebut sebagai sampel.
Tapi kita mungkin salah, karena
cara kita memilih sampel yang tidak
benar. Misalnya jika kita memilih lampu
di bagian atas kotak saja, di mana disitu berada lampu yang baik, sementara
lampu yang buruk berada di bagian bawah kotak. Maka hasilnya akan menjadi tidak
benar.
Adapun cara yang tepat dalam
memilih lampu – sampel – adalah dari
berbagai tempat di kotak itu – satu lampu
di sini, satu lampu di sana, dan seterusnya, sampai kita memiliki 50.
Ketika kita memilih lampu sedemikian rupa seperti itu, maka kita telah memilih lampu
– sampel – secara acak (random sampling).
- Probabilitas adalah suatu nilai yang digunakan untuk mengukur tingkat terjadinya suatu kejadian yang acak. Kata probabilitas itu sendiri sering disebut dengan peluang atau kemungkinan. Probabilitas secara umum merupakan peluang bahwa sesuatu akan terjadi.
- Sensus, responden, jajak pendapat, dan hitung cepat.
- Sensus adalah sebuah proses mendapatkan informasi deskriptif tentang anggota sebuah populasi (tidak hanya populasi manusia) misalnya sensus Penduduk, sensus Pertanian dan sensus Ekonomi.
- Responden atau subjek penelitia adalah pihak-pihak yang dijadikan sampel dalam sebuah penelitian. Subjek penelitian juga membahas karakteristik subyek yang digunakan dalam penelitian, termasuk penjelasan mengena populasi sampel dan teknik sampling (acak/non acak) yang digunakan. Responden dapat terdiri dari tiga level, yaitu :
(1) Mikro merupakan
level terkecil dari subjek penelitian, dan hanya berupa individu .
(2)
Meso merupakan
level subjek penelitian dengan jumlah anggota lebih banyak, misal keluarga dan kelompok.
(3)
Makro merupakan
level subjek penelitian dengan anggota yang sangat banyak, sepert masyarakat atau komunitas luas (lihat Wikipedia).
Peran responden (subjek
penelitian) adalah memberikan tanggapan dan informasi terkait
data yang dibutuhkan oleh peneliti, serta memberikan masukan kepada peneliti,
baik secara langsung maupun
tidak langsung
- Jajak pendapat (pooling) adala survei mengenai pendapat dan atau pandangan yang dilakukan dengan menggunakan teknik sampel. Jajak pendapat biasanya dirancang untuk mendapatkan gambaran tentang pandangan-pandangan suatu populasi dengan mengajukan serangkaian pertanyaan kepada beberapa orang yang dianggap mewakili populasi (subjek penelitian atau responden) dan kemudian menyimpulkan jawaban-jawabannya sebagai gambaran dari kelompok yang lebih luas ;
- hitung cepat ( quick count) adalah sebuah metode verifikasi hasil pemilihan (PEMILU, PILKADA) yang dilakukan dengan cara menghitung persentase hasil pemilihan di tempat pemungutan suara (TPS) yang dijadikan sampel.
Guna
lebih memahami, maka berikut ini adalah contoh atau gambaran Hitung Cepat (Quick Count) hasil pemilihan di
Daerah/Kecamatan YYY sebagai berikut :
DAERAH/KECAMATAN
YYY
|
||||||||
TPS
|
JMLH PEMILIH
|
JMLH SAMPEL
|
MEMILIH A
|
MEMILIH B
|
SAMPEL TIDAK SAH
|
|||
jmlh
|
%
|
Jmlh
|
%
|
jmlh
|
%
|
|||
No.1
|
2482
|
50
|
40
|
82.6
|
9
|
17.4
|
1
|
-
|
No.2
|
2502
|
50
|
39
|
76.6
|
10
|
23.4
|
1
|
-
|
No.3
|
2991
|
50
|
38
|
76.0
|
12
|
14.0
|
0
|
-
|
No.4
|
2305
|
50
|
35
|
70.0
|
15
|
30.0
|
0
|
-
|
No.5
|
2505
|
50
|
44
|
91.7
|
4
|
8.3
|
2
|
-
|
No.6
|
2008
|
50
|
46
|
92.0
|
4
|
8.0
|
0
|
-
|
No.7
|
1988
|
50
|
34
|
68.0
|
15
|
32.0
|
1
|
-
|
No.8
|
3215
|
50
|
19
|
43.2
|
25
|
56.8
|
6
|
-
|
19996
|
400
|
305
|
76.00
|
84
|
21.00
|
11
|
3.00
|
|
Catatan : Jumlah dan cara mengambil sampel telah dilakukan menurut
kaidah-kaidah STATISTIKA.
Hasil
Hitung Cepat tersebut kemudian dapat dicocokkan dengan Real Count KPU (Komisi
Pemilihan Umum), yaitu hasil hitung di TPS (Tempat Pemungutan Suasra) yang
dilakukan oleh KPU. Hitung Cepat yang dilakukan dengan benar hasilnya tak jauh
berbeda dengan hasil Real Count KPU, margin
error tidak lebih dari dua persen ( 2 %).
Berbeda dengan survei perilaku pemilih, survei pra-pilkada
atau survei exit poll, “Hitung
Cepat” memberikan gambaran dan akurasi yang lebih tinggi, karena hitung cepat
menghitung hasil pemilu langsung dari TPS target, bukan berdasarkan persepsi
atau pengakuan responden . Selain itu, dalam hitung cepat kita bisa menerapkan teknik sampling probabilitas sehingga hasilnya jauh lebih
akurat dan dapat mencerminkan populasi secara tepat.
Berikut ini adalah contoh
hasil hitung cepat ( quick count ) PILKADA
yang diselenggarakan di Provinsi Kepulauan Riau pada tanggal 9 Desember 2015 yang
lalu berdasarkan penghitungan cepat (quick
count) lembaga Charta Politika (data yang masuk hingga 97,33 persen. Margin
error tidak lebih dari satu persen) sbb :
- Muhammad Sani dan Nurdin Basirun (Sanur) memperoleh: 53,4 persen Suara
- Soerya Respationo dan Ansar Ahmad (SAH) memperoleh: 46,6 persen Suara
Sedangkan
Real Count KPU berdasarkan Hasil Hitung TPS
Provinsi Kepulauan Riau. Data Masuk : 100% (3.181 dari 3.181 TPS), dan hasilnya
adalah sbb :
- Drs. H. Muhammad Sani dan Dr. Nurdin Basirun S.Sos,M.Si. Perolehan : 347462 Suara (53,24%)
- Dr. H. M. Soerya Respationo, SH. MH dan H. Ansar Ahmad, SE. MM. Perolehan : 305117 Suara (46,76%).
Tampak
bahwa hasil hitung cepat ( quick count ) dan hasil
real count KPU lebih kurang sama, sehingga hasil
tersebut dianggap sah dan benar.
Sir Francis Galton |
Demikianlah bahasan dan renungan singkat tentang “Statitistik”, semoga bermanfaat.
*
It
is always the case with the best work, that it is misrepresented, and
disparaged at first, for it takes a curiously long time for new ideas to become
current, and the older men who ought to be capable of taking them in freely,
will not do so through prejudice (Sir Francis-Galton)
*