ngunandiko-ngunandiko berwacana: Agustus 2016

Ngunandiko.108

Statistik

Pada kesempatan ini, Ngunandiko ingin membahas dan merenungkan tentang “Statistik”. Sebagaimana diketahui statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu.

Untuk lebih memahami arti “statistik” berikut ini adalah beberapa pengertian statistik yang dikemukakan oleh para ahli sbb :

James J Asher (1929 –.... ); menurutnya statistik itu berkaitan dengan suatu langkah atau metode dalam menarik sebuah kesimpulan dari hasil uji coba.
Sutrisno Hadi (1931 – 2008) ; mengemukakan statistik adalah salah satu cara untuk mengolah data & menarik sebuah kesimpulan serta keputusan yang logis dari sebuah pengolahan data.
KOMPASIANA.com ; statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu.

Statistik yang diperoleh dengan cara/prosedure yang benar dan disimpulkan dengan cara yang benar akan dapat menghasikan kekuatan yang dahsyat layaknya kekuatan “bom atom”. Namun jika diperoleh dan disimpulkan dengan cara salah akan menghasilkan hal-hal yang menyesatkan.

Sebagai contoh dapat dilihat tabel (daftar) statistik penduduk kota XXX di Eropa (bukan sebenarnya) berikut ini :

KOMPOSISI ANAK PENDUDUK KOTA XXX
Anak	Putih (Eropa)		Kuning (China)		Coklat/hitam (India etc)		Total Anak Penduduk Kota XXX

Ke-1	500.002			1.201	3.003		505.206
Ke-2	481.000			2.201	3.001		486.202
Ke-3	51			2.188	2.980		5.219
Ke-4	0.00			2.186	2.810		4.996
Ke-5	0.00			1.282	79		2.261
Ke-6	0.00			2.099	0.00		2.099
Ke-7	0.00			2.087	0.00		2.087
Ke-8	0.00			317	0.00		317

Total	981.053	97.30%	15.461	1.50%	11.873	1.20%	1.008.387	100%

Penduduk kota XXX tersebut terdiri dari berbagai keturunan yaitu Eropa (berkulit putih), China (berkulit kuning) dan India dll (berkulit coklat/hitam). Komposisi anak penduduk kota XXX terlihat seperti pada tabel diatas.

Dari tabel statistik tersebut diatas, orang dapat membuat sedikitnya dua kesimpulan sebagai berikut :

Pertama bahwa penduduk kota XXX , jika memiliki anak maka :

anak ke-1 s/d ke-3 anaknya berkulit putih, kuning, dan berkulit coklat/hitam ;
anak ke-4 dan ke-5 berkulit kuning dan berkulit coklat/hitam ; dan
anak ke-6, ke-7 dan seterusnya berkulit kuning ;

Kedua bahwa penduduk kota XXX – apakah mereka orang Eropa, orang China ataupun India dll – , jika memiliki anak ke-6, ke-7 atau lebih, maka anaknya berkulit kuning (anaknya menjadi China).

Sudah barang tentu kesimpulan pertama adalah benar dan kesimpulan kedua dapat menyesatkan atau tidak benar.

Dalam praktek disamping kesimpulan tidak benar semacam itu, kita juga seringkali salah (silap) dalam mengambil dan menyusun data statistik yang berakibat menyesatkan. Baik sengaja maupun tidak.

Seperti diketahui para penguasa sejak dahulu kala dalam menjalankan pemerintahan selalu ingin tahu fakta keadaan wilayah-wilayah yang mereka kuasai seperti :

jumlah penduduk ;
luas wilayah ;
luas sawah dan kebun;
banyaknya kilang atau pabrik ;
jumlah kota-kota ; dan
lain-lain.

Untuk mendapatkan fakta keadaan wilayah tersebut – fakta itu disebut pula sebagai data – penguasa mempekerjakan orang-orang berkeliling seluruh negeri (wilayah) – dari kota ke kota, dari desa ke desa, dan seterusnya – dan melaporkan temuan mereka. Penguasa tersebut sering dikenal sebagai kepala negara (head of state), maka fakta yang dikumpulkan oleh orang-orang itu – setelah disusun – dikenal sebagai statistik.

Pada masa sekarang orang tertarik untuk melihat lebih banyak fakta daripada pada masa yang lalu, kini orang juga ingin mengetahui misalnya:

jumlah panen padi setiap tahun :
jumlah produksi minyak mentah setiap tahun ;
jumlah produksi mobil setiap tahun ; dan lain-lain.

Bahkan selain itu orang juga ingin mengetahui misalnya berapa banyak kemenangan/kekalahan kesebelasan sepak bola negaranya dan lain-lain semacam itu.

Selain para penguasa – seperti telah dikemukakan diatas – banyak perusahaan mengumpulkan data yang dipakainya membantu kelancaran produksi, pemasaran dll. Misalnya perusahaan “Pakaian Jadi (Garment)” ingin tahu data tentang :

produksi bahan baku pakaian jadi (tekstil) setiap tahun;
produksi pakain jadi setiap tahun;
warna dan ukuran produk (pakaian jadi) yang terjual setiap tahun;
di daerah mana saja produk pakaian jadi terjual dll.

Sudah barang tentu untuk pengumpulan data itu – supaya data yang diperoleh sesuai dengan kebutuhan – diperlukan orang yang terlatih dalam berbagai pengetahuan khususnya matematika. Orang seperti itu disebut ahli statistik (statisticians).

Dalam mejalankan pekerjaannya itu, ahli statistik sering menggunakan komputer dan peralatan pembantu lainnya. Seperti diketahui komputer dapat melakukan banyak perhitungan dalam beberapa detik, yang jika perhitungan itu dilakukan secara manual bisa bertahun-tahun.

Dimuka telah dikemukakan bahwa data statistik yang benar akan memberi hasil yang memiliki kekuatan. Hal itu akan terjadi jika data itu selain benar (nyata), juga disusun menurut cara/prosedure yang benar, dan disimpulkan secara benar pula.

Sebelum membahas lebih lanjut, mungkin ada baiknya jika kita menjelaskan terlebih dahulu pengertian “statistika” dan “statistik”. Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data dan informasi hasil penerapan algoritma. Algoritma disini adalah prosedure langkah demi langkah untuk penghitungan.

Statistika menggunakan kumpulan data untuk :

mendeskripsikan lebih lanjut data dan kemudian menarik suatu kesimpulan, ini dinamakan statistika deskriptif (Descriptive Statistics).
melakukan generalisasi data meramal atau menduga dan kemudian menarik suatu kesimpulan, ini dinamakan statistika inferensia (Inferential Statistics).

Dalam kesempatan ini ingin dikemukakan secara singkat beberapa pengertian yang sering digunakan dalam “statistika” maupun “statistik” antara lain sbb :

Rata-rata (average)

Ada beberapa pengertian "rata-rata (average)" dalam statistik, tetapi yang paling umum kita temui adalah : (1) rata-rata (mean); (2) kecenderungan (mode) ; dan (3) angka tengah (median).

Rata-rata (mean).

Rata-rata (mean) atau arithmetic average adalah jumlah dari semua angka dalam suatu seri dibagi dengan banyaknya angka dalam seri tersebut. Misalnya satu seri data sbb :

9, 12, 7, 6, 5, 8, 14, 14, 15,

(9 + 12 + 7 + 6 + 5 + 8 + 14 + 14 + 15 ) = 90

Rata-rata (mean) : 90 : 9 = 10

Kecenderungan (mode).

Kecenderungan (mode) adalah nilai (angka) yang muncul paling sering di satu seri data, misalnya :

13, 13, 13, 13, 14, 14, 16, 18, 21, 22

Mode : 13, 13, 13, 13

Angka tengah (median).

Angka tengah (median) adalah nilai tengah urutan satu seri data, misalnya:

13, 13, 13, 13, 14, 14, 16, 18, 21, 22

Median : 14, 14

DATA	FREQUENSI
13	3
14	2
16	1
18	1
21	1
22	1

Median = 14

Berikut ini adalah contoh menghitung median yang lebih kompleks, misalnya ada 26 orang mahasiswa terpilih sebagai sampel dalam penelitian kesehatan di sebuah universitas.

Mahasiswa yang terpilih tersebut diukur berat badannya. Hasil pengukuran berat badan disajikan dalam bentuk data berkelompok seperti di bawah ini.

Berat badan (kg)	Frekuensi (X)
40 – 50	3
51 – 55	2
56 – 60	4
61 – 65	5
66 – 70	6
71 – 75	4
76 – 80	1
81 – 85	1

Selanjutnya terlebih dahulu dibuat tabel untuk menghitung frekuensi kumulatif data. Tabelnya adalah sebagai berikut.

Berat badan (kg)	Frekuensi (X)	Frekuensi kwantitatif (X)
45 – 50	3	3
51 – 55	2	5
56 – 60	4	9
61 - 65	5	14
66 – 70	6	20
71 – 75	4	24
76 – 80	1	25
81 – 85	1	26

Jumlah data adalah 26, sehingga mediannya terletak di antara data ke 13 dan 14. Data ke-13 dan 14 ini berada pada kelas interval ke-4 (61 – 65). Kelas interval ke-4 ini kita sebut kelas median. median berat badan mahasiswa adalah 64,5 kg.

Sampel, populasi, dan probabilitas

sample adalah sebagai bagian kecil dari anggota populasi yang diambil menurut prosedur tertentu yang dapat mewakili populasinya ;

Mengenai sampel ini dapat di gambarkan sbb : misalnya kita memiliki kotak yang berisi 1.000 (seribu) bola lampu listrik. Beberapa lampu mungkin tidak bekerja (tidak menyala). Kita bisa menguji semua lampu itu, tapi pengujian itu akan memakan waktu yang lama. Namun kita dapat mengujinya dengan beberapa beberapa lampu saja, katakanlah 50 (lima pulah) lampu. Dengan menguji setiap lampu dari 50 lampu tersebut, dan jika semua 50 lampu itu baik (menyala), maka kita dapat mengatakan bahwa semua lampu (1.000 bola lampu) adalah baik. Sedangkan 50 lampu yang kita uji tersebut disebut sebagai sampel.

Tapi kita mungkin salah, karena cara kita memilih sampel yang tidak benar. Misalnya jika kita memilih lampu di bagian atas kotak saja, di mana disitu berada lampu yang baik, sementara lampu yang buruk berada di bagian bawah kotak. Maka hasilnya akan menjadi tidak benar.

Adapun cara yang tepat dalam memilih lampu – sampel – adalah dari berbagai tempat di kotak itu – satu lampu di sini, satu lampu di sana, dan seterusnya, sampai kita memiliki 50. Ketika kita memilih lampu sedemikian rupa seperti itu, maka kita telah memilih lampu – sampel – secara acak (random sampling).

populasi adalah sekumpulan data yang mempunyai karakteristik yang sama dan menjadi objek penggambaran (inferensi). Dalam contoh diatas adalah 1,000 lampu listrik ;

Probabilitas adalah suatu nilai yang digunakan untuk mengukur tingkat terjadinya suatu kejadian yang acak. Kata probabilitas itu sendiri sering disebut dengan peluang atau kemungkinan. Probabilitas secara umum merupakan peluang bahwa sesuatu akan terjadi.

Sensus, responden, jajak pendapat, dan hitung cepat.

Sensus adalah sebuah proses mendapatkan informasi deskriptif tentang anggota sebuah populasi (tidak hanya populasi manusia) misalnya sensus Penduduk, sensus Pertanian dan sensus Ekonomi.

Responden atau subjek penelitia adalah pihak-pihak yang dijadikan sampel dalam sebuah penelitian. Subjek penelitian juga membahas karakteristik subyek yang digunakan dalam penelitian, termasuk penjelasan mengena populasi sampel dan teknik sampling (acak/non acak) yang digunakan. Responden dapat terdiri dari tiga level, yaitu :

(1) Mikro merupakan level terkecil dari subjek penelitian, dan hanya berupa individu .

(2) Meso merupakan level subjek penelitian dengan jumlah anggota lebih banyak, misal keluarga dan kelompok.

(3) Makro merupakan level subjek penelitian dengan anggota yang sangat banyak, sepert masyarakat atau komunitas luas (lihat Wikipedia).

Peran responden (subjek penelitian) adalah memberikan tanggapan dan informasi terkait data yang dibutuhkan oleh peneliti, serta memberikan masukan kepada peneliti, baik secara langsung maupun tidak langsung

Jajak pendapat (pooling) adala survei mengenai pendapat dan atau pandangan yang dilakukan dengan menggunakan teknik sampel. Jajak pendapat biasanya dirancang untuk mendapatkan gambaran tentang pandangan-pandangan suatu populasi dengan mengajukan serangkaian pertanyaan kepada beberapa orang yang dianggap mewakili populasi (subjek penelitian atau responden) dan kemudian menyimpulkan jawaban-jawabannya sebagai gambaran dari kelompok yang lebih luas ;

hitung cepat ( quick count) adalah sebuah metode verifikasi hasil pemilihan (PEMILU, PILKADA) yang dilakukan dengan cara menghitung persentase hasil pemilihan di tempat pemungutan suara (TPS) yang dijadikan sampel.

Guna lebih memahami, maka berikut ini adalah contoh atau gambaran Hitung Cepat (Quick Count) hasil pemilihan di Daerah/Kecamatan YYY sebagai berikut :

DAERAH/KECAMATAN YYY
TPS	JMLH PEMILIH	JMLH SAMPEL	MEMILIH A		MEMILIH B		SAMPEL TIDAK SAH
TPS	JMLH PEMILIH	JMLH SAMPEL	jmlh	%	Jmlh	%	jmlh	%
No.1	2482	50	40	82.6	9	17.4	1	-
No.2	2502	50	39	76.6	10	23.4	1	-
No.3	2991	50	38	76.0	12	14.0	0	-
No.4	2305	50	35	70.0	15	30.0	0	-
No.5	2505	50	44	91.7	4	8.3	2	-
No.6	2008	50	46	92.0	4	8.0	0	-
No.7	1988	50	34	68.0	15	32.0	1	-
No.8	3215	50	19	43.2	25	56.8	6	-
	19996	400	305	76.00	84	21.00	11	3.00

Catatan : Jumlah dan cara mengambil sampel telah dilakukan menurut kaidah-kaidah STATISTIKA.

Hasil Hitung Cepat tersebut kemudian dapat dicocokkan dengan Real Count KPU (Komisi Pemilihan Umum), yaitu hasil hitung di TPS (Tempat Pemungutan Suasra) yang dilakukan oleh KPU. Hitung Cepat yang dilakukan dengan benar hasilnya tak jauh berbeda dengan hasil Real Count KPU, margin error tidak lebih dari dua persen ( 2 %).

Berbeda dengan survei perilaku pemilih, survei pra-pilkada atau survei exit poll, “Hitung Cepat” memberikan gambaran dan akurasi yang lebih tinggi, karena hitung cepat menghitung hasil pemilu langsung dari TPS target, bukan berdasarkan persepsi atau pengakuan responden . Selain itu, dalam hitung cepat kita bisa menerapkan teknik sampling probabilitas sehingga hasilnya jauh lebih akurat dan dapat mencerminkan populasi secara tepat.

Berikut ini adalah contoh hasil hitung cepat ( quick count ) PILKADA yang diselenggarakan di Provinsi Kepulauan Riau pada tanggal 9 Desember 2015 yang lalu berdasarkan penghitungan cepat (quick count) lembaga Charta Politika (data yang masuk hingga 97,33 persen. Margin error tidak lebih dari satu persen) sbb :

Muhammad Sani dan Nurdin Basirun (Sanur) memperoleh: 53,4 persen Suara
Soerya Respationo dan Ansar Ahmad (SAH) memperoleh: 46,6 persen Suara

Sedangkan Real Count KPU berdasarkan Hasil Hitung TPS Provinsi Kepulauan Riau. Data Masuk : 100% (3.181 dari 3.181 TPS), dan hasilnya adalah sbb :

Drs. H. Muhammad Sani dan Dr. Nurdin Basirun S.Sos,M.Si. Perolehan : 347462 Suara (53,24%)
Dr. H. M. Soerya Respationo, SH. MH dan H. Ansar Ahmad, SE. MM. Perolehan : 305117 Suara (46,76%).

Tampak bahwa hasil hitung cepat ( quick count ) dan hasil real count KPU lebih kurang sama, sehingga hasil tersebut dianggap sah dan benar.

Sir Francis Galton

Sebagai penutup bahasan dan renungan ini berikut ini disampaikan beberapa ahli yang memiliki andil signifikan dalam mengembangkan statistika antara lain : Sir Francis Galton (1822 - 1911), Inggris ; Karl Pearson (1857 - 1937), Inggris ; Sir Ronald Fisher (1890 - 1962), Inggris ; Pafnuty Chebyshev (1871 - 1894), Rusia ; Aleksander Lyaponov (1857 -1918), Rusia ; dan Isaac Newton (1843 - 1907), Inggris.

Demikianlah bahasan dan renungan singkat tentang “Statitistik”, semoga bermanfaat.

It is always the case with the best work, that it is misrepresented, and disparaged at first, for it takes a curiously long time for new ideas to become current, and the older men who ought to be capable of taking them in freely, will not do so through prejudice (Sir Francis-Galton)

ngunandiko-ngunandiko berwacana

Minggu, 28 Agustus 2016

STATISTIK

Mengenai Saya

Arsip Blog