BAB I
PENDAHULUAN
Hampir di
setiap bidang, baik pemerintahan, pendidikan, perekonomian, perindustrian,
perdagangan, perusahaan, ataupun lainnya, setiap pejabat atau setidak-tidaknya
pimpinan, sudah pernah, sedang atau akan menghadapi persoalan yang antara lain
dinyatakan oleh angka-angka. Dari kumulan angka-angka ini ia berusaha membuat
kesimpulan yang dianggap atau diharapkan cukup beralasan memberikan gambaran
atau penjelasan mengenai persoalan itu. Salah satu usaha ke arah ini, yang
telah dilakukan secara bertahun-tahun, ialah menyusun atau menyajikan
angka-angka tersebut di dalam bentuk sebuah daftar atau tabel. Orang
mengatakan, bahwa itu adalah statistik. Memang, pada umumnya masyarakat
menafsirkan statistik tiada lain daripada tabel atau daftar angka tentang
sesuatu hal atau kegiatan yang terdapat di kantor-kantor pemerintah, di
jawatan-jawatan, di perusahaan-perusahaan, perindustrian, dan lain sebagainya.
Sering pula daftar atau tabel tersebut disertai dengan gambar-gambar, yang
biasa disebut diagram atau grafik, untuk dapat menjelaskan lagi persoalan atau
kegiatan yang sedang dibahas. Karena inilah pula, orang mendapat pengertian
statistik, yakni laporan atau lukisan tentang suatu hal dalam bentuk
diagram-diagram, grafik-grafik, gambar-gambar, berbentuk lingkaran, tumpukan
gambar mata uang, deretan gambar manusia dan lain-lain.
BAB II
PEMBAHASAN
- Pengertian Statistika
Statistika
adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan bahan-bahan
atau keterangan, pengolahan serta penganalisisannya, penarikan kesimpulan serta
pembuatan keputusan yang beralasan berdasarkan penganalisisan yang dilakukan[1].
Statistika
adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan fakta,
pengolahan serta penganalisisannya, penarikan kesimpulan serta pembuatan
kesimpulan yang cukup beralasan berdasarkan fakta dan penganalisisan yang
dilakukan[2].
Para ahli
matematika mengembngkan statistika, diatas teori peluang, sebagai alat untuk
membantu manusia, secara matematis, memecahakan berbagai persoalan yang
dihadapi. Oleh karena itu, statistika tidak dapat dipisahkan dari teori
peluang dan merupakan bagian dari matematika.
Statistika
yang telah dikembangkan secara matematis kemudian digunakan di berbagai bidang
untuk membantu memecahkan berbgai persoalan yang ditemukan di masing-masing
bidang. Keragaman permasalahan yang ditemukan pada berbagai bidang juga telah
mendorong para ahli metematika (statistika matematik) untuk
mengembangkan berbagai teknik statistika yang sesuai dengan kondisi
permasalahannya. Sungguh, suatu konsep statistika dapat muncul ke dalam
sejumlah teknik statistka karena perbedaan asumsi mengenai permasalahan yang
hendak dipecahkan. Suatu teknik statistika akan menghasilkan suatu ukuran
deskriptif tentang suatu peubah (variabel) atau hubungan antara dua atau
sejumlah peubah.
Dalam
memecahkan suatu masalah, karena alasan tertentu, kita seringkali tidak
memiliki data dari seluruh anggota populasi yang hendak difahami. Alih-alih,
kita biasanya hanya memiliki data dari sebagian anggota populasi yang kemudian
disebut sampel. Oleh karena itu, para ahli matematika juga mengembangkan
rumusan-rumusan yang dapat membantu kita dalam menarik sampel sehingga data
yang ada di tangan dapat mewakili keadaan populasinya. Dengan kata lain,
statistika juga membicarakan cara-cara pengumpulan data, terutama mengenai
penarikan sampel.
Data dari
sampel yang diperoleh kemudian dianalisis dengan menggunakkan teknik tertentu
sesuai dengan permasalahan dan jenis datanya. Ukuran-ukuran statistik hasil
analisis tersebut lalu digunakan untuk melekukan inferensi tentang
persoalan yang dikaji pada populasi mana sampel diambil. Oleh karena itu, para
ahli juga telah melengkapi teknik analisis data dengan cara melkukan inferensi
tentang ukuran-ukuran populasi melalui statistik yang diperoleh. Dengan kata
lain perkataan, statistika juga meliputi cara-cara untuk menafsirkan
suatu ukuran statistik serta melakukan inferensi tentang parameter
populasinya.
Berdasarkan
uraian diatas, kita dapat memahami bahwa statistika adalah bagian dari
matematika yang secara khusus membicarakan cara-cara pengumpulan, pengolahan,
penyajian, analisis dan penafsiran data. Dengan kata lain, istilah
statistika disini digunakan untuk menunjukkan tubuh pengetahuan (body of
knowledge) tentang cara-cara penarikan sampel (pengumpulan data), serta
analisis dan penafsiran data. Istilah statistik diatas juga digunakan untuk
menunjukan ukuran-ukuran yang langsung diperoleh dari data sampel untuk menarik
parameter populasinya. Sebagai contoh, rata-rata dari variansi yang diperoleh
dari perhitungan terhadap data sampel disebut statistik sedangkan rata-rata dan
variansi populasi disebut parameter. Jadi parameter menunjukkan
ukuran-ukuran yang menjelaskan ciri atau karakteristik yang diperoleh langsung
dari populasi[3].
- Jenis Statistika
Statistika
dapat dibedakan berdasarkan orientasi pembahasannyam yaitu :
- Statistika matematik (mathemaatical
statistics) atau statistika teoritis yang lebih berorientasi
pada pemahaman model dan teknik-teknik statistika secara
matematis-teoritis,
- Statistika terapan (applied
statistics) yang lebih berorientasi kepada pemahaman intuitif atas
konsep dan teknik-teknik statistika seta penggunaannya di berbagai bidang.
Sebagian
penulis juga ada yang membedakan statistika berdasarkan tahapan atau tujuan
analisisnya, yakni menjadi statistika deskriptif dan statistika
inferensial atau statistika induktif.
Seperti
dikatakan diatas, untuk menyimpulkan sesuatu persoalan diperlukan bahan atau
keterangan yang dikumpulkan sebagaian atau seluruhnya dari persoalan yang
sedang diselidiki. Biasanya bahan atau keterangan yang didapat dinyatakan dalam
angka-angka. Bahan atau keterangan demikian, yang kebenarannya harus dapat
dipercaya atau dapat diandalkan, disebut data statistik atau sering
disebut data. Kebenaran atau keterandalan data adalah betul-betul hal yang
perlu diperhatikan sebelum penelaahan lebih lanjut dilakukan.
Telah
dikatakan, bahwa berdasarkan data yang dianalisis, kesimpulan-kesimpulan yang
dibuat diharapkan cukup beralasan dan berlaku untuk persoalan secara
keseluruhn. Persoalan yang menyeluruh ini, disertai dengan definii dan
batas-batasnya yang jelas, di dalam statistika biasa dinamakan universum
atau populasi atau kadang-kadang diberi nama status alami. Di dalam
statistika yang lebih teoritis lagi, hal ini juga sering disebut ruang
kesimpulan.
Dinyatakan
dengan istilah baru ini statistika adalah pengetahuan yang membahas tentang
cara-cara pengumpulan data serta penganalisisannya dan pembuatan kesimpulan
berdasarkan analisis tersebut mengenai populasi dari mana data itu diambil.
Bagian
statistika yang berhubungan dengan pembuatan kesimpulan mengenai populasi
dinamakan statistika induktif. Bagian lainnya dinamakan statistika
deskriptif. Pengumpulan data, penyajian data, pembuatan tabel-tabel dan
grafik-grafik dan melakukan perhitungan-perhitungan untuk menentukan statistik
misalnya, termasuk ke dalam tugas statistika deskriptif. Hal-hal yang
termasuk ke dalam statistika induktif anatara lain melakukan penaksiran tentang
karakteristik daripada populasi, pembuatan prediksi, menentukan ada atau
tidaknya asosiasi anatara karakteristik-karakteristik populasi dan pembuatan
kesimpulan secara umum mengenai populasi.
Sesuai
dengan namanya, statistika deskriptif bertugas hanya untuk memperoleh gambaran
(description) atau ukuran-ukuran tentang data yang ada di tangan. Jika
data yang dianalisis merupakan sampel dari suatu populasi maka statistika
deskriptif akan menghasilkan ukuran-ukuran sampel (statistik), sedangkan jika
data yang dianalisis merupakan keseluruhan populasi maka statistika deskriptif
akan menghasilkan ukuran-ukuran populasi (parameter). Jadi, apabila kita
menganalisis data dari 100 orang subjek sebagai sampel dari suatu populasi dan
memperoleh nilai rata-rata (misalnya 69,7) dan variansinya (misalnya 11,4),
maka prosedur yang digunakan sampai disini disebut statistika deskriptif.
Demikian pula kita dapat menggunakkan prosedur yang sama untuk menganalisis dan
memperoleh nilai rata-rata (misalnya 70,2) dan variansi (misalnya 10,9) dari
seluruh populasi yang jumlahnya terhingga (misalnya 1.000 orang). Dalam contoh
tersebut, angka 69,7 (rata-rata) dan 11,4 (variansi) disebut statistik,
sedangkan angka 70,2 (rata-rata) dan 10,9 (variansi) disebut parameter.
Untuk
memperoleh kesimpulan yang cukup beralasan, dapat dapat dipertanggungjawabkan
sebaik mungkin, seperti telah berulang kali dikemukakan, kita harus
menggunakkan data dan analisis yang benar. Dengan kata lain, adalah suatu
keharusan untuk menempuh cara sedemikian rupa sehingga diharapkan akan
diperoleh hasil kesimpulan yang sesuai dengan keadaan sebenarnya daripada
populasi yang sedang diselidiki.
Cara yang
seperti demikian dinamakan tak bias. Dalam statistika, cara yang
sebaliknya, yakni cara bias, tersering tidak dikehendaki. Dengan
demikian setiap langkah atau cara yang ditempuh dalam statistika hendaknya
disebut takbias.
Namun,
seringkali hanya mengumpulkan dan memperoleh data dari sejumlah sampel. Dengan
menganalisis data sampel itu kita akan memperoleh sejumlah statistik yang
kemudian dapat digunakan untuk menaksir ukuran populasi atau menguji
hipotesis yang berlaku untuk populasi. Dengan kata lain, kita dapat
menggunakkan data dan ukuran-ukuran sampel untuk melakukan inferensi
tentang populasi. Statistika yang digunakan untuk tujuan ini disebut
statistika inferensial. Sebagai contoh, statistika inferensial memungkinkan
kita untuk menaksir rata-rata populasi dengan menggunakkan nilai rata-rata
(69,7) dan variansi (11,4) yang diperoleh dari 100 orang sampel tanpa harus
mengumpulkan data dari seluruh populasi (1.000 orang). Contoh ini menggambarkan
bahwa statistika inferensial memungkinkan kita untuk bekerja lebih cermat
(dengan meminimal kemungkinan kekeliruan manusia yang terlibat) dan lebih
efisien (dengan meminimalkan waktu, biaya dan tenaga).
Dilihat dari
asumsi mengenai distribusi populasi data yang dianalisis, statistika dibedakan
menjadi :
- Statistika parametrik,
teknik-teknik yang tergolong kaepada statistika parametrik didasrkan pada model
distribusi normal,
- Statistika non-parametrik,
teknik-teknik yang tergolong kepada statistika non-parametrik tidak
didasarkan pada suatu model distribusi tertentu. Oleh karena itu,
statistika non-parametrik dikenal juga dengan sebutan statistika bebas
distribusi (distribution free statistics).
Pada
umumnya, setiap teknik pengujian hipotesis pada statistika parametrik ada
teknik padanannya dengan statistika non-perametrik.
Statistika
juga dibedakan berdasarkan jumlah peubah (variabel) terikat (dependent
variable) yang dianalisi yakni menjadi statistika unvariant, dan statistika
multi variant. Teknik analisis statistik yang melibatkan hanya satu
peubah terikat termasuk kadalam statistika unvariant, terlepas dari beberapa
banyak peubah bebasnya. Sebaliknya, statistika multivariantmeliputi semua
teknik analisis statistikyang melibatkan paling tidak dua peubah terikat
sekaligus. Namun demikian, disini perlu diinformasikan bahwa klasifikasi yang
ditmukan pada sejumlah buka yang baik secara implisit maupun eksplisit,
mendasar penggolongan tersebut hanya pada jumlah peubah yang dianalisis,
terlepas apakah itu peubah bebas (independent variable) atau peubah
terikat (dependent variable).
Jenis-jenis
statistika yang dibedakan atas dasar kajiannya ini terlalu banyak untuk
disebutkan satu-persatu. Sebagai contoh statistika yang dipergunakkan di bidang
pertanian disebut statistika pertanian. Demikian pula dengan istilah biostatistics,
statistika ekonomi, statistika pendidikan, dan lain-lain. Pada prinsipnya,
semua konsep dan teknik statistika yang ada dapat digunakan pada seluruh bidang
jadi tidak ada perbedaan konseptual antara statistika pertanian dengan
statistika ekonomi.
- Pengukuran dan Data Statistik
- Pentingnya Pengukuran dalam Penelitian
Analisis
data secara kuantitatif dan teknik statistik merupakan dua hal yang berbeda
tetapi sangat berkaitan satu sama lain. Analisis data adalah suatu kegiatan
yang dinamis dan kreatif dengan bantuan teknik statistik yang bersifat
mekanistik. Kegiatan analisis data melibatkan pertimbangan dan kebutuhan
subjektif, sedangkan teknik statistik terdiri atas rumus atau alogaritma yang
baku. Dengan demikian suatu analisis data, sampai batas tertentu bergantung
pada kemampuan dan pengalaman orang yang melakukannya.
Suatu teknik
analisis statistik merupakan seperangkat prosedur yang siap digunakan untuk
memproses data dan menghasilkan ukuran-ukuran tertentu mengenai kecenderungan
dan karakteristik data yang bersangkutan. Teknik analisis statistik dan perangkat
elektroniknya (kalkulator dan komputer) akan memproses perangkat apa saja,
sesuai dengan konstrein yang ada, tanpa memperhatikan maknanya. Secara singkat,
dapat dikatakan bahwa makna hasil analisis statistika sangat bergantung pada
makna data yang diolah. Teknik statistik bukanlah prosedur yang dapat mengubah
sampah menjadi kaertas atau pupuk yang berharga.
Uraian
diatas dimaksudkan untuk menekankan bahwa pengukuran merupakan kegiatan awal
yang esensial dalam analisis data. Pengukuran merupakan kegiatan untuk
menyediakan data yang akan dijadikan masukan dalam anlisis statistika. Makna
suatu angka atau bilangan merupakan tanggungjawab kegiatan pengukuran.
Secara
teknis, isu tersebut dikenal dengan istilah validitas data. Validitas
merupaka isu sentral dalam setiap penelitian. Validitas penelitian antara lain
amat bergantung pada validitas data yang diperoleh. Jika data yang diperoleh
tidak valid, maka kegiatan analisis dan penafsiran data yang mengikutinya tidak
ada gunanya lagi. Hasil penelitian dan kesimpulan yang diperoleh berdasarkan
data yang tidakvalid bukan hanya keliru melainkan juga dapat menjerumuskan
pengambil keputusan dan masyarakat pada umumnya pada tindakan yang salah.
Uraian ini, sekali lagi menekankan esensi pengukuran sebagai kegiatan untuk
memperoleh data yang valid.
- Jenis Data dan Skala Pengukuran
Data dapat
digolongkan menjadi data diskrit dan data kontinu. Banyaknya anak
di suatu keluarga, jumlah rumah di suatu desa, banyaknya penduduk di suatu
daerah, dan jumlah mobil di kantor tertentu merupakan data diskrit. Sedangkan
tingkat kecerdasan, prestasi belajar, berat badan, dan daya tahan mobil
merupakan contoh data kontinu.
Sesuai
dengan nama yang digunakan, data diskrit bersifat terkortak-kotak, yaitu tidak
dikonsepsikan adanya nilai-nilai diantara data (bilangan) yang satu dengan data
(bilangan) lain yang terdekat. Misalnya jika bilangan 2 dan 3 menunjukkan
jumlah anak di keluarga A dan keluarga B, maka diantara kedua bilangan tersebut
tidak ada bilangan-bilangan lain. Tidak pernah kita mnengatakan bahwa jumlah
anak di suatu keluarga adalah 2,4 atau 2,9.
Berbeda
dengan data diskrit, diantara dua data kontinu dikonsepsikan adanya sejumlah
nilai dengan jumlah yang tidak terhingga. Jika bilangan 2 dan 3 diatas
menunjukkan berat suatu benda, maka iantara keduantya terdapat kemungkinan
adanya sejumlah bilangan lain yang tidak terhingga, seperti 2,0001, 2,0002,
2,0010, 2,0021 dan sebagainya. Dikatakan tidak terhingga jumlahnya, karena
kemungkinan nilai yang terjadi memang terlalu banyak dan tidak dapat
ditentukan. Jika kita mencatat data dalam dua desimal di belakang koma, maka
diantara 2 dan 3 akan terdapat 99 nilai. Coba bayangkan, jika setiap data harus
dicatat dalam 5, 10 atau 15 desimal di belakang koma.
Dilihat dari
skala pengukuran yang digunakan, data dibagi 4 jenis yang bersifat hirearkhis,
yaitu data yang berskala nominal (data nominal), data yang berskala
ordinal (data ordinal), dan data yang berskala interval (data
interval), dan data yang berskala rasio (data rasio). Skala nominal
merupakan jenis skala yang paling rendah, diikuti oleh skala ordinal, skala
interval, dan kemudian skala rasio.
Data nominal
memiliki skala yang bersifat kategorikal atau pengelompokkan. Jenis kelamin,
warna kulit, dan agama merupakan contoh data nominal yang sering dijumpai pada
buku-buku statistika. Pada contoh tersebut, kita memahami bahwa dengan data
nominal kita hanya dapat mengetahui gahwa subjek termasuk ke dalam kategori
tertentu (pria dan wanita hitam atau putih atau sawo matang, Islam atau Kristen
atau Hindu atau lainnya): sekali-kali lagi kita tidak mengatakan bahwa pria
lebih rendah atau lebih tinggi dari wanita, kulit hitam memiliki nilai yang
lebih rendah dari warna putih, dan sebagainya. Nama kelompok atau kategori
digunakkan disini hanya untuk mengenali identitas subjek dilihat dari variabel
tertentu. Perbedaan subjek dalam data nominal bersifat kualitatif dann tidak
mempunyai makna kuantitatif.
Data ordinal
memiliki skala yang menunjukkan perbedaan tingkatan subjek secara kuantitatif.
Contoh dari yang paling gamblang dari data ordinal adaklah data yang dinyatakan
dalam bentuk peringkat atau ranking. Selain kita dapat menyatakan bahwa seorang
subjek termasuk kelompok yang menduduki peringkat tertentu (sifat data
nominal), pada data ordinal kita juga, dapat menyatakan bahwa subjek atau
kelompok yang menduduiki peringkat lain (dibawahnya). Kita dapat mengatakan
bahwa siswa yang menduduki peringkat kedua pada suatu variabel memiliki
kemampuan atau skor yang lebih tinggi pada variabel itu daripada siswa yang
menduduki peringkat ketiga. Secara singkat, dapat dikatakan bahwa data ordinal,
disamping memiliki sifat yang terdapat pada data nominal juga menunjukkan
kedudukan (tingkatan) subjek dalam suatu kelompok pada suatu variabel.
Data yang
berskala rasio (data rasio) hampir sama dengan data interval, yakni keduanya
memiliki ketiga sifat diatas (menunjukkan klasifikasi dan kedudukan subjek
dalam suatu kelompok, serta sifat persamaan jarak). Data rasio berbeda dengan
data interval karena yang pertama (data rasio) memiliki nilai mutlak nol.
Sebagai konsekuensi dari asumsi tentang adanya nilai mutlak nol, kita dapat
membuat perbandinga (rasio) antara skor-skor yang berskala rasio. Sebagai
contoh, 20 kg adalah 2 kali 10 kg, 15m = 3 x 5m, dan sebagainya. Kita dapat
bermakana menyatakan bahwa orang yang beratnya 80kg adalah dua kali berat orang
yang berat badannya 40kg. Pernyataan semacam ini tidak dapat dibuat dengan
menggunakkan data interval. Kita tidak dapat mengatakan bahwa tingkat
kecerdasan orang yang memiliki I.Q. sebesar 150 adalah satu setengah kali
tingkat kecerdasan orang yang memiliki I.Q. sebesar 100.
- Tabel dan Grafik
Data
statistik dan hasil penelitian sering disajikan dalam bentuk tabel dan grafik.
Kedua hal ini merupakan ringkasan data statistik yang sangat menarik dan
komunikatif seperti suatu pepatah yang mengatakan : “a picture is worth a
thousand of words”. Memang sebuah grafik atau tabel dapat mewakili ratusan
atau bahkan ribuan kata dalam suatu bentuk yang kompak dan menarik.
Kegiatan pengukuran
akan menghasilkan seperangkat data yang disebut data mentah atau skor mentah (raw
score) jika data itu berbentuk skor. Untuk menghayati pentingnya tabel dan
grafik, perhatikanlah data (skor) fiktif berikut yang mungkin diperoleh dari
suatu kegiatan pengukuran.
89
|
79
|
67
|
62
|
69
|
69
|
67
|
65
|
36
|
64
|
65
|
59
|
56
|
91
|
73
|
81
|
71
|
95
|
86
|
45
|
48
|
66
|
83
|
77
|
82
|
41
|
56
|
43
|
50
|
55
|
72
|
66
|
68
|
75
|
63
|
46
|
47
|
57
|
41
|
64
|
54
|
38
|
81
|
85
|
77
|
70
|
57
|
41
|
64
|
68
|
60
|
43
|
45
|
72
|
93
|
54
|
Makna apa
yang dapat ditafsirkan dari perangkat data tersebut? Walaupun dikatakan bahwa
80 skor merupakan hasil tes kemampuan Matematika yang terdiri dari 100 butir
sioal, tampaknya kita umumkan masih mengalami kesulitan untuk memberikan makna
terhadap perangkat data tersebut. Penyajian data seperti ini tidak kompak dan
tidak menarik. Lebih dri itu, data diatas sulit dibaca maknanya. Kalaupun ada
orang yang dapat menemukan makna tertentu, tafsirannya belum tentu sesuai
dengan maksud yang hendak ditekankan oleh penyaji karena banyaknya kemungkinan
tafsiran yang dapat dijabarkan dari data itu sesuai dengan sudut pandang
masing-masing. Pendek kata, penyajian data seperti diatas tidak komunikatif.
Dalam
statistik deskriptif, grafik merupakan alat yang tidak dapat digantikan oleh
alat lain. Sejumlah software komputer menyediakan fasilitas yang sangat
intensif untuk mendesain da menghasilkan grafik, seperti Harvard Graphic, dan
SYTAT. Hal ini antara lain karena grafik lebih mudah difahami, dan banyak hal
daripada tabel yang terbaik sekalipun.
- Daftar Distribusi Frekuensi
Daftar
distribusi frekuensi menunjukkan rincian skor dari suatu perangkat data beserta
frekuensinya masing-masing dalam suatu pengukuran. Daftar distribusi frekuensi
menggambarkan seberapa sering masing-masing skor pada perangkat data itu
muncul. Jilka kita melempar uang logam, maka ada dua kemungkinan gambar yang
muncul, yaitu gambar muka (M) dan gambar belakang (B) hanya
muncul sebanyak 4 kali. Dengan perkataan lain, M memiliki frekuensi 6
sedangkan B memiliki frekuensi 4. Data tersebut dapat digambarkan dalam sebuah
daftar distribusi frekuensi seperti tabel 2.1.
Tabel 2.1.
Daftar
Distribusi Frekuensi Hasil Pelemparan
Sebuah Uang
Logam
Bagian
yang Muncul
|
Frekuensi
|
Muka (M)
|
6
|
Belakang (B)
|
4
|
Jumlah
|
10
|
Tabel 2.1.
merupakan conto daftar distribusi sederhana yang terdiri atas empat barisdan
dua kolom dimana baris pertama berisi judul setiap kolom. Disamping judul
tabel, untuk memudahkan pembaca , setiap kolom dan baris juga sebaiknya diberi
judul sesuai keperluan. Jika diperluka sumber dari mana data diperoleh
dicantumkan pada bagian bawah tabel.
Tabel 2.2
Nilai Akhir
Mata Kuliah X Berdasarkan
Jenis
Kelamin Mahasiswa
Nilai
Akhir
|
Pria
|
Wanita
|
Jumlah
|
|||
f
|
%
|
f
|
%
|
f
|
%
|
|
A
|
20
|
22
|
23
|
25
|
43
|
24
|
B
|
35
|
39
|
31
|
34
|
66
|
36
|
C
|
29
|
32
|
27
|
30
|
56
|
31
|
D
|
5
|
6
|
8
|
9
|
13
|
7
|
E
|
1
|
1
|
2
|
2
|
3
|
2
|
Jumlah
|
90
|
100
|
91
|
100
|
181
|
100
|
Untuk
menghemat tempat, judul setiap kolom dan baris dari tabel yang kompleks dapat
disingkat dengan menggunakkan simbol-simbol yang yang lazim atau dengan
disertai keterangan sesuai keperluan. Sebagai contoh, huruf f biasanya
digunakkan untuk menunjukkan frekuensi, huruf n digunakkan untuk
menunjukkan sebuah sampel, dan N untuk menunjukkan besarnya populasi.
Tabel 2.2
merupakan contoh daftar distribusi frekuensi (data fiktif) yang sebagian judul
kolomnya dipendekkan, yaitu f untuk frekuensi dan % untuk persen.
Tabel 2.1.
dan 2.2. diatas merupakan contoh daftar distribusi frekuensi data yang tidak
dikelompokkan karena frekuensinya dicantumkan untuk setiap skor (nilai) yang
muncul. Daftar distribusi frekuensi seperti ini dapat digunakkan jika skor
(nilai) yang diperoleh relatif tidak beragam. Namun, jika skor atau nilai yang
hendak dianilisis cukup beragam, maka daftar distruibusi frekuensi seperti
diatas tidak memadai lagi. Sebagai contoh, perhatikan perangkat dat fiktif pertama
diatas dengan jumlah sampel sebanyak 80. Data tersebut cukup beragam dengan
skor terkecil 36 dan skor terbesar 95, sehingga jika distribusi frekuensinya
dibuat seperti diatas tidak akan membantu memudahkan dalam menafsirkannya.
Secara
berurutan, langkah-langkah untuk menusun daftar distribusi data yang
deikelompokkan adalah sebagai berikut :
- Menentukkan rentang,
Rentang
(range) suatu perangkat data yang biasanya dilambangkan dengan huruf R adalah skor
terbesar dikurangi skor terkecil. Dengan demikian rentang perangkat data
diatas dapat ditemukan yaitu,
R = 95 – 36
= 59.
- Panjang Kelas,
Panjang
kelas (p) atau interval (i) menunjukkan banyaknya angka (nilai)
yang tercakup oleh suatu interval kelas. Sebagai contoh, pada interval 4 -8
(untuk data yang dicatat dalam bilangan bulat) terdapat lima buah angka, yaitu
4, 5, 6, 7, dan 8. Dengan demikian panjang kelas (p atau i) untuk
interval kelas tersebut adalah 5; jadi p = 5.
Panjang
kelas dapat ditentukkan dengan beberapa cara. Salah satu cara yang dapat membantu
menentukkan panjang kelas adalah rumus yang diusulkan oleh Sturgess (Sudjana,
1975: 46), yaitu
Dengan
menggunakkan rumus diatas, panjang kelas yang diperlukan untuk mengelompokkan
data diatas dapat ditentukan seperti berikut:
P = 1 + 3.3 log 80 = 7,3
Jadi panjang
kelas untuk pengelompokkan data dari 80 subjek adalah sekitar 7 atau 8. Hal
yang perlu dicatat disini adalah bahwa panjang kelas dapat berupa bilangan
desimal atau bilangan bulat bergantung pada pencatatan data yang dikelompokkan.
Oleh karena data dalam contoh diatas dicatat dalam bilangan bulat, maka panjang
kelasnya pun harus berupa bilangan bulat.
- Banyak Kelas
Banyak kelas
(bk) mrnunjukkan jumlah interval kelas yang diperlukan untuk
mengelompokkan suatu perangkat data. Banyak kelas selalu berbentuk bilangan
bulat dan sebaiknya berkisar antara 5 sampai 20. Banyak kelas suatu perangkat
data dapat ditemukan dengan rumus :
Dengan
menggunakkan R = 59 dan p = 7, maka banyak kelas yang diperlukan perangkat data
pada contoh datas adalah:
bk = 59 : 7
= 8,43
Dengan
demikian untuk pengelompokkan perangkat data pada contoh diatas
diperlukan sekitar 8 atau 9 interval kelas.
- Interval Kelas
Untuk
menyusun interval kelas, perlu ditentukan dahulu bilangan awal untuk interval
kels pertama (paling bawah). Bilangan awal ini sebaiknya merupakan kelipatan
dari panjang kelas (p) dan tidak lebih kecil dari sko terkecil dikurangi
panjang kelas. Bilangan awal ini harus sama dengan atau lebih kecil dari skor
terkecil. Sejalan dengan prinsip-prinsip tersebut, maka untuk mengelompokkan
contoh data diatas sebaiknya dipilih angka 35 sebagai bilangan awal. Angka 35
merupakan kelipatan dari panjang kelas (p = 7), lebih kecil dari skor
terkecil dan selisihnya dengan skor terkecillebih besar dari panjang kelas.
Tabel 2.3.
Daftar
Distribusi Frekuensi Contoh Data Fiktif
Interval
Kelas
|
Turus
|
Frekuensi
|
91-97
|
III
|
3
|
84-90
|
IIIII
|
5
|
77-83
|
IIIII III
|
8
|
70-76
|
IIIII
IIIII III
|
13
|
63-69
|
IIIII
IIIII IIIII IIII
|
19
|
56-62
|
IIIII
IIIII IIIII
|
15
|
49-55
|
IIIII IIII
|
9
|
42-48
|
IIIII I
|
6
|
35-41
|
IIII
|
4
|
Jumlah
|
-
|
80
|
Dengan
bilangan awal 35 dan panjang kelas 7, maka kelas pertama untuk contoh data
diatas adalah 35-41 yang meliputi 7 macam nilai yaitu, 35, 36, 37, 38, 39, 40,
dan 41. Interval kelas berikutnya adalah 42-48, 49-55 dan seterusnya.
- Frekuensi setiap kelas
diperoleh dengan turus (tally) setiap nilai yang ada pada interval
kelas masing-masing dan kemudian menjumlahnya banyaknya turus yang
didapat. Melalui kelima langkah ini, maka daftar distribusi frekuensi
untuk contoh data diatas dapat dibuat seperti tabel 2.3.
Tabel 2.3.
terdiri atas 9 kelas dengan panjang masing-masing kelas sama dengan 7. Setiap
kelas dibatasi oleh dua buah skor, yaitu batas bawah (lower limit) dan
batas atas (upper limit). Batas bawah suatu els adalah skor (nilai)
terkecil (terendah) pada kelas itu, misalnya 35 untuk nilai kels terbawah, 42
untuk kelas kedua, dan 91 untuk kelas teratas. Sedangkan batas suatu kelas
adalah skor terbesar atau tertinggi pada kelas yang bersangkutan, seperti nilai-nilai
yang ada di sebelah kanan setiap kalas (41, 48, 55,…, dan 97).
Selain itu
karena datanya bersifat kontinu (bukan diskrit), maka setiap kelas juga
memiliki batas nyata (real limit), yaitu batas nyata bawah (lower
real limit) dan batas nyata atas (upper real limit).
- Titik Tengah
Istilah lain
yang perlu difahami adalah titiktengah (midpoint). Sesuai dengan
namanya titik tengahsuatu kelas merupakan nilai yang membagi kelas itu menjadi
dua bagian sama besar. Dengan kata lain, titik tengah suatu kelas adalah
setengah dari umlah batas bawah dan batas atas kelas itu. Secara aljabar,
pengertian tersebut dapat ditulis
Sebagai
contoh, titik tengah kelas 35-41 adalah (35 + 41) = 38; ada tiga nilai
dibawahnya (35, 36, dan 37) dan tiga nilai lain diatasnya (39, 40, dan 41).
Titiktengah ini sering digunakkan sebagai wakil kelas yang bersangkutan dalam
analisis statistika.
Dalam suatu
penelitian, jumleh atau presentase subjek yang mendapat nilai lebih daripada
skor tertentu mugkin merupakan hal yang menarik untuk ditelaah. Informasi
tentang hal ini dapat dngan mudah diperoleh dengan menambahkan frekuensi
kumulatif (fk) pada daftar distribusi frekuensi diatas (Tabel 2.3.).
frekuensi kumulatif dapat diperoleh dengan cara menambahkan frekuensi (f)
di setiap kelas dari bawah ke atas. Jika tabel 2.3. diatas dilengkapi dengan
presentasi kumulatif maka akan terlihat daftar distribusi frekuensi pada tabel
2.4.
Daftar
distribusi frekuensi seperti Tabel 2.4. memberikan informasi yang lebih lengkap
dibandingkan dengan Tabel 2.3. Dari Tabel 2.4, misalnya, dapat dikatakan bahwa
66 atau sekitar 82,5% subjek memperoleh skor tidak lebih dari 76. Contoh lain
adalah bahwa subjek yang memperoleh skor 70 keatas berjumlah sekitar 17,5%.
Tabel 2.4.
Frekuensi
dan Presentase Kumulatif Data pada Tabel 2.3.
skor
|
f
|
fk
|
%
|
91-97
|
3
|
80
|
100,0
|
84-90
|
3
|
77
|
96,3
|
77-83
|
8
|
74
|
92,5
|
70-76
|
13
|
66
|
82,5
|
63-69
|
19
|
53
|
66,3
|
56-62
|
15
|
34
|
42,5
|
49-55
|
9
|
19
|
23,8
|
42-48
|
6
|
10
|
12,5
|
35-41
|
4
|
4
|
5,0
|
Jumlah
|
80
|
-
|
-
|
Uraian dan
contoh sederghana tersebut menunjukkan bahwa penyajian data melalui tabel
mempermudah peneliti atau pembaca memahami fenomena yang diamati dan maksud
yang hendak disampaikan. Bentuk dan tafsiran yang akan ditonjolkan bergantung
pada permasalahan atau isu yang tengah dikaji.
- Grafik
Perangkat
data dapat ditampilkan secara visual dalam bentuk grafik. Dengan bantuan
grafik, perangkat data yang besar dan kompleks dapat disajikan secara menarik
menjadi suatu tampilan sederhana dan kompak. Grafik yang dipersiapkan dan
dibuat secara baik akan menambah keindahan dan daya tarik laporan penelitian.
Lebih dari itu, grafik akan membantu menyederhanakan keadaan yang kompleks
sehingga mudah difahami oleh para pembaca. Sejumlah laporanpenelitian, urnal,
koran, dan majalah memanfaatkan grafik sebagai alat bantu yang efektif dalam
menyampaikan informasi.
Sejumlah
jenis grafik dapat ditemukan pada berbagai sumber informasi, seperti buku,
jurnal, dan kantor. Sudjana (1986) merupakan buku statistika yang mmberikan
penjelasna dan contoh bermacam grafik secara intensif. Wilkinson (1990),
SYSGRAPH, adalah salah satu buku manual yang secara khusus menyajikan berbagai
macam grafik dan cara membuatnya dengan menggunakkan SYSTAT.
- Histogram
Histogram
adalah suatu bentuk grafik yang menggambarkan sebaran (distribusi) frekuensi
suatu perangkat data dalam bentuk batang. Histogram digunakkan untuk
menggambarkan secara visual frekuensi data yang bersifat kontinu, untuk data
yang berbentuk kategori, tampilan visual yang serupa disebut diagram batang (bar
chart).
Untuk
menggambar hisogram iperlukan sumbu datar (absis) dan sumbu tegak (ordinat).
Sumbu datarnya selalu melukiskan data yang telah dintyatakan dalam kelas-kelas
interval. Titik-titik pembagian pada sumbu ini, yang sering diambil ialah
ujung-ujung bawah dari tiap kelas interval. Jika ujung bawah kelas interval
pertama cukup besar harganya, maka sumbu datar, antara titik asal dan harga
tersebut, seperti biasa dilakukan pemutusan. Pada sumbu tegaknya selalu
menyatakan banyak data (frekuensi), baik mutlak ataupun relatif. Pemutusan pada
sumbu ini tidak pernah dilakukan[4].
Gambar 2.1.
merupakan histogram distribusi frekuensi data pada tabel 2.4.
|
|
|
|
|
|
|
|
|
33
S k o r
Pada gambar
2.1., angka 38, 45, 52,…, 87 dan 94 merupakan titiktengah setiap kelas, dan
bersedia di antara dua batas nyata kelas yang bersangkutan.
- Frekuensi Poligon
Pada
histogram diasumsikan bahwa skor-skor suatu interval kelas menyebar secara
merata. Sebagai contoh, tinggi grafik semua skor pada kelas pertama, 35-41,
contoh diatas (Tabel 2.4.) adalah sama (f = 4). Pada frekuensi poligon,
skor-skor itu diasumsikan terpusat pada titiktengah kelasnya.
- Ogif
Ogif (ogive)
merupakan poligon yang dibuat atas dasar frekuensi kumulatif seperangkat data.
Secara lebih tegas dapat dikatakan bahwa grafik ogif merupakan gambaran visual
dari frekuensi kumulatif perangkat data. Sehubungan dengan hal itu, sebagian penulis
seperti Ferguson dan Takane (1989) menyebut grafik ogif dengan istilah frekuensi
poligon kumulatif. Garis suatu ogif menghubungkan batas nyata atas/bawah
setiap interval kelas.
- Bentuk Grafik Lain
Hal yang
terpenting untuk diperhatikan adalah bahwa grafik itu dibuat untuk merangkum
dan menyederhanakan data yang kompleks menjadi suatu gambar yang informatif dan
mudah difahami oleh pembaca yang menjadi sasaran. Grafik yang kompleks dapat
merangkum dan memberikan informasi tentang banyak hal, namun sering menuntut
kejelian dan kecermatan pembaca untuk memahaminya.
- Pengujian Hipotesis Menggunakan
Rumus Statistika
- Inferensi tentang Koefisien
Korelasi Populasi
Walaupun
perhitungan koefisien korelasi tidak menuntut asumsi tertentu mengenai
distribusi perubah X dan Y (Edwards, 1984), namun sejumlah faktor
yang mempengaruhi besarannya perlu dipertimbangkan sehingga tafsiran yang
diberikan terhadapnya tidak salah arah. Diantara faktor-faktor dimaksud,
titik-titik kordinat yang menyimpang dari garis lurus dan besarnya variasi
masing-masing peubah perlu mendapat perhatian khusus.
Lebih dari
itu, manakala peneliti hendak menggunakkan koefisienkorelasi sampel () untuk
melakukan inferensi tentang parameter populasinya () maka ia perlu
memperhatikan beberapa asumsi mengenai distribusi kediua peubah yang
bersangkutan, yaitu :
- Nilai (skor) yang berpasangan
sebanyak n telah disampel secara acak dan populasinya.
- Skor anatara subjek yang
diteliti tidak saling mempengaruhi satu sama lain (bersifat independent).
- Distribusi bersama kedua peubah
itu adalah normal (bivariate normal distribution).
Kedua asumsi
pertama (keacakan sampel dan independensi antara skor subyek) juga merupakan
asumsi yang mendasari uju perbedaan dua buah rata-rata. Distribusi (populasi)
bersama seperangkat pasangan skor (katakanlah, X dan Y) disebut bivariate
normal, jika :
- Populasi masing-masing peubah
tersbut berdistribusi normal.
- Untuk setiap kemungkinan nilai
X, populasi skor Y berdistribusi normal.
- Variansi populasi skor Y antar
setiap kemungkinan nilai X sama besar.
- Untuk setiap kemungkinan nilai
Y, populasi skor X berdistribusi normal.
- Variansi skor distribusi X
antar setiap kemungkinan nilai Y sama besar.
Jika kelima
kondisi tersebut terpenuhi maka tidak ada kemungkinan lain kecuali bahwa kedua
peubah berhubungan secara linier. Persoalannya adalah bahwa, secara teknis,
pengujian atas lima kondisi itu tidak mudah dilakukan. Kedua asumsi yang
dimaksud adalah :
- Kedua peubah yang
dikorelasikan, masing-masing, berasal dari populasi yang berdistribusi
normal,
- Hubungan anatara keduanya
(misalnya Y atas X) dapat dihampiri oleh model regresi linier.
Dalam
praktek sehari-hari terpenuhinya kedua asumsi tersebut sering digunakkan untuk
memuaskan asumsi bivariate normal. Para peneliti seringkali menguji
kedua asumsi tersebutr secara visual melalui grafik atau distribusi unvariant
(asumsi normalitas distribusi masing-masing peubah) dan bivariate (linieritas
regresi). Teknik pengujian yang lebih sitematik atas kedua asumsi tersebut juga
telah dikembangkan seperti uji kuadrat-chi (normalitas distribusi populasi) dan
uji linieritas regresi populasi dengan menggunakkan distribusi F.
- Distribusi Sampel Koefisien
Korelasi
Bayangkan
suatu populasi nmengenai pasangan dua peubah (X dan Y) yang memiliki koefisien
korelasi sebesar . Dari populasi tersebut, sejumlah pasangan skor (X dan Y)
sebesar n disampel secara acak. Atas dasar itu, sampel koeisien korelasi
sebesar kemmudian dapat dihitung dan ditentukan. Jika kegiatan semula
dilakukan secara berulang maka akan diperoleh sejumlah sampel koefisien
korelasi sebesar ….,
Bayangkan
lagi bahwa dari sejumlah koefisien korelasi sampel tersebut, kita kemudian
membuat sebuah daftar distribusi frekuensi dengan koefisien korelasi sebagai
absisnya. Hasilnya adalah sebuah distribusi koefisien korelasi sampel. Disini
setiap nilai koefisien korelasi diperlakukan seperti X (skor) pada daftar
distribusi frekuensi.
Bentuk
distribusi korelasi koefisien sampel tidak tetap bergantung kepada nilai
koefisien korelasi populasinya (). Jika sama dengan atau mendekati nol
dan n masing-masing relatif besar maka distribusi nilai-nilai koefisien
korelasi sampel akan berbentuk atau mendekati bentuk normal. Namun, jika
tidak sama dengan atau mendekati nol n masing-masing sampel
relatif kecil maka distribusi nilai-nilai koefisien korelasi sampel cenderung
lancip atau juling ke kiri atau ke kanan.
- Pengujian Hipotesis dalam
Analisis Korelasi
Sekurang-kurangnya
ada dua macam hipotesis nol yang mungkin menarik untuk diuji melalui analisis
korelasi sederhana. Pertama, hipotesis nol bahwa kedua peubah tidak
berhubungan satu sama lain. Seringkali, peneliti menduga bahwa suatu peubah
berhubungan secara positif atau negatif dengan satu peubah lainnya. Jika dugaan
seperti ini diterjemahkan ke dalam hipotesis statistik maka menjadi sebagai
berikut :
Hubungan
Positif
: = 0
:
> 0
Hubungan
Negatif
: = 0
: <
0
Kedua, hipotesis nol bahwa koefisien
korelasi antara dua peubah sama dengan nilai tertentu. Misalnya seorang
peneliti menduga bahwa tingkat ekonomi orangtua berhubungan erat dengan
asprirasinya atas pendidikan anak; dalam arti bahwa aspirasi seseorang atas
pendidikan anak cenderung meningkat seiring dengan peningkatan tingkat
ekonomninya. Misalnya lagi, peneliti mendefinisikan bahwa hubungan erat antara
keduanya harus ditunjukkan oleh koefisien korelasi diatas 0,40. Jika tingkat
ekomnomi tersebut peubah X dana aspirasi atas pendidikan anak tersebut peubah
Ymaka dugaan peneliti tersebut dapat diterjemahkan ke dalam hipotesis statistik
seperti beriikut :
: =
0,40
:
> 0,40
- Pengujian Hipotesis nol bahwa
= 0
Untuk
menguji bahwa koefisien korelasi populasi antara dua peubah sama dengan nol
(tidak ada hubungan) dapat dilakukan melalui beberapa cara. Jika dilakukan
dengan benar, seluruh cara itu akan menghasilkan kesimpulan yang sama. Salah
satu cara yang lazim digunakan adalah dengan menghitung t seperti dalam
rumus (13.1)
|
Dimana
= koefisien
korelasi sampel yang diperoleh
jumlah
sampel
- Pengujian hipotesis nol bahwa
= nilai tertentu
Diatas telah
dijelaskan bahwa bentuk distribusi sampel koefisien korelasi berbeda-beda
bergantung pada nilai-nilai koefisien korelasi populasinya.model distribusi
sampel itu sulit digunakan sebagai patokan dalam pengujian hipotesis nol bahwa
= nilai tertentu. Untuk mengatasi kesulitan ini, nilai perlu diubah
menjadi peubah baru ()
|
- Pengujian Hipotesis dalam
Analisis Regresi
Pengujian
tentang hipotesis nol tentang nilai koefisien regresi di dalam populasi
dilakukan dengan rumus (13,5).
|
BAB III
KESIMPULAN
Kemajuan
ilmu pengetahuan dan teknologi tidak dapat dipisahkan dari statistika. Para peneliti
menggunakkan statistika sebagai alat bantu dalam memahami gejala-gejala
yang diamatinya. Statistika membantu para peneliti mampu menyederhanakan
kompleksitas suatu gejala sehingga lebih mudah difahami pemikiran manusia yang
terbatas. Atas bantuan statistika, penemuan-penemuan yang dihasilkan oleh para
ilmuwan juga dapat dikomunikasikan ke masyarakat secara kompak, singkat dan
akurat.
DAFTAR PUSTAKA
- Nurhasan, 1998. Handout
Statistik. Bandung : FPOK IKIP.
- Sudjana, 2000. Statistika
“Untuk Ekonomi Dan Niaga”. Bandung : Tarsito.
- Furqan. 2009. Satistika
“Terapan untuk Penelitian”. Bandung : Alfabeta.
- Jalaludin Rakhmat. Metodologi
Penelitian Komunikasi “Disertai Contoh Statistik”. Bandung : Remaja
Rosdakarya.
Tidak ada komentar:
Posting Komentar