PENGERTIAN AWAL
- Statistik: metode ilmiah yang terdiri dari proses pengumpulan data, pengorganisasi data sehingga data lebih berarti, melakukan analisis tertentu dan menarik kesimpulan dari analisis tersebut
- Populasi: keseluruhan data
- Sampel: bagian dari populasi yang diambil dengan metode tertentu sehingga mewakili populasi
- Sampling: cara mengambil sampel dari populasi. Ada tiga cara umum:
- random sampling: mengambil secara random/acak dari populasi
- representative sampling: mengambil dengan sengaja dipilih sehingga sesuai dengan karakteristik populasi
- convenience sampling: mengaambil sampel sesuai dengan kemudahan periset
- Statistik terbagi 2 bagian besar:
- statistik deskriptif: memberikan gambaran karakteristik suatu data dan berlaku sebatas sampel data tersebut, gambaran dapat berupa pemusatan dan penyebaran data
- statistik inferen: menggunakan sampel untuk mempelajari sesuatu yang lebih besar, yaitu dengan estimasi parameter atau uji hipotesis
- Ada 2 macam tipe variabel:
- variabel kuantitatif: memiliki ukuran yang menunjukkan jumlah, misal berat badan
- variabel kualitatif: tidak memiliki ukuran, misal arah, option 1-2-3-4
- Ada 4 macam skala pengukuran dalam variabel:
- skala nominal: angka hanya sebatas label, misal pria = 0, wanita = 1
- skala ordinal: angka memiliki nilai berat, bisa lebih berat atau lebih ringan namun tidak menunjukkan jarak tertentu, misal daftar 10 orang terkaya di depok
- skala interval: mempunyai nilai dan jarak, namun titik nol hanya arbitrase, misal temperatur (suhu 100 derajat tidak sama dengan 2x panasnya suhu 50 derajat)
- skala rasio: mempunyai nilai dan jarak, dan titik nol memang absolut, misal berat (contoh: benda dengan berat 10 kg memang 2x beratnya benda dengan berat 5 kg)
DISTRIBUSI FREKUENSI & HISTOGRAM
- Distribusi frekuensi: nilai suatu variabel yang telah diurutkan dari terkecil sampai terbesar sehingga mempunyai karakteristik tertentu, mempunyai pemusatan dan penyebaran data
- Distribusi frekuensi mempunyai beberapa istilah:
- interval kelas: rentang anggota, misal 11-20, 21-30
- batas kelas: tepian suatu interval, misal 11 dan 20, 21 dan 30
- lebar kelas: jumlah interval kelas dari yang tertinggi hingga yang terendah
- titik tengah: nilai tengah suatu interval kelas
- Histogram: penjabaran tabel distribusi frekuensi dalam sebuah diagram batang
- 2 Cara membuat histogram dalam SPSS:
- Klik Graph → Legacy Dialogs → Histogram (cara manual), atau
- Klik Graph → Chart Builder → choose from → Histogram (cara langsung)
- Pemusatan data dapat kita ketahui dengan mean, median, modus:
- mean: rata-rata atau jumlah nilai-nilai dibagi dengan banyaknya individu
- median: nilai persentil 50 (P50), 50% nilai ada di bawahnya, dan 50% nilai ada di atasnya
- modus: nilai yang paling sering muncul
- Penyebaran data dapat diketahui dengan:
- range: jarak antara nilai yang tertinggi dengan nilai yang terendah dari suatu distribusi data
- varian: tahapan untuk menghitung standar deviasi. Standar deviasi adalah akar dari varian, standar deviasi adalah nilai rata-rata deviasi data
- deviasi: perbedaan nilai antara nilai data individu dengan rata-ratanya
- Bentuk distribusi frekuensi:
- outlier: data yang mengalami penyebaran ekstrem
- skewness: mengukur tingkat simetri dan distribusi data, berbicara tentang tingkat kecondongan
- nilai skewness:
- x < -1 atau x > 1 = condong tinggi
- -1 < x < - ½ atau ½ < x < 1 = condong moderate
- - ½ < x < ½ mendekati simetrik
- simetris: nilai skew nol, distribusi normal, nilai mean-median-modus berada dalam satu garis
- condong kanan: tail di kanan, modus < median < mean
- condong kiri: tail di kiri, mean < median < modus
- kurtosis: keadaan puncak pemusatan, tinggi tajam atau rendah lebar
- mesokurtik: kurtosis 3, distribusi normal
- platikurtik: kurtosis < 3, distribusi dengan puncak pemusatan rendah dan lebar
- leptokurtik: kurtosis > 3, distribusi dengan puncak pemusatan tinggi dan sempit
- Cara mencari pemusatan dan penyebaran data dalam SPSS:
- Analyze → Descriptive Statistics → Frequencies, lalu
- masukkan variable → klik tombol Frequencies Statistics, lalu
- Untuk mengetahui percentile ceklist Quartiles
- Untuk nilai pemusatan data ceklist Mean, Median, Mode
- Untuk nilai penyebaran data ceklist Std Deviation, Variance, Range
- Untuk bentuk distribusi data ceklist Skewness dan Kurtosis
- Boxplot
- cara yang cukup mudah melihat nilai interkuartil
- nilai O adalah jumlah data
- kotak hijau = range interkuartil, 50% data ada di kotak ini
- sisi atas kotak = P75
- sisi bawah kotak = P25
- whisker bagian atas memuat 25% data di atas P75
- whisker bagian bawah memuat 25% data di bawah P25
- Cara membuat Boxplot:
- Graph → Legacy Dialogs → Boxplot, lalu