Mengenal Statistik Deskriptif dan Penggunaannya

Tulisan bersumber dan diadaptasi dari Scribbr.com

Statistik Deskriptif berfungsi untuk meringkas dan mengorganisasi karakteristik dari sebuah data set (kumpulan data berupa repons yang kamu dapatkan setelah survey dilaksanakan, ataupun hasil observasi dari sebuah sampel atau populasi).

Dalam penelitian kuantitatif, setelah data dikumpulkan, langkah pertama yang harus dilaksanakan dalam menjalankan analisis statistik adalah mendeskripsikan karakteristik dari respons yang kita dapatkan, seperti nilai rata-rata dari sebuah variabel (contoh: usia), atau mengetahui hubungan di antara dua variabel (misalkan, hubungan antara usia dengan kreativitas).

Setelah statistik deskriptif dilaksanakan, kamu perlu melakukan statistik inferensial yang akan membantumu untuk mengonfirmasi atau menolak hipotesis penelitian yang telah ditetapkan dan menyimpulkan apakah penemuan dari penelitian ini bisa digeneralisasikan ke populasi yang lebih besar.

Jenis-Jenis Statistik Deskriptif

Ada 3 jenis utama dari statistik deskriptif:

  • Distribution (distrbusi): ini terkait dengan frekuensi kemunculan dari setiap nilai
  • Central tendency (tendensi sentral): ini terkait dengan nilai rata-rata dari nilai-nilai yang didapatkan
  • Variability (variabilitas/dispersi): ini terkait dengan seberapa jauh persebaran dari nilai-nilai yang didapatkan

Contoh penelitian:
Kamu ingin mempelajari tentang tingkat popularitas dari beberapa kegiatan santai di waktu senggang yang sering dilakukan berdasarkan jenis kelamin. Karenanya, kamu melaksanakan sebuah survey dengan menyebarkan kuesioner ke para peserta dengan menanyakan:

“Berapa kali kamu melakukan kegiatan berikut di tahun lalu?”

  • Pergi ke perpustakaan
  • Menonton film di bioskop
  • Mengunjungi taman nasional

Setelah kamu mendapatkan respons dari para peserta, kamu dapat menggunakan statistik deskriptif untuk menemukan frekuensi/tingkat keseringan dilakukannya sebuah aktivitas (distribusi), nilai rata-rata dari dilaksanakannya aktivitas tersebut (tendensi sentral), serta persebaran nilai untuk tiap aktivitas (variabilitas).

Distribusi Frekuensi (Frequency Distribution)

Sebuah data set pastinya memiliki distribusi nilai atau skor. Kamu dapat meringkas frekuensi kemunculan nilai dari sebuah variabel dalam sebuah tabel atau grafik, baik dalam bentuk angka ataupun persentase.

Contoh tabel distribusi frekuensi sederhana:

Dari tabel tersebut dapat dilihat bahwa peserta wanita lebih banyak berpartisipasi

Contoh tabel distribusi frekuensi berdasarkan pengelompokan:

Dalam sebuah distribusi frekuensi yang dikelompokkan, kamu dapat membagi respons ke dalam beberapa kelompok, dan menghitung jumlah respons yang masuk ke dalam tiap kategori tertentu. Kamu juga dapat mengubah angka hasil hitungan ke dalam bentuk persentase.

Dari tabel ini bisa disimpulkan bahwa sebagian besar peserta survey mengunjungi perpustakaan sebanyak 9-12 kali di tahun lalu.

Pengukuran Tendensi Sentral

Pengukuran tendensi sentral ini akan membantu kita untuk mengestimasi pusat, atau rata- rata dari sebuah data set. Mean, median, dan mode adalah metode yang bisa digunakan.

Cara menghitung mean:

Untuk menemukan mean, tambahkan semua nilai yang kamu dapatkan dari sebuah variabel, kemudian bagi hasil penjumlahan tersebut dengan jumlah total dari respons/observasi yang didapatkan (atau biasa disebut dengan N).

Angka rata-rata dari kunjungan ke perpustakaan di tahun lalu:

  • Data set dari kunjungan ke perpustakaan dari tiap peserta: 15, 3, 12, 0, 24, 3
  • Penjumlahan dari seluruh nilai: 15+3+12+0+24+3 = 57
  • Jumlah total respon yang didapatkan: N = 6
  • Mean: 57/6 = 9.5

Cara menghitung median:

Median adalah nilai yang berada tepat di tengah-tengh dari sebuah data set. Untuk menemukan median, nilai yang didapatkan dari tiap respons harus diurutkan dari yang terkecil hingga terbesar terlebih dahulu; median adalah angka yang berada di tengah dari sebuah data set yang telah diurutkan. Jika terdapat dua nomor di tengah, maka hitung mean dari dua angka tersebut.

Angka median dari kunjungan ke perpustakaan di tahun lalu:

  • Data set dari kunjungan ke perpustakaan yang telah diurutkan: 0, 3, 3, 12, 15, 24
  • Middle numbers (angka yang berada di tengah): 3, 12
  • Median, karena terdapat dua angka yang terdapat di tengah, maka kita perlu menghitung mean dari dua angka tersebut: (3+12)/2 = 7.5

Cara menghitung mode:

Mode adalah nilai yang paling sering muncul dalam sebuah data set. Sebuah data set bisa saja memiliki satu mode, lebih dari satu, atau tidak sama sekali. Agar mode dapat ditemukan dengan mudah, kamu perlu menyusun nilai respons dari yang terkecil hingga terbesar.

Angka mode dari kunjungan ke perpustakaan di tahun lalu:

  • Data set dari kunjungan ke perpustakaan yang telah diurutkan: 0, 3, 3, 12, 15, 24
  • Mode: dari sini kita tahu bahwa 3 adalah angka yang paling sering muncul

Pengukuran Variabilitas

Pengukuran variabilitas memberi tahumu tentang tingkat persebaran nilai-nilai dari sebuah variabel yang didapatkan setelah survey atau pengamatan. Range, standard deviation, dan variance akan memperlihatkan aspek-aspek yang berbeda dari persebaran nilai (spread).

Range

Range akan memberikan kamu gambaran tentang seberapa jauh perbedaan antara dua nilai yang berada pada titik ekstrem dari sebuah data set. Untuk menemukan range, kamu dapat melakukan pengurangan antara nilai yang paling tinggi dengan nilai yang paling rendah dari sebuah data set:

Range dari kunjungan ke perpustakaan di masa lalu:

  • Data set yang telah diurutkan: 0, 3, 3, 12, 15, 24
  • Range (pengurangan antara nilai yang paling tinggi dengan nilai paling rendah): 24 – 0 = 24

Standard Deviation (Simpangan Baku)

Standard deviation adalah nilai variabilitas rata-rata dari sebuah data set. Standard deviation dapat memberi informasi tentang seberapa jauh berbeda nilai dari sebuah variabel terhadap angka rata-ratanya (re: penyimpangan). Standard deviation dilambangkan dengan (s).

Ada 6 langkah yang harus dilakukan untuk mengalkulasi standard deviation:

  1. Buat daftar nilai yang kamu dapatkan dari survey atau pengamatan dan temukan angka rata-ratanya (mean)
  2. Kurangkan tiap nilai dengan angka rata-rata untuk mengetahui besarnya deviasi (penyimpangan dari angka rata-rata)
  3. Hitung nilai kuadrat dari tiap deviasi tersebut
  4. Jumlahkan hasil dari deviasi yang telah di-kuadrat-kan
  5. Bagi hasil penjumlahan tadi dengan N-1 (jumlah respons – 1)
  6. Temukan hasil akar kuadrat dari pembagian di langkah ke 5

Contoh kalkulasi simpangan baku:

  • Data set yang telah diurutkan: 0, 3, 3, 12, 15, 24
  • Kita tahu mean dari data set ini adalah 9.5
  • Mari kita temukan besarnya deviasi untuk setiap nilai:
  • Setelah mengetahui jumlah total dari angka deviasi kuadrat, kita dapat membaginya dengan N-1: 421.5 / (6-1) = 84.3
  • Pada langkah terakhir, kita dapat menemukan standard deviation dengan menghitung hasil akar dari pembagian di atas: √84.3 = 9.18
  • Setelah mengetahui hasilnya, bisa dibilang jika secara rata-rata, terdapat deviasi nilai sebesar 9.18 dari mean (dalam kasus kunjungan ke perpustakaan di tahun lalu).

Variance (Variansi)

Pada intinya, variansi tak begitu berbeda dengan standard deviation. Variansi dapat mencerminkan tentang tingkat persebaran nilai dari sebuh data set. Semakin tersebar nilai yang ada pada data, maka semakin besar pula variansi.

Cara menghitung variansi juga sederhana, yakni dengan menemukan hasil kuadrat dari standard deviation.

Contoh kalkulasi variance:

  • Data set yang telah diurutkan: 0, 3, 3, 12, 15, 24
  • Kita tahu simpangan baku (s) dari data set tersebut adalah: 9.18
  • Maka variance (s2) dari data set ini adalah: 9.182 = 84.3

Univariate Descriptive Statistics

Saat melakukan univariate descriptive statistics, peneliti hanya akan fokus melihat karakteristik dari satu variabel dalam satu waktu; mengevaluasi data dari tiap variabel secara terpisah dengan memperhatikan distribusi, tendensi sentral dan persebarannya adalah hal inti dari univariate descriptive statistics. Software statistik seperti SPSS, Excel, Eviews dsb dapat kamu gunakan untuk menghasilkan univariate descriptive statistics secara otomatis.

Berikut adalah contoh dari univariate descriptive statistics pada kasus kunjungan ke perpustakaan:

Jika kita hanya mendasarkan pertimbangan mengenai tendensi sentral dari sebuah data set pada mean (angka rata-rata) saja, maka pandangan kita mengenai “titik tengah” dapat “terganggu” oleh outlier (nilai yang besarnya tidak wajar / tidak mengikuti data lain pada umumnya). Sementara dengan median, kamu benar-benar akan mengetahui nilai tengah dari sebuah data set.

Sama halnya dengan range yang hasilnya sangat sensitif terhadap nilai ekstrim yang ada dalam sebuah data set. Dengan mengandalkan standard deviation dan variansi, kamu akan mendapatkan gambaran yang lebih utuh tentang persebaran dari data set.

Bivariate Descriptive Statistics

Jika terdapat lebih dari satu variabel yang kamu kumpulkan dalam penelitian, kamu juga bisa menggunakan bivariate atau multivariate statistics untuk mengetahui apakah terdapat hubungan antara beberapa variabel. Dengan metode ini juga, kamu dapat mencari tahu tentang frekuensi dan variabilitas dari variabel-varibel tersebut secara bersamaan untuk melihat keterkaitan. Contingency table dan scatter plots adalah dua metode bivariate descriptive statistics sederhana yang dapat kamu terapkan.

Contingency table

Dalam sebuah contingency table, setiap sel nya mewakili titik pertemuan antara dua variabel. Biasanya, sebuah independent variable (seperti: jenis kelamin) dituliskan pada sumbu vertikal, sementara dependent variabel (seperti: aktivitas) diletakkan pada sumbu horizontal.

Contoh:

Agar lebih mudah untuk menganalisa apa yang ditunjukkan oleh data pada contingency table, kita bisa mengonversi angka data mentah menjadi persentase.

Contoh:

Dengan mengubahnya menjadi persentase seperti di atas, kita bisa lebih mudah untuk mengetahui preferensi dari masing-masing jenis kelamin. Selain itu, perlu untuk menambahkan kolom N (total jumlah respons) di ujung kanan dari tabel untuk mempermudah pembaca menemukan angka mentah dari data.

Dari tabel ke-dua, kita bisa mengetahui bahwa proporsi pria dan wanita yang mengunjungi perpustakaan lebih dari 17 kali hampir sama. Dari tabel kedua kita juga tahu bahwa sebagian besar pria berkunjung ke perpustakaan hanya 5 hingga 8 kali, sementara wanita mengunjunginya antara 13 hingga 16 kali di tahun lalu.

Scatter Plots

Scatter plot adalah sebuah diagram yang menunjukkan kepada peneliti mengenai keberadaan hubungan antara dua atau tiga variabel; representasi visual ini juga mampu menggambarkan kekuatan hubungan antar variabel. Sama halnya dengan contingency table, untuk melihat keterkaitan, tiap-tiap variabel perlu di-plot di sumbu x (horizontal) dan sumbu y (vertikal). Setiap titik yang ada pada diagram mewakili titik pertemuan antara nilai dari beberapa variabel yang berbeda.

Contoh scatter plot antara Variabel “Kunjungan ke Perpustakaan” dengan “Kunjungan ke Bioskop”

Kamu ingin mencari tahu apakah orang yang lebih suka mengunjungi perpustakaan akan cenderung jarang berkunjung ke bioskop. Maka dari itu, untuk melihat keterkaitan dari data secara visual, kamu mem-plot jumlah kunjungan peserta ke bioskop pada sumbu x (horizontal), sementara kunjungan ke perpustkaan di-plot pada sumbu y (vertikal).

Berdasarkan representasi visual pada scatter plot, kamu dapat melihat bahwa seiring dengan menurunnya jumlah kunjungan ke perpustakaan, jumlah kunjungan dari tiap peserta ke bioskop meningkat. Dari penilaian secara visual ini, sangat memungkinkan bahwa terdapat “linear relationship” yang terbentuk sehingga perlu dilakukan pengujian lebih jauh terkait dengan correlation (korelasi) dan regression (regresi).

Scatter Plot | Sumber Gambar : Scribbr.com

Comments

Add a comment
%d bloggers like this: