Memahami Statistik Deskriptif: Mengungkap Rahasia Data

Dipublikasikan oleh Muhammad Ilham Maulana

28 Maret 2024, 08.32

Sumber: Wikipedia

Statistik deskriptif adalah sekumpulan statistik ringkasan yang secara kuantitatif menggambarkan atau merangkum fitur dari kumpulan informasi, sedangkan statistik deskriptif merupakan proses penggunaan dan analisis statistik tersebut. Tujuan statistik deskriptif adalah untuk merangkum sampel data, bukan untuk menggunakan data tersebut untuk mempelajari populasi yang dianggap mewakili sampel data tersebut. Ini berbeda dengan statistik inferensial, yang bertujuan untuk membuat kesimpulan tentang populasi berdasarkan sampel data yang diperoleh.

Statistik deskriptif umumnya tidak dikembangkan berdasarkan teori probabilitas, dan seringkali merupakan statistik nonparametrik. Meskipun analisis data utamanya menggunakan statistik inferensial, statistik deskriptif biasanya juga disajikan. Misalnya, dalam laporan penelitian tentang subjek manusia, biasanya terdapat tabel yang mencantumkan ukuran sampel keseluruhan, ukuran sampel dalam subkelompok penting, dan karakteristik demografis atau klinis seperti usia rata-rata, proporsi subjek dari setiap jenis kelamin, proporsi subjek dengan penyakit penyerta terkait, dll.

Beberapa ukuran yang umum digunakan untuk menggambarkan kumpulan data adalah ukuran pusat dan ukuran keragaman atau dispersi. Ukuran pusat meliputi mean, median, dan mode, sedangkan ukuran keragaman meliputi standar deviasi (atau varians), nilai minimum dan maksimum variabel, kurtosis, dan skewness. Dengan memahami dan menggunakan statistik deskriptif ini, kita dapat mengungkap rahasia yang tersembunyi dalam data dan membuat kesimpulan yang lebih tepat tentang populasi yang direpresentasikan oleh sampel data tersebut.

Penggunaan Analisis Statistik

Penggunaan statistik deskriptif dan ringkasan memiliki sejarah yang luas, dan, memang, tabulasi sederhana dari populasi dan data ekonomi adalah cara pertama topik statistik muncul. Lebih baru-baru ini, kumpulan teknik summarisasi telah dirumuskan di bawah judul analisis data eksploratori: contoh dari teknik tersebut adalah diagram kotak.

Di dunia bisnis, statistik deskriptif memberikan ringkasan yang berguna tentang berbagai jenis data. Misalnya, investor dan pialang dapat menggunakan catatan historis perilaku pengembalian dengan melakukan analisis empiris dan analitis pada investasi mereka untuk membuat keputusan investasi yang lebih baik di masa depan.

Analisis Univariat Analisis univariat melibatkan deskripsi distribusi variabel tunggal, termasuk kecenderungan pusatnya (termasuk rata-rata, median, dan modus) dan dispersinya (termasuk rentang dan kuartil dari data-set, dan ukuran penyebaran seperti varians dan standar deviasi). Bentuk distribusi juga dapat dijelaskan melalui indeks seperti skewness dan kurtosis. Karakteristik distribusi variabel juga dapat digambarkan dalam format grafis atau tabular, termasuk histogram dan stem-and-leaf display.

Analisis Bivariat dan Multivariat Ketika sampel terdiri dari lebih dari satu variabel, statistik deskriptif dapat digunakan untuk menggambarkan hubungan antara pasangan variabel. Dalam hal ini, statistik deskriptif meliputi:

Tabulasi silang dan tabel kontingensi Representasi grafis melalui scatterplot Ukuran kuantitatif ketergantungan Deskripsi distribusi kondisional Alasan utama untuk membedakan analisis univariat dan bivariat adalah bahwa analisis bivariat tidak hanya merupakan analisis deskriptif sederhana, tetapi juga menjelaskan hubungan antara dua variabel yang berbeda. Ukuran kuantitatif ketergantungan meliputi korelasi (seperti Pearson's r ketika kedua variabel kontinu, atau rho Spearman jika satu atau kedua variabel tidak) dan kovariansi (yang mencerminkan skala variabel diukur). Kemiringan, dalam analisis regresi, juga mencerminkan hubungan antara variabel. Kemiringan yang tidak distandardisasi menunjukkan perubahan unit dalam variabel kriteria untuk perubahan satu unit dalam prediktor. Kemiringan distandardisasi menunjukkan perubahan ini dalam unit standar (z-score). Data yang sangat miring sering kali ditransformasi dengan mengambil logaritma. Penggunaan logaritma membuat grafik lebih simetris dan terlihat lebih mirip dengan distribusi normal, sehingga lebih mudah diinterpretasikan secara intuitif.

 

Disadur dari: id.wikipedia.org