Tujuan Hari Ketiga
Pada hari ini, kamu akan mulai belajar tentang dasar-dasar statistik yang penting untuk memahami dan menganalisis data. Statistik adalah inti dari banyak analisis data, sehingga memahami konsep-konsep dasar seperti mean, median, mode, dan distribusi akan sangat membantu dalam tugas-tugas data analyst.
Materi Hari Ketiga
1. Pengenalan Statistik Dasar
Statistik adalah ilmu yang mempelajari pengumpulan, analisis, interpretasi, dan penyajian data.
Dalam data analytics, statistik digunakan untuk memahami pola data, membuat prediksi, dan mengambil keputusan berdasarkan data tersebut.
2. Konsep Penting dalam Statistik
Mean (Rata-rata): Nilai rata-rata dari sekumpulan data. Ini dihitung dengan menjumlahkan semua nilai dan membaginya dengan jumlah data.
Median: Nilai tengah dari sekumpulan data ketika data tersebut diurutkan. Jika jumlah data genap, median adalah rata-rata dari dua nilai tengah.
Mode: Nilai yang paling sering muncul dalam sekumpulan data.
Range (Rentang): Perbedaan antara nilai maksimum dan minimum dalam data.
Standard Deviation (Deviasi Standar): Mengukur seberapa tersebar data dari rata-rata. Deviasi standar yang tinggi menunjukkan data yang lebih tersebar, sedangkan yang rendah menunjukkan data yang lebih terkonsentrasi di sekitar rata-rata.
3. Distribusi Data
Distribusi Normal: Distribusi data berbentuk lonceng, di mana sebagian besar data berada di sekitar mean.
Distribusi Positif/Negatif: Ketika data miring ke kanan (positif) atau ke kiri (negatif), yang berarti ada bias dalam distribusi data.
Aktivitas Hari Ketiga
1. Menghitung Mean, Median, dan Mode di Excel
Buka dataset di Excel atau Google Sheets yang berisi nilai numerik (misalnya data penjualan).
Gunakan fungsi berikut:
Mean: =AVERAGE(range)
Median: =MEDIAN(range)
Mode: =MODE.SNGL(range)
Terapkan fungsi-fungsi ini ke dataset yang kamu gunakan untuk melihat hasilnya.
2. Menghitung Standard Deviation di Excel
Gunakan fungsi =STDEV(range) untuk menghitung deviasi standar dari dataset yang kamu pilih.
Bandingkan data yang tersebar dengan data yang terkonsentrasi di sekitar nilai rata-rata.
3. Visualisasi Distribusi Data
Coba buat histogram di Excel atau Google Sheets untuk memvisualisasikan distribusi data. Histogram akan membantu memahami sebaran data (misalnya apakah data mengikuti distribusi normal atau miring).
Untuk membuat histogram, pilih tab Insert → Histogram, lalu pilih rentang data yang ingin kamu visualisasikan.
Contoh Hari Ketiga
Contoh Dataset: Misalnya, jika kamu memiliki dataset penjualan dengan kolom "Pendapatan Harian", kamu bisa menghitung rata-rata, median, dan mode untuk melihat bagaimana pendapatan harian berfluktuasi.
Contoh Visualisasi: Dengan histogram, kamu dapat melihat distribusi pendapatan harian. Apakah sebagian besar hari memiliki pendapatan yang konsisten, atau ada beberapa hari dengan pendapatan yang jauh lebih tinggi atau rendah?
---
Esensi Hari Ketiga: Memahami statistik dasar adalah langkah penting dalam perjalananmu menjadi data analyst. Statistik membantu dalam menganalisis dan menafsirkan data dengan lebih baik, sehingga kamu dapat menarik kesimpulan yang valid. Pastikan untuk berlatih menghitung berbagai ukuran statistik dan memahami distribusi data yang sedang kamu analisis.


Komentar
Posting Komentar