Hari ke-2: Mengenal Tipe Data dan Data Structure

Tujuan Hari Kedua

Pada hari kedua, kamu akan mempelajari berbagai jenis data yang sering digunakan dalam analisis, serta bagaimana data tersebut disusun dalam bentuk yang dapat diproses. Ini penting agar kamu bisa memilih teknik analisis yang tepat berdasarkan jenis data yang sedang dianalisis.

Materi Hari Kedua

1. Tipe Data dalam Data Analytics

Data Numerik: Data yang berbentuk angka, seperti harga, kuantitas, suhu, atau berat. Tipe data ini sering digunakan untuk menghitung dan melakukan analisis statistik.

Data Kategorikal: Data yang berbentuk kategori atau label, seperti nama produk, warna, atau tipe pelanggan. Biasanya digunakan untuk pengelompokan atau klasifikasi.

Data Waktu (Time Series): Data yang diambil pada waktu tertentu, seperti data penjualan harian, data suhu per jam, atau data saham harian. Ini digunakan untuk menganalisis tren dan pola waktu.

Data Teks: Data berupa kata atau kalimat, seperti ulasan pelanggan, tweet, atau dokumen teks. Data ini bisa diolah dengan teknik Natural Language Processing (NLP).



2. Data Structure (Struktur Data)

Dataset: Kumpulan data yang biasanya terdiri dari baris dan kolom. Setiap baris mewakili satu entitas (misalnya, satu pelanggan), dan setiap kolom mewakili satu variabel (misalnya, umur atau jenis kelamin).

Array: Struktur data yang sering digunakan dalam bahasa pemrograman seperti Python, tempat elemen data disimpan dalam satu baris atau kolom.

Data Frame: Dalam Python (Pandas), data frame adalah struktur data yang menyerupai tabel, dengan kolom dan baris, mirip dengan spreadsheet.

Aktivitas Hari Kedua

1. Latihan Mengidentifikasi Tipe Data

Ambil dataset sederhana, seperti daftar produk dengan harga dan kategori. Identifikasi kolom mana yang termasuk data numerik, kategorikal, atau waktu.

Contoh Dataset: Gunakan dataset penjualan produk (misalnya, produk, harga, kategori, dan tanggal penjualan). Buka di Excel atau Google Sheets, dan buat tabel dengan label tipe data di setiap kolom.

2. Memahami Struktur Data di Python

Buka Python (atau Jupyter Notebook jika sudah diinstal), dan pelajari bagaimana membuat array sederhana menggunakan Numpy serta data frame menggunakan Pandas.

Kode Python Sederhana:

import numpy as np
import pandas as pd

# Membuat array
arr = np.array([1, 2, 3, 4, 5])
print(arr)

# Membuat data frame
data = {'Product': ['A', 'B', 'C'], 'Price': [100, 150, 200]}
df = pd.DataFrame(data)
print(df)

3. Eksperimen dengan Excel/Google Sheets

Di Excel, coba buat pivot table sederhana menggunakan dataset yang kamu miliki. Pivot table ini akan membantu memahami cara data terstruktur dalam tabel dan bagaimana data bisa dianalisis lebih lanjut.

Contoh Hari Kedua

Tipe Data: Misalnya, jika kamu memiliki dataset pelanggan dengan kolom "Usia", "Jenis Kelamin", dan "Penghasilan", maka:

Usia: Data Numerik.

Jenis Kelamin: Data Kategorikal.

Penghasilan: Data Numerik.


Struktur Data: Dalam Python, dataset yang sama bisa disusun dalam bentuk data frame:

data = {'Nama': ['John', 'Sarah', 'Alice'], 'Usia': [28, 32, 24], 'Jenis Kelamin': ['Pria', 'Wanita', 'Wanita']}
df = pd.DataFrame(data)
print(df)

---

Esensi Hari Kedua: Hari kedua ini penting untuk memahami berbagai jenis data yang akan sering kamu temui dalam analisis, serta bagaimana data tersebut diorganisir dalam alat-alat yang akan kamu gunakan. Pastikan untuk terus berlatih menggunakan dataset nyata agar lebih familiar dengan konsep-konsep ini.

Komentar