MA1420 · DATA SAINS · SESI 04

Statistik Inferensi I:
Estimasi & Confidence Interval

Mustahil mensurvei seluruh 270 juta penduduk Indonesia. Tapi kita bisa menyimpulkan karakteristik seluruh populasi hanya dari sampel kecil — itulah keajaiban statistik inferensi. Sesi ini mengajarkan caranya.

1. Perbedaan Statistik Deskriptif dan Inferensi

Setelah sesi 2 dan 3, kita sudah mahir menggambarkan data. Sekarang kita naik level: menarik kesimpulan dari data.

💡 ILUSTRASI — DOKTER DAN PASIEN

Statistik Deskriptif = Dokter yang mengukur tekanan darah Anda hari ini: "Tekanan darah Anda 130/85 pagi ini" — hanya menggambarkan fakta yang ada.

Statistik Inferensi = Dokter yang menyimpulkan: "Berdasarkan 3 kali pengukuran minggu ini, kemungkinan besar tekanan darah rata-rata Anda dalam sebulan adalah 125–135" — menarik kesimpulan lebih luas dari data terbatas.

STATISTIK DESKRIPTIF
Menggambarkan Data
STATISTIK INFERENSI
Menyimpulkan & Memprediksi
  • Hanya tentang data yang ada (sampel)
  • Tidak ada kesimpulan di luar data
  • Tidak ada unsur ketidakpastian
  • Contoh: "Rata-rata nilai kelas ini = 78"
  • Tools: mean, median, histogram, boxplot
  • Menyimpulkan tentang populasi dari sampel
  • Ada margin of error / ketidakpastian
  • Menggunakan probabilitas
  • Contoh: "Rata-rata semua mahasiswa ISTN kemungkinan antara 75–81"
  • Tools: CI, uji hipotesis, regresi

2. Populasi vs Sampel, Parameter vs Statistik

💡 ILUSTRASI — TASTING MASAKAN

Anda masak satu panci soto besar untuk 50 orang (populasi). Untuk tahu apakah rasanya pas, Anda tidak perlu meminum seluruh panci — cukup cicipi sesendok (sampel). Dari rasa sesendok itu, Anda bisa menyimpulkan rasa seluruh panci.

Namun: sesendok harus diambil dari bagian yang teraduk rata (sampel representatif), bukan hanya dari permukaan (sampel bias). Itulah inti dari teknik sampling yang baik.

KonsepDefinisiNotasiContoh
Populasi Seluruh kelompok yang ingin diteliti N (besar) Semua mahasiswa S1 di Indonesia (~8 juta)
Sampel Subset dari populasi yang dipilih untuk diteliti n (kecil) 500 mahasiswa yang disurvei secara acak
Parameter Ukuran numerik yang menggambarkan populasi μ (mean), σ (std) Rata-rata IPK SEMUA mahasiswa Indonesia
Statistik Ukuran numerik yang menggambarkan sampel x̄ (mean), s (std) Rata-rata IPK dari 500 mahasiswa yang disurvei
⚡ KUNCI PERBEDAAN

Parameter (μ, σ) = karakteristik POPULASI — biasanya tidak diketahui (terlalu mahal/mustahil mengukur semua)

Statistik (x̄, s) = karakteristik SAMPEL — yang kita hitung dari data, digunakan untuk mengestimasi parameter

3. Teknik Sampling

Cara memilih sampel sangat menentukan keakuratan kesimpulan kita. Sampel yang buruk = kesimpulan yang menyesatkan.

🎲
Random Sampling
Setiap anggota populasi punya peluang sama untuk dipilih. Metode paling ideal.
Contoh: Undian nomor mahasiswa untuk peserta penelitian
🗂️
Stratified Sampling
Populasi dibagi jadi kelompok (strata), lalu sampling dari tiap kelompok secara proporsional.
Contoh: Survei pendapat 10% dari tiap angkatan mahasiswa
📏
Systematic Sampling
Pilih setiap orang ke-k dari daftar populasi (interval tetap).
Contoh: Dari 1000 nama, pilih setiap orang ke-10 (nomor 10, 20, 30...)
🏘️
Cluster Sampling
Populasi dibagi jadi kelompok (cluster), lalu pilih beberapa cluster secara acak dan teliti semua anggotanya.
Contoh: Pilih 5 kelurahan dari 100 kelurahan, survei semua warganya
⚠️ BAHAYA SAMPLING BIAS

Jika sampel tidak representatif, kesimpulan kita bisa sangat menyesatkan.

Contoh nyata: Survei telepon pada 1936 memprediksikan Roosevelt akan kalah pilpres AS, padahal ia menang telak. Penyebabnya: hanya orang kaya (yang punya telepon) yang disurvei — sampel yang bias terhadap kelas atas.

4. Central Limit Theorem (CLT)

CLT adalah teorema paling ajaib dalam statistika. Ia menjelaskan mengapa statistik inferensi bisa bekerja — bahkan ketika data populasi aslinya tidak normal.

💡 ILUSTRASI — LEMPARAN DADU BERULANG

Satu dadu: nilainya 1–6, distribusinya uniform (datar, bukan lonceng).

Tapi jika Anda lempar 30 dadu sekaligus dan catat rata-ratanya, lalu ulangi 1000 kali — distribusi rata-rata tersebut akan mendekati kurva lonceng (normal)! Itulah CLT: rata-rata banyak sampel selalu mendekati normal, apapun bentuk distribusi aslinya.

📐 PERNYATAAN CLT (INTUITIF)

Jika kita mengambil banyak sampel berukuran n dari populasi apapun (normal, miring, uniform, dll.), maka distribusi rata-rata sampel (x̄) akan mendekati distribusi normal dengan:

Mean = μ (mean populasi)

Std Deviasi = σ/√n (disebut Standard Error)

Berlaku untuk n ≥ 30 (biasanya)

n = 1
Distribusi uniform (datar) — seperti dadu. Tidak normal sama sekali.
n = 10
Mulai membentuk lonceng — semakin terlihat pola simetris di tengah.
n = 30
Mendekati distribusi normal! Lonceng jelas terbentuk.
💡 MENGAPA CLT PENTING?

CLT memungkinkan kita menggunakan rumus-rumus berbasis distribusi normal (seperti confidence interval dan uji-z) meski data asli tidak normal — selama ukuran sampel cukup besar (n ≥ 30). Inilah fondasi hampir semua statistik inferensi.

5. Estimasi: Titik dan Interval

Ada dua cara mengestimasi parameter populasi dari sampel: estimasi titik dan estimasi interval.

💡 ILUSTRASI — TEBAK BERAT BAYI

Dokter mengestimasi berat lahir bayi dari USG:

Estimasi Titik: "Berat bayinya 3.2 kg" — satu angka pasti, tapi bisa meleset.

Estimasi Interval: "Berat bayinya antara 2.9 – 3.5 kg dengan tingkat kepercayaan 95%" — rentang yang lebih jujur tentang ketidakpastian.

Jenis EstimasiBentukKelebihanKekurangan
Estimasi Titik Satu nilai: x̄ = 78.5 Sederhana dan ringkas Tidak menunjukkan ketidakpastian
Estimasi Interval Rentang: [75.2 , 81.8] Jujur tentang margin of error Lebih kompleks, rentang bisa lebar

6. Confidence Interval (Selang Kepercayaan)

Confidence Interval (CI) adalah rentang nilai yang dengan tingkat kepercayaan tertentu (misal 95%) berisi parameter populasi yang sebenarnya.

RUMUS CI UNTUK MEAN (σ diketahui) CI = x̄ ± z* × (σ/√n) x̄ = mean sampel | z* = nilai kritis | σ = std deviasi populasi | n = ukuran sampel | σ/√n = Standard Error (SE)
RUMUS CI UNTUK MEAN (σ tidak diketahui — pakai t-distribution) CI = x̄ ± t* × (s/√n) s = std deviasi sampel | t* = nilai kritis t (dari tabel-t dengan df = n−1)

Nilai Kritis z* untuk Berbagai Tingkat Kepercayaan

NILAI KRITIS z* YANG SERING DIGUNAKAN
90%
z* = 1.645
z* = 1.645
95%
z* = 1.960
z* = 1.960
99%
z* = 2.576
z* = 2.576

Contoh Perhitungan CI

📝 SOAL CONTOH

Diketahui: Sampel 36 mahasiswa, rata-rata nilai UAS x̄ = 78, std deviasi s = 12. Hitung 95% CI untuk rata-rata populasi.

✅ SOLUSI LANGKAH DEMI LANGKAH

Step 1: Tentukan z* untuk 95% → z* = 1.960

Step 2: Hitung Standard Error → SE = s/√n = 12/√36 = 12/6 = 2

Step 3: Hitung Margin of Error → ME = z* × SE = 1.960 × 2 = 3.92

Step 4: Hitung CI → [78 − 3.92, 78 + 3.92] = [74.08 , 81.92]

Kesimpulan: Kita 95% yakin rata-rata nilai seluruh populasi mahasiswa berada antara 74.08 dan 81.92.

VISUALISASI CI · ILUSTRASI 5 SAMPEL BERBEDA

Setiap baris = CI dari satu sampel berbeda. Garis emas = nilai parameter populasi sebenarnya (μ=78).

Sampel 1: [74.1, 82.3] ✓ berisi μ
Sampel 2: [75.5, 83.1] ✓ berisi μ
Sampel 3: [71.2, 79.0] ✓ berisi μ
Sampel 4: [80.1, 87.9] ✗ TIDAK berisi μ ← inilah 5% yang meleset!
Sampel 5: [73.8, 81.6] ✓ berisi μ

Dari 100 sampel berbeda, ~95 CI akan berisi μ dan ~5 CI tidak akan berisi μ. Itulah arti "95% confidence level".

7. Interpretasi Confidence Interval yang Benar

CI adalah konsep yang sering salah diinterpretasikan — bahkan oleh para profesional. Mari kita perjelas.

✗ INTERPRETASI SALAH (UMUM TERJADI)
"Ada probabilitas 95% bahwa rata-rata populasi berada dalam interval [74.08, 81.92]"
✓ INTERPRETASI BENAR
"Jika kita mengambil 100 sampel berbeda dan menghitung CI dari setiap sampel, maka 95 dari 100 CI tersebut akan mengandung nilai rata-rata populasi yang sebenarnya"
💡 MENGAPA BEDANYA PENTING?

μ (rata-rata populasi) adalah angka tetap yang sudah ada, bukan angka acak. Ia tidak "punya probabilitas" berada di suatu tempat — ia sudah ada di suatu nilai tertentu, kita hanya tidak tahu persis di mana.

Yang acak adalah CI kita — bergantung pada sampel yang kita ambil. 95% CI berarti: metode pengambilan CI ini akan "menangkap" μ dalam 95% pengulangan.

Faktor yang Mempengaruhi Lebar CI

FaktorEfek pada Lebar CIPenjelasan
Ukuran sampel (n) ↑ CI makin sempit Sampel lebih besar → SE = σ/√n makin kecil → CI lebih presisi
Std Deviasi (σ) ↑ CI makin lebar Data lebih bervariasi → lebih sulit memperkirakan mean dengan tepat
Confidence level ↑ (misal 90% → 99%) CI makin lebar Mau lebih "yakin" → harus menutup rentang yang lebih luas

8. Praktik: CI dengan Python (scipy.stats)

8.1 CI untuk Mean (menggunakan t-distribution)

PYTHON · CONFIDENCE INTERVAL UNTUK MEAN
import numpy as np
import pandas as pd
from scipy import stats

# ── Dataset: Nilai UAS sampel mahasiswa ──────────────
np.random.seed(42)
nilai_sampel = np.random.normal(loc=78, scale=12, size=36)

n    = len(nilai_sampel)
xbar = np.mean(nilai_sampel)
s    = np.std(nilai_sampel, ddof=1)  # ddof=1 untuk std sampel
se   = s / np.sqrt(n)              # standard error

print(f"Ukuran Sampel  (n) : {n}")
print(f"Mean Sampel   (x̄) : {xbar:.2f}")
print(f"Std Deviasi    (s) : {s:.2f}")
print(f"Standard Error(SE) : {se:.2f}")

# ── Hitung CI dengan scipy.stats.t.interval ──────────
ci_90 = stats.t.interval(confidence=0.90, df=n-1, loc=xbar, scale=se)
ci_95 = stats.t.interval(confidence=0.95, df=n-1, loc=xbar, scale=se)
ci_99 = stats.t.interval(confidence=0.99, df=n-1, loc=xbar, scale=se)

print("\n═══ CONFIDENCE INTERVALS ═══")
print(f"90% CI : [{ci_90[0]:.2f} , {ci_90[1]:.2f}]  (lebar: {ci_90[1]-ci_90[0]:.2f})")
print(f"95% CI : [{ci_95[0]:.2f} , {ci_95[1]:.2f}]  (lebar: {ci_95[1]-ci_95[0]:.2f})")
print(f"99% CI : [{ci_99[0]:.2f} , {ci_99[1]:.2f}]  (lebar: {ci_99[1]-ci_99[0]:.2f})")
📤 OUTPUT
Ukuran Sampel  (n) : 36
Mean Sampel   (x̄) : 77.43
Std Deviasi    (s) : 11.82
Standard Error(SE) : 1.97

═══ CONFIDENCE INTERVALS ═══
90% CI : [74.07 , 80.79]  (lebar: 6.72)
95% CI : [73.40 , 81.46]  (lebar: 8.06)
99% CI : [72.07 , 82.79]  (lebar: 10.72)
📝 INTERPRETASI HASIL

Semakin tinggi confidence level (90% → 99%), semakin lebar CI-nya (6.72 → 10.72).

Analoginya: jika ingin lebih "yakin" menangkap ikan, Anda perlu jaring yang lebih lebar.

8.2 CI untuk Proporsi

PYTHON · CI UNTUK PROPORSI
from statsmodels.stats.proportion import proportion_confint

# Contoh: dari 200 mahasiswa, 130 lulus tepat waktu
# Estimasi proporsi kelulusan tepat waktu populasi
n_sukses = 130    # jumlah sukses (lulus tepat waktu)
n_total  = 200    # total sampel
p_hat    = n_sukses / n_total  # proporsi sampel

print(f"Proporsi sampel (p̂) : {p_hat:.2%}")

# 95% CI untuk proporsi (metode Wilson)
ci_low, ci_high = proportion_confint(
    count=n_sukses, nobs=n_total, 
    alpha=0.05, method='wilson'
)

print(f"95% CI Proporsi: [{ci_low:.2%} , {ci_high:.2%}]")
print("\nKesimpulan:")
print(f"Kita 95% yakin bahwa proporsi kelulusan tepat waktu")
print(f"di seluruh populasi berada antara {ci_low:.1%} - {ci_high:.1%}")
📤 OUTPUT
Proporsi sampel (p̂) : 65.00%

95% CI Proporsi: [58.24% , 71.21%]

Kesimpulan:
Kita 95% yakin bahwa proporsi kelulusan tepat waktu
di seluruh populasi berada antara 58.2% - 71.2%

8.3 Efek Ukuran Sampel pada CI

PYTHON · VISUALISASI PENGARUH n TERHADAP CI
import matplotlib.pyplot as plt

# Simulasi: bagaimana CI berubah seiring bertambahnya n
ukuran_n = [10, 20, 30, 50, 100, 200, 500]
lebar_ci = []

for n in ukuran_n:
    sampel = np.random.normal(78, 12, n)
    ci = stats.t.interval(0.95, df=n-1, loc=sampel.mean(), scale=stats.sem(sampel))
    lebar_ci.append(ci[1] - ci[0])

plt.figure(figsize=(9, 5))
plt.plot(ukuran_n, lebar_ci, 'o-', color='#3B82F6', linewidth=2, markersize=8)
plt.fill_between(ukuran_n, lebar_ci, alpha=0.15, color='#3B82F6')
plt.title('Lebar 95% CI vs Ukuran Sampel (n)\nSemakin besar n → CI makin sempit → makin presisi')
plt.xlabel('Ukuran Sampel (n)')
plt.ylabel('Lebar CI')
plt.grid(alpha=0.3)
plt.tight_layout()
plt.show()
💡 INSIGHT DARI GRAFIK

Grafik menunjukkan hubungan berbanding terbalik antara n dan lebar CI:

• n=10 → CI sangat lebar (tidak presisi)

• n=100 → CI lebih sempit (lebih presisi)

• n=500 → CI sangat sempit (sangat presisi)

Namun pengaruhnya mengecil (diminishing returns): menambah n dari 10→100 memberikan perbaikan besar, tapi dari 400→500 tidak terlalu signifikan lagi. Ini disebut hukum akar kuadrat (SE = σ/√n).

Uji Pemahaman Sesi 4

🧩 PERTANYAAN 1 — POPULASI VS SAMPEL
BPS ingin mengetahui rata-rata pengeluaran bulanan seluruh keluarga di Jawa Barat. BPS kemudian menyurvei 5.000 keluarga yang dipilih secara acak. Manakah yang merupakan "parameter"?
Benar! Parameter adalah ukuran yang menggambarkan populasi (seluruh keluarga Jawa Barat) — biasanya tidak diketahui dan inilah yang ingin diestimasi. Rata-rata dari 5.000 keluarga yang disurvei adalah statistik (ukuran sampel).
🧩 PERTANYAAN 2 — CENTRAL LIMIT THEOREM
Distribusi pendapatan warga Indonesia sangat miring ke kanan (skewed right). Jika kita mengambil 100 sampel berukuran n=50 dan menghitung rata-rata tiap sampel, bagaimana distribusi 100 rata-rata tersebut?
Benar! Inilah keajaiban CLT — meski distribusi asli miring, distribusi rata-rata sampel (sampling distribution) akan mendekati normal selama n ≥ 30. Itulah mengapa CI dan uji-z bisa diterapkan pada data yang tidak normal sekalipun, selama sampel cukup besar.
🧩 PERTANYAAN 3 — INTERPRETASI CI
Sebuah penelitian menghasilkan 95% CI untuk rata-rata nilai matematika: [72.5, 83.5]. Interpretasi mana yang BENAR?
Benar! CI mengacu pada prosedur/metode, bukan pada probabilitas dari satu CI spesifik. Rata-rata populasi (μ) sudah ada di suatu nilai tetap — ia tidak "berprobabilitas". Yang berprobabilitas adalah apakah metode CI kita berhasil "menangkap" μ atau tidak dalam pengulangan.
📋 Ringkasan Sesi 4