Statistik Inferensi I:
Estimasi & Confidence Interval
Mustahil mensurvei seluruh 270 juta penduduk Indonesia. Tapi kita bisa menyimpulkan karakteristik seluruh populasi hanya dari sampel kecil — itulah keajaiban statistik inferensi. Sesi ini mengajarkan caranya.
1. Perbedaan Statistik Deskriptif dan Inferensi
Setelah sesi 2 dan 3, kita sudah mahir menggambarkan data. Sekarang kita naik level: menarik kesimpulan dari data.
Statistik Deskriptif = Dokter yang mengukur tekanan darah Anda hari ini: "Tekanan darah Anda 130/85 pagi ini" — hanya menggambarkan fakta yang ada.
Statistik Inferensi = Dokter yang menyimpulkan: "Berdasarkan 3 kali pengukuran minggu ini, kemungkinan besar tekanan darah rata-rata Anda dalam sebulan adalah 125–135" — menarik kesimpulan lebih luas dari data terbatas.
- Hanya tentang data yang ada (sampel)
- Tidak ada kesimpulan di luar data
- Tidak ada unsur ketidakpastian
- Contoh: "Rata-rata nilai kelas ini = 78"
- Tools: mean, median, histogram, boxplot
- Menyimpulkan tentang populasi dari sampel
- Ada margin of error / ketidakpastian
- Menggunakan probabilitas
- Contoh: "Rata-rata semua mahasiswa ISTN kemungkinan antara 75–81"
- Tools: CI, uji hipotesis, regresi
2. Populasi vs Sampel, Parameter vs Statistik
Anda masak satu panci soto besar untuk 50 orang (populasi). Untuk tahu apakah rasanya pas, Anda tidak perlu meminum seluruh panci — cukup cicipi sesendok (sampel). Dari rasa sesendok itu, Anda bisa menyimpulkan rasa seluruh panci.
Namun: sesendok harus diambil dari bagian yang teraduk rata (sampel representatif), bukan hanya dari permukaan (sampel bias). Itulah inti dari teknik sampling yang baik.
| Konsep | Definisi | Notasi | Contoh |
|---|---|---|---|
| Populasi | Seluruh kelompok yang ingin diteliti | N (besar) | Semua mahasiswa S1 di Indonesia (~8 juta) |
| Sampel | Subset dari populasi yang dipilih untuk diteliti | n (kecil) | 500 mahasiswa yang disurvei secara acak |
| Parameter | Ukuran numerik yang menggambarkan populasi | μ (mean), σ (std) | Rata-rata IPK SEMUA mahasiswa Indonesia |
| Statistik | Ukuran numerik yang menggambarkan sampel | x̄ (mean), s (std) | Rata-rata IPK dari 500 mahasiswa yang disurvei |
Parameter (μ, σ) = karakteristik POPULASI — biasanya tidak diketahui (terlalu mahal/mustahil mengukur semua)
Statistik (x̄, s) = karakteristik SAMPEL — yang kita hitung dari data, digunakan untuk mengestimasi parameter
3. Teknik Sampling
Cara memilih sampel sangat menentukan keakuratan kesimpulan kita. Sampel yang buruk = kesimpulan yang menyesatkan.
Jika sampel tidak representatif, kesimpulan kita bisa sangat menyesatkan.
Contoh nyata: Survei telepon pada 1936 memprediksikan Roosevelt akan kalah pilpres AS, padahal ia menang telak. Penyebabnya: hanya orang kaya (yang punya telepon) yang disurvei — sampel yang bias terhadap kelas atas.
4. Central Limit Theorem (CLT)
CLT adalah teorema paling ajaib dalam statistika. Ia menjelaskan mengapa statistik inferensi bisa bekerja — bahkan ketika data populasi aslinya tidak normal.
Satu dadu: nilainya 1–6, distribusinya uniform (datar, bukan lonceng).
Tapi jika Anda lempar 30 dadu sekaligus dan catat rata-ratanya, lalu ulangi 1000 kali — distribusi rata-rata tersebut akan mendekati kurva lonceng (normal)! Itulah CLT: rata-rata banyak sampel selalu mendekati normal, apapun bentuk distribusi aslinya.
Jika kita mengambil banyak sampel berukuran n dari populasi apapun (normal, miring, uniform, dll.), maka distribusi rata-rata sampel (x̄) akan mendekati distribusi normal dengan:
• Mean = μ (mean populasi)
• Std Deviasi = σ/√n (disebut Standard Error)
Berlaku untuk n ≥ 30 (biasanya)
CLT memungkinkan kita menggunakan rumus-rumus berbasis distribusi normal (seperti confidence interval dan uji-z) meski data asli tidak normal — selama ukuran sampel cukup besar (n ≥ 30). Inilah fondasi hampir semua statistik inferensi.
5. Estimasi: Titik dan Interval
Ada dua cara mengestimasi parameter populasi dari sampel: estimasi titik dan estimasi interval.
Dokter mengestimasi berat lahir bayi dari USG:
Estimasi Titik: "Berat bayinya 3.2 kg" — satu angka pasti, tapi bisa meleset.
Estimasi Interval: "Berat bayinya antara 2.9 – 3.5 kg dengan tingkat kepercayaan 95%" — rentang yang lebih jujur tentang ketidakpastian.
| Jenis Estimasi | Bentuk | Kelebihan | Kekurangan |
|---|---|---|---|
| Estimasi Titik | Satu nilai: x̄ = 78.5 | Sederhana dan ringkas | Tidak menunjukkan ketidakpastian |
| Estimasi Interval | Rentang: [75.2 , 81.8] | Jujur tentang margin of error | Lebih kompleks, rentang bisa lebar |
6. Confidence Interval (Selang Kepercayaan)
Confidence Interval (CI) adalah rentang nilai yang dengan tingkat kepercayaan tertentu (misal 95%) berisi parameter populasi yang sebenarnya.
Nilai Kritis z* untuk Berbagai Tingkat Kepercayaan
Contoh Perhitungan CI
Diketahui: Sampel 36 mahasiswa, rata-rata nilai UAS x̄ = 78, std deviasi s = 12. Hitung 95% CI untuk rata-rata populasi.
Step 1: Tentukan z* untuk 95% → z* = 1.960
Step 2: Hitung Standard Error → SE = s/√n = 12/√36 = 12/6 = 2
Step 3: Hitung Margin of Error → ME = z* × SE = 1.960 × 2 = 3.92
Step 4: Hitung CI → [78 − 3.92, 78 + 3.92] = [74.08 , 81.92]
Kesimpulan: Kita 95% yakin rata-rata nilai seluruh populasi mahasiswa berada antara 74.08 dan 81.92.
Setiap baris = CI dari satu sampel berbeda. Garis emas = nilai parameter populasi sebenarnya (μ=78).
Dari 100 sampel berbeda, ~95 CI akan berisi μ dan ~5 CI tidak akan berisi μ. Itulah arti "95% confidence level".
7. Interpretasi Confidence Interval yang Benar
CI adalah konsep yang sering salah diinterpretasikan — bahkan oleh para profesional. Mari kita perjelas.
μ (rata-rata populasi) adalah angka tetap yang sudah ada, bukan angka acak. Ia tidak "punya probabilitas" berada di suatu tempat — ia sudah ada di suatu nilai tertentu, kita hanya tidak tahu persis di mana.
Yang acak adalah CI kita — bergantung pada sampel yang kita ambil. 95% CI berarti: metode pengambilan CI ini akan "menangkap" μ dalam 95% pengulangan.
Faktor yang Mempengaruhi Lebar CI
| Faktor | Efek pada Lebar CI | Penjelasan |
|---|---|---|
| Ukuran sampel (n) ↑ | CI makin sempit ✓ | Sampel lebih besar → SE = σ/√n makin kecil → CI lebih presisi |
| Std Deviasi (σ) ↑ | CI makin lebar | Data lebih bervariasi → lebih sulit memperkirakan mean dengan tepat |
| Confidence level ↑ (misal 90% → 99%) | CI makin lebar | Mau lebih "yakin" → harus menutup rentang yang lebih luas |
8. Praktik: CI dengan Python (scipy.stats)
8.1 CI untuk Mean (menggunakan t-distribution)
import numpy as np
import pandas as pd
from scipy import stats
# ── Dataset: Nilai UAS sampel mahasiswa ──────────────
np.random.seed(42)
nilai_sampel = np.random.normal(loc=78, scale=12, size=36)
n = len(nilai_sampel)
xbar = np.mean(nilai_sampel)
s = np.std(nilai_sampel, ddof=1) # ddof=1 untuk std sampel
se = s / np.sqrt(n) # standard error
print(f"Ukuran Sampel (n) : {n}")
print(f"Mean Sampel (x̄) : {xbar:.2f}")
print(f"Std Deviasi (s) : {s:.2f}")
print(f"Standard Error(SE) : {se:.2f}")
# ── Hitung CI dengan scipy.stats.t.interval ──────────
ci_90 = stats.t.interval(confidence=0.90, df=n-1, loc=xbar, scale=se)
ci_95 = stats.t.interval(confidence=0.95, df=n-1, loc=xbar, scale=se)
ci_99 = stats.t.interval(confidence=0.99, df=n-1, loc=xbar, scale=se)
print("\n═══ CONFIDENCE INTERVALS ═══")
print(f"90% CI : [{ci_90[0]:.2f} , {ci_90[1]:.2f}] (lebar: {ci_90[1]-ci_90[0]:.2f})")
print(f"95% CI : [{ci_95[0]:.2f} , {ci_95[1]:.2f}] (lebar: {ci_95[1]-ci_95[0]:.2f})")
print(f"99% CI : [{ci_99[0]:.2f} , {ci_99[1]:.2f}] (lebar: {ci_99[1]-ci_99[0]:.2f})")
Ukuran Sampel (n) : 36
Mean Sampel (x̄) : 77.43
Std Deviasi (s) : 11.82
Standard Error(SE) : 1.97
═══ CONFIDENCE INTERVALS ═══
90% CI : [74.07 , 80.79] (lebar: 6.72)
95% CI : [73.40 , 81.46] (lebar: 8.06)
99% CI : [72.07 , 82.79] (lebar: 10.72)
Semakin tinggi confidence level (90% → 99%), semakin lebar CI-nya (6.72 → 10.72).
Analoginya: jika ingin lebih "yakin" menangkap ikan, Anda perlu jaring yang lebih lebar.
8.2 CI untuk Proporsi
from statsmodels.stats.proportion import proportion_confint
# Contoh: dari 200 mahasiswa, 130 lulus tepat waktu
# Estimasi proporsi kelulusan tepat waktu populasi
n_sukses = 130 # jumlah sukses (lulus tepat waktu)
n_total = 200 # total sampel
p_hat = n_sukses / n_total # proporsi sampel
print(f"Proporsi sampel (p̂) : {p_hat:.2%}")
# 95% CI untuk proporsi (metode Wilson)
ci_low, ci_high = proportion_confint(
count=n_sukses, nobs=n_total,
alpha=0.05, method='wilson'
)
print(f"95% CI Proporsi: [{ci_low:.2%} , {ci_high:.2%}]")
print("\nKesimpulan:")
print(f"Kita 95% yakin bahwa proporsi kelulusan tepat waktu")
print(f"di seluruh populasi berada antara {ci_low:.1%} - {ci_high:.1%}")
Proporsi sampel (p̂) : 65.00%
95% CI Proporsi: [58.24% , 71.21%]
Kesimpulan:
Kita 95% yakin bahwa proporsi kelulusan tepat waktu
di seluruh populasi berada antara 58.2% - 71.2%
8.3 Efek Ukuran Sampel pada CI
import matplotlib.pyplot as plt
# Simulasi: bagaimana CI berubah seiring bertambahnya n
ukuran_n = [10, 20, 30, 50, 100, 200, 500]
lebar_ci = []
for n in ukuran_n:
sampel = np.random.normal(78, 12, n)
ci = stats.t.interval(0.95, df=n-1, loc=sampel.mean(), scale=stats.sem(sampel))
lebar_ci.append(ci[1] - ci[0])
plt.figure(figsize=(9, 5))
plt.plot(ukuran_n, lebar_ci, 'o-', color='#3B82F6', linewidth=2, markersize=8)
plt.fill_between(ukuran_n, lebar_ci, alpha=0.15, color='#3B82F6')
plt.title('Lebar 95% CI vs Ukuran Sampel (n)\nSemakin besar n → CI makin sempit → makin presisi')
plt.xlabel('Ukuran Sampel (n)')
plt.ylabel('Lebar CI')
plt.grid(alpha=0.3)
plt.tight_layout()
plt.show()
Grafik menunjukkan hubungan berbanding terbalik antara n dan lebar CI:
• n=10 → CI sangat lebar (tidak presisi)
• n=100 → CI lebih sempit (lebih presisi)
• n=500 → CI sangat sempit (sangat presisi)
Namun pengaruhnya mengecil (diminishing returns): menambah n dari 10→100 memberikan perbaikan besar, tapi dari 400→500 tidak terlalu signifikan lagi. Ini disebut hukum akar kuadrat (SE = σ/√n).
Uji Pemahaman Sesi 4
- Statistik Deskriptif menggambarkan data yang ada; Statistik Inferensi menarik kesimpulan tentang populasi dari sampel
- Populasi = seluruh kelompok (N); Sampel = subset yang dipilih (n); Parameter = ukuran populasi (μ, σ); Statistik = ukuran sampel (x̄, s)
- Teknik sampling: Random (ideal), Stratified (per kelompok proporsional), Systematic (interval tetap), Cluster (pilih kelompok lalu ambil semua)
- Central Limit Theorem (CLT): distribusi rata-rata sampel mendekati normal untuk n ≥ 30, apapun distribusi populasi aslinya
- Estimasi Titik: satu nilai (x̄); Estimasi Interval (CI): rentang dengan margin of error yang jujur tentang ketidakpastian
- Rumus CI: x̄ ± z*(σ/√n) atau x̄ ± t*(s/√n); nilai kritis z*: 90%→1.645, 95%→1.960, 99%→2.576
- CI makin sempit jika: n lebih besar ↑, atau variabilitas data lebih kecil ↓
- Interpretasi 95% CI yang benar: "95 dari 100 CI dari sampel berbeda akan mengandung parameter populasi" — bukan "ada probabilitas 95%..."
- Python: scipy.stats.t.interval() untuk CI mean; proportion_confint() untuk CI proporsi