S1
IF1402 Praktikum
Sesi 1 - Pengantar NLP, Text Mining, dan AI Generatif
Sesi 1 dari 16

Pengantar NLP, Text Mining, dan AI Generatif

Sesi ini adalah pintu masuk. Tujuannya bukan agar mahasiswa langsung jago coding, melainkan agar mereka paham peta jalannya. Banyak mahasiswa bingung karena melihat istilah seperti NLP, text mining, transformer, dan LLM seolah-olah semuanya sama. Padahal sebenarnya istilah-istilah ini saling berhubungan, tetapi memiliki peran yang berbeda.

Setelah sesi ini, mahasiswa diharapkan memahami bahwa teks adalah data, komputer tidak otomatis paham bahasa manusia, dan ada beberapa “tingkat kecanggihan” dalam mengolah teks, mulai dari teknik sederhana sampai model generatif modern.

Tujuan: paham gambaran besar Fokus: konsep dasar Output: siap masuk preprocessing
Pertanyaan utama sesi ini Mengapa komputer perlu dibantu untuk memahami teks, padahal manusia bisa membaca kalimat dengan sangat mudah?
Jawaban singkatnya Karena komputer pada dasarnya bekerja dengan angka, bukan makna. Jadi teks harus diolah langkah demi langkah sebelum bisa dipahami model.
Hasil belajar Mahasiswa mengenal perbedaan NLP, text mining, machine learning teks, dan AI generatif melalui contoh yang dekat dengan kehidupan sehari-hari.

Apa yang sebenarnya dipelajari pada mata kuliah ini

Secara sederhana, mata kuliah ini mengajarkan bagaimana komputer bisa membaca, merapikan, mengenali pola, memahami, mencari makna, lalu bahkan menghasilkan teks baru. Jika diibaratkan manusia, awalnya komputer hanya seperti petugas administrasi yang bisa menghitung. Setelah dilatih, ia menjadi petugas yang bisa memilah surat, memahami isi pesan, dan akhirnya bisa membantu menulis balasan yang masuk akal.

Perumpamaan utama

Bayangkan ada ribuan surat masuk ke kantor. Manusia bisa cepat tahu mana surat keluhan, mana surat pujian, mana surat spam. Komputer tidak. Komputer harus diajari dulu bagaimana bentuk surat, kata-kata apa yang sering muncul, pola seperti apa yang menandakan keluhan, dan seterusnya. Semua proses mengajari komputer itulah inti praktikum ini.

Di minggu-minggu awal, mahasiswa belajar menyiapkan teks agar rapi. Di tengah semester, mahasiswa mengubah teks menjadi fitur dan melatih model. Di bagian akhir, mahasiswa masuk ke AI generatif, model bahasa besar, semantic search, dan RAG. Dengan kata lain, perjalanan mata kuliah ini bergerak dari “membersihkan teks” menuju “membangun sistem cerdas berbasis teks”.

Memahami istilah yang sering membuat bingung

Istilah Makna mudahnya Contoh sederhana
NLP Cara komputer berurusan dengan bahasa manusia. Komputer mengenali kalimat positif atau negatif.
Text Mining Menggali informasi atau pola dari kumpulan teks. Mencari topik keluhan paling sering di ulasan aplikasi.
Machine Learning untuk teks Mengajar model membuat prediksi dari data teks. Memprediksi email spam atau bukan spam.
AI Generatif Model yang tidak hanya membaca, tetapi juga bisa membuat teks baru. Membuat ringkasan artikel atau menjawab pertanyaan dari dokumen.
LLM Model bahasa besar yang dilatih pada data teks sangat banyak. Model yang bisa menjelaskan materi, merangkum, atau membuat contoh jawaban.

Kalau dibuat sangat sederhana, NLP adalah payung besarnya, text mining adalah salah satu aktivitas di dalamnya, machine learning teks adalah cara membuat model prediksi dari teks, dan AI generatif adalah tahap yang lebih maju ketika model sudah bisa menghasilkan jawaban atau tulisan baru.

Kenapa komputer tidak otomatis paham teks

Manusia bisa langsung memahami kalimat, “Aplikasinya bagus, tetapi loading-nya lama.” Kita tahu ini berarti ada pujian sekaligus keluhan. Komputer tidak langsung tahu begitu. Bagi komputer, kalimat ini hanyalah deretan karakter. Karena itu komputer perlu proses tambahan agar bisa “melihat” pola penting di dalam teks.

Yang mudah bagi manusia

Manusia tahu bahwa kata “bagus” menunjukkan hal positif, sedangkan “lama” dalam konteks loading memberi nuansa negatif.

Yang sulit bagi komputer

Komputer belum tahu kata mana penting, mana tidak, kata mana mengarah ke pujian, dan mana mengarah ke keluhan.

Karena itulah di praktikum nanti mahasiswa belajar preprocessing, fitur teks, dan model. Tiga tahap ini seperti membantu komputer mengenakan kacamata. Tanpa kacamata, teks terlihat kabur. Dengan kacamata yang tepat, pola mulai terlihat.

Perjalanan materi selama semester

A

Awal semester

Mahasiswa belajar teks sebagai data, pembersihan teks, tokenisasi, stopword, stemming, lalu representasi seperti BoW dan TF-IDF.

B

Pertengahan semester

Mahasiswa mulai membuat model klasifikasi, memahami evaluasi, lalu mengenal embedding serta transformer.

C

Akhir semester

Mahasiswa masuk ke LLM, prompt engineering, semantic search, RAG, lalu membuat mini project yang menggabungkan semuanya.

Studi kasus sederhana: ulasan aplikasi kampus

Bayangkan kampus memiliki aplikasi akademik. Mahasiswa sering memberikan ulasan seperti “fiturnya lengkap”, “sering logout sendiri”, “tampilannya bagus tapi lambat”, dan “susah saat isi KRS”. Jika ulasan hanya dibaca satu per satu oleh admin, itu memakan waktu. Di sinilah NLP dan AI berguna.

Tugas 1

Mengumpulkan dan membersihkan ulasan agar rapi dan seragam.

Tugas 2

Mengelompokkan ulasan menjadi topik, misalnya login, KRS, tampilan, atau performa.

Tugas 3

Membuat ringkasan otomatis agar pihak kampus cepat memahami masalah utama.

Analogi mudah

Jika ada 2.000 surat keluhan masuk, NLP membantu mengurutkan surat sesuai isi, sedangkan AI generatif membantu membuat ringkasan eksekutif untuk pimpinan. Jadi satu teknologi membantu membaca pola, teknologi lain membantu menjelaskan hasilnya dengan bahasa manusia.

Latihan berpikir sebelum coding

Sebelum mahasiswa menulis kode, penting untuk melatih logika masalahnya. Tiga pertanyaan ini bisa dipakai dosen saat diskusi kelas. Pertama, apakah teks yang kita miliki sudah rapi atau masih banyak singkatan, typo, dan simbol? Kedua, apakah tujuan kita ingin mengklasifikasi, mencari kemiripan, atau membuat teks baru? Ketiga, apakah hasil akhir yang dibutuhkan berupa label, daftar dokumen relevan, atau jawaban dalam bentuk paragraf?

Jika mahasiswa bisa menjawab tiga pertanyaan di atas, mereka biasanya lebih mudah menentukan apakah harus memakai preprocessing sederhana, model klasifikasi, semantic search, atau AI generatif.

Contoh notebook awal yang sangat sederhana

Pada sesi pembuka, praktikum bisa dimulai dari membaca dataset sederhana agar mahasiswa merasa materi ini nyata. Contohnya, kita punya file berisi dua kolom, yaitu teks ulasan dan label. Mahasiswa diminta melihat jumlah data, contoh isi teks, dan panjang kalimat.

import pandas as pd

# contoh membaca data sederhana

df = pd.DataFrame({
    'teks': [
        'Aplikasinya bagus dan membantu',
        'Sering error saat login',
        'Tampilannya enak dilihat',
        'Lambat ketika membuka menu KRS'
    ],
    'label': ['positif', 'negatif', 'positif', 'negatif']
})

print(df.head())
print('Jumlah data:', len(df))
print('Contoh label:', df['label'].unique())

Tujuan kode di atas bukan untuk membuat model canggih, melainkan untuk menunjukkan pada mahasiswa bahwa data teks bisa dibuka, dibaca, dan diamati seperti data lainnya. Setelah rasa takut awal hilang, sesi selanjutnya baru masuk ke preprocessing.

Ruang Diskusi Mahasiswa dengan Sistem LLM

Tanyakan konsep, latihan, studi kasus, atau minta penjelasan ulang dengan bahasa yang lebih sederhana. Sistem hanya melayani topik yang masih berkaitan dengan mata kuliah ini.

Konteks halaman: Sesi 1 - Pengantar NLP, Text Mining, dan AI Generatif Fokus: NLP, text mining, transformer, LLM, prompt, semantic search, RAG

Halo, saya siap membantu diskusi belajar Anda.

Silakan tanyakan materi yang berkaitan dengan mata kuliah ini, misalnya preprocessing, TF-IDF, klasifikasi teks, embedding, transformer, LLM, prompt engineering, semantic search, RAG, evaluasi model, etika AI, atau studi kasus yang serupa.

Bila pertanyaan di luar tema mata kuliah, sistem akan menolak dengan sopan.

Jawaban akan dibuat lebih jelas, tidak monoton, penuh contoh, dan memakai paragraf biasa tanpa markdown.