Mengenal Pembelajaran Terpandu (Supervised Learning)

Dipublikasikan oleh Muhammad Ilham Maulana

02 April 2024, 11.07

Sumber: Gambar: TechForId

Pembelajaran terpandu (supervised learning) merupakan salah satu paradigma dalam machine learning di mana data masukan (seperti vektor fitur) dan nilai keluaran yang diinginkan (sinyal pengawasan berlabel manusia) digunakan untuk melatih sebuah model. Data pelatihan diproses untuk membangun sebuah fungsi yang memetakan data baru ke nilai keluaran yang diharapkan. Skenario optimal akan memungkinkan algoritma untuk menentukan nilai keluaran dengan benar untuk instance yang belum pernah dilihat sebelumnya.

Langkah-langkah dalam Pembelajaran Terpandu:

  1. Menentukan jenis contoh pelatihan (seperti karakter tulisan tangan, kata, atau kalimat).
  2. Mengumpulkan data pelatihan yang representatif dari penggunaan dunia nyata.
  3. Menentukan representasi fitur masukan dari fungsi yang akan dipelajari.
  4. Menentukan struktur fungsi yang dipelajari dan algoritma pembelajaran terkait (seperti Support Vector Machines, Regresi Logistik, atau Pohon Keputusan).
  5. Menjalankan algoritma pembelajaran pada data pelatihan dan menyesuaikan parameter kontrol.
  6. Mengevaluasi akurasi fungsi yang dipelajari pada data uji yang terpisah dari data pelatihan.

Dalam memilih algoritma pembelajaran terpandu, ada beberapa faktor penting yang perlu dipertimbangkan, seperti trade-off bias-varians, kompleksitas fungsi, dimensi ruang masukan, dan kebisingan dalam nilai keluaran. Trade-off bias-varians mengacu pada keseimbangan antara kemampuan model untuk mempelajari pola dengan baik (bias rendah) dan kemampuannya untuk mengeneralisasi pola tersebut pada data baru (varians rendah). Kompleksitas fungsi mengacu pada seberapa rumit fungsi yang dipelajari, semakin kompleks semakin banyak data yang dibutuhkan untuk melatihnya dengan baik. Dimensi ruang masukan mengacu pada jumlah fitur yang digunakan, semakin banyak fitur semakin sulit untuk mempelajari pola yang relevan. Kebisingan dalam nilai keluaran mengacu pada adanya kesalahan atau noise dalam data pelatihan, yang dapat menyebabkan overfitting jika tidak ditangani dengan baik.

Algoritma yang populer digunakan antara lain Support Vector Machines, Regresi Linear, Regresi Logistik, Naive Bayes, Linear Discriminant Analysis, Pohon Keputusan, K-Nearest Neighbor, Jaringan Syaraf Tiruan (Multilayer Perceptron), dan Similarity Learning. Masing-masing algoritma memiliki kelebihan dan kekurangan tersendiri, sehingga pemilihan algoritma yang tepat sangat bergantung pada karakteristik masalah dan data yang dimiliki.

Secara umum, algoritma pembelajaran terpandu bekerja dengan mencari fungsi yang meminimalkan risiko empiris (kesalahan pada data pelatihan) atau meminimalkan risiko struktural (yang juga memperhitungkan kompleksitas fungsi). Risiko empiris mengacu pada seberapa baik model dapat mempelajari pola dari data pelatihan, sedangkan risiko struktural juga memperhitungkan kemampuan model untuk mengeneralisasi pola tersebut pada data baru.

Selain itu, ada beberapa generalisasi dari masalah pembelajaran terpandu standar, seperti semi-supervised learning, active learning, structured prediction, dan learning to rank. Semi-supervised learning melibatkan penggunaan data yang sebagian berlabel dan sebagian tidak berlabel untuk melatih model. Active learning melibatkan proses interaktif di mana algoritma dapat meminta label untuk data tertentu selama proses pelatihan. Structured prediction digunakan ketika nilai keluaran yang diinginkan adalah objek kompleks seperti pohon parsing atau grafik berlabel. Learning to rank digunakan ketika masukan berupa kumpulan objek dan nilai keluaran yang diinginkan adalah peringkat dari objek-objek tersebut.

Dengan kemampuannya dalam mempelajari pola dari data berlabel, pembelajaran terpandu menjadi salah satu pendekatan penting dalam machine learning untuk membangun model yang dapat melakukan prediksi atau pengambilan keputusan berdasarkan data baru yang belum pernah dilihat sebelumnya. Aplikasinya sangat luas, mulai dari pengenalan pola, pengolahan bahasa alami, analisis sentimen, rekomendasi sistem, dan banyak lagi. Dengan memahami konsep dasar dan memilih algoritma yang tepat, pembelajaran terpandu dapat menjadi alat yang sangat kuat untuk mengekstrak pengetahuan dari data dan membantu pengambilan keputusan yang lebih baik.
 

Disadur dari: id.wikipedia.org/en.wikipedia.org/wiki/Supervised_learning