Penerapan Metode Machine Learning untuk Prediksi Kualitas dalam Inspeksi Manufaktur

Dipublikasikan oleh Viskha Dwi Marcella Nanda

11 April 2025, 08.18

Sumber:pexels.com

Pendahuluan: Era Industri 4.0 dan Pentingnya Prediksi Kualitas

Perkembangan Industry 4.0 menghadirkan paradigma baru di industri manufaktur global. Salah satu pilar utama revolusi ini adalah transformasi digital yang memungkinkan pengumpulan data produksi secara masif dan real-time. Melalui data tersebut, perusahaan dapat mengimplementasikan machine learning (ML) dan deep learning (DL) untuk mengoptimalkan proses produksi, khususnya dalam hal prediksi kualitas produk (Predictive Quality).

Paper karya Sidharth Kiran Sankhye ini mengulas secara mendalam penerapan metode machine learning, khususnya pada proses inspeksi kualitas di lini produksi manufaktur yang kompleks dan berskala besar. Fokus utamanya adalah pada bagaimana algoritma klasifikasi ML dapat membantu memprediksi kepatuhan kualitas produk secara akurat, terutama dalam skenario dengan data yang sangat tidak seimbang (imbalanced data).

 

Latar Belakang dan Tujuan Penelitian

Masalah Utama: Imbalanced Dataset dalam Prediksi Kualitas

Dalam produksi massal, unit produk yang cacat seringkali hanya mencakup sebagian kecil dari total produksi. Inilah yang disebut class imbalance problem, di mana data minoritas (produk cacat) terlalu sedikit dibandingkan dengan data mayoritas (produk sesuai standar). Tantangan ini membuat sebagian besar model ML cenderung bias terhadap kelas mayoritas, sehingga gagal mendeteksi cacat produk secara efektif.

Tujuan Penelitian

Penelitian ini bertujuan untuk:

  • Merancang metode klasifikasi berbasis machine learning yang efektif dalam prediksi kualitas produk di lini produksi multi-model.
  • Mengatasi tantangan data tidak seimbang melalui feature engineering dan teknik sampling seperti SMOTE.
  • Menguji metode tersebut melalui studi kasus pada pabrik manufaktur alat rumah tangga yang memproduksi sekitar 800 unit per hari.

 

Metodologi: Pendekatan Sistematis dalam Klasifikasi Prediktif

Model Klasifikasi yang Digunakan

Peneliti menerapkan dua algoritma utama:

  1. Random Forest (RF)
    Algoritma berbasis bagging, menggabungkan banyak decision trees untuk mengurangi overfitting dan meningkatkan akurasi prediksi.
  2. XGBoost (Extreme Gradient Boosting)
    Model boosting yang terkenal efisien dan efektif dalam menangani dataset besar dengan berbagai tipe fitur. Dilengkapi dengan regularisasi yang mampu mencegah overfitting.

Feature Engineering: Kunci Peningkatan Akurasi

Dalam industri, data mentah umumnya tidak siap langsung digunakan untuk training model ML. Oleh karena itu, penulis melakukan beberapa teknik feature engineering, antara lain:

  • Suspicious Unit Batches: Membuat variabel yang menandai unit-unit yang berada dekat dengan unit cacat dalam alur produksi.
  • Proximity to Model Changeover: Mengukur jarak unit terhadap perubahan model produksi, karena pergantian model kerap menjadi sumber kesalahan produksi.
  • Model Color Change: Faktor perubahan warna model, yang bisa memengaruhi kemungkinan kesalahan manusia dalam perakitan.

Teknik Penanganan Imbalanced Data

Penulis menerapkan SMOTE (Synthetic Minority Over-sampling Technique) untuk meningkatkan jumlah data dari kelas minoritas (produk cacat). Ini bertujuan menyeimbangkan distribusi data dan memperbaiki akurasi klasifikasi.

 

Studi Kasus: Pabrik Alat Rumah Tangga Multi-Model

Konteks Industri

Studi dilakukan pada lini produksi alat rumah tangga multi-model dengan perubahan model yang cepat (negligible changeover time). Pabrik ini menghasilkan sekitar 800 unit per hari. Namun, permasalahan besar muncul akibat cacat produk, terutama wrong/missing parts, yang baru ditemukan pada tahap inspeksi akhir (Random Customer Acceptance Inspection/RCAI).

Permasalahan yang Dihadapi

  • Cacat Produk: Terdapat unit-unit yang lolos dari pemeriksaan awal namun terdeteksi cacat pada RCAI, menyebabkan biaya tinggi akibat recall.
  • Inspeksi Manual yang Tidak Efisien: Inspeksi manual lambat dan rentan kesalahan, sehingga membutuhkan sistem prediksi otomatis untuk meningkatkan efisiensi.

 

Hasil dan Analisis Model

Penulis mengevaluasi empat model klasifikasi berbasis kombinasi teknik feature engineering dan algoritma klasifikasi. Hasil evaluasi mengandalkan metrik Cohen’s Kappa dan ROC Curve.

Model A - Tanpa Feature Engineering

  • Akurasi tinggi, tetapi prediksi kelas minoritas buruk.
  • XGBoost lebih baik dari Random Forest dalam mendeteksi unit cacat, namun 58,89% unit masih gagal dideteksi.

Model B - Dengan Fitur Model Changeover

  • Penambahan fitur baru sedikit meningkatkan performa, tetapi tidak signifikan.
  • Masalah utama adalah distribusi minoritas fitur yang terlalu kecil.

Model C - Proximity to Model Changeover

  • Peningkatan akurasi signifikan, terutama pada prediksi unit cacat.
  • XGBoost mendeteksi 98,34% unit cacat secara akurat, sementara Random Forest masih bias terhadap mayoritas.

Model D - Normalized Proximity

  • Hasil sedikit lebih buruk dari Model C, menunjukkan bahwa metrik absolut lebih efektif dibandingkan metrik normalisasi dalam konteks ini.

Kesimpulan Analisis

Model XGBoost secara konsisten mengungguli Random Forest, terutama dalam menghadapi imbalanced datasets. Fitur proximity to model changeover menjadi penentu utama dalam keberhasilan prediksi.

 

Kritik dan Perbandingan dengan Penelitian Lain

Kelebihan Penelitian Ini

  • Fokus pada real-world application di lingkungan produksi multi-model.
  • Penekanan pada pentingnya domain knowledge dalam feature engineering.
  • Penggunaan metrik Cohen’s Kappa yang lebih akurat untuk kasus data tidak seimbang.

Kelemahan dan Tantangan

  • Dataset yang terbatas hanya mencakup sebagian kecil variabel proses.
  • Tidak adanya data sensor atau metrik mesin yang dapat memperkaya model prediksi.

Perbandingan dengan Studi Terkait

Studi oleh Kim et al. (2018) menunjukkan bahwa cost-sensitive learning juga efektif dalam klasifikasi kualitas produksi. Namun, pendekatan Sankhye lebih mengandalkan feature construction, bukan penyesuaian bobot kelas.

 

Arah Masa Depan dan Rekomendasi

  1. Integrasi dengan IoT dan Sensor Data
    Implementasi smart sensors untuk mengumpulkan data proses secara otomatis dan real-time akan memperkuat model prediksi.
  2. Explainable AI (XAI)
    Memperjelas alasan prediksi model XGBoost penting bagi operator pabrik agar mereka dapat memahami penyebab cacat produk.
  3. Transfer Learning untuk Multi-Plant Deployment
    Model yang dikembangkan di satu lini produksi dapat disesuaikan dan digunakan di lini produksi lainnya dengan sedikit penyesuaian.
  4. Federated Learning untuk Kolaborasi Multi-Pabrik
    Mengatasi tantangan privasi data, federated learning memungkinkan pelatihan model tanpa memindahkan data antar-pabrik.

 

Dampak Praktis bagi Industri Manufaktur

  • Peningkatan Efisiensi: Pengurangan kebutuhan inspeksi manual hingga 50%, seperti yang diantisipasi dalam studi kasus.
  • Penurunan Biaya Recall: Sistem prediksi kualitas proaktif mencegah unit cacat mencapai pelanggan.
  • Dukungan Proaktif untuk Kualitas Zero-Defect: Menuju konsep zero-defect manufacturing yang menjadi tujuan banyak perusahaan modern.
  •  

Kesimpulan Akhir

Penelitian ini membuktikan bahwa penerapan machine learning, khususnya XGBoost dengan feature engineering yang tepat, mampu meningkatkan prediksi kualitas produksi di industri manufaktur secara signifikan. Meskipun terdapat keterbatasan dalam data dan scope penelitian, pendekatan ini memberikan pondasi kuat untuk sistem prediktif yang lebih kompleks dan cerdas di masa mendatang.

Sumber:

Sankhye, Sidharth Kiran. (2020). Machine Learning Methods for Quality Prediction in Manufacturing Inspection. Iowa State University.