Teknologi & Industri
Dipublikasikan oleh Anjas Mifta Huda pada 25 September 2025
Paper ini ditulis oleh Federico Agostini sebagai bagian dari tesis master di Università degli Studi di Padova, dengan judul lengkap Industrial Application of Machine Learning: Predictive Maintenance for Failure Detection. Penelitian ini menjadi salah satu referensi menarik di bidang predictive maintenance (perawatan prediktif) karena membahas penerapan machine learning (pembelajaran mesin) dalam mendeteksi potensi kerusakan mesin industri sebelum benar-benar terjadi.
Predictive maintenance (sering disingkat PdM) merupakan strategi perawatan mesin yang memanfaatkan data sensor, alarm, dan laporan teknisi untuk memprediksi kapan kerusakan akan muncul. Konsep ini sangat relevan di era Industry 4.0, yaitu fase revolusi industri keempat yang ditandai dengan integrasi teknologi digital, Internet of Things (IoT), big data, kecerdasan buatan, dan sistem otonom dalam dunia produksi.
Kalau di masa lalu industri masih mengandalkan run-to-failure (R2F), yaitu menunggu mesin rusak dulu baru diperbaiki, atau preventive maintenance (PvM), yaitu mengganti komponen secara terjadwal meskipun kadang masih layak pakai, kini PdM hadir sebagai jalan tengah. PdM memungkinkan perusahaan mengoptimalkan umur pakai komponen, menekan downtime, dan mengurangi biaya karena maintenance hanya dilakukan saat memang ada indikasi kerusakan nyata.
Nah, di sinilah machine learning masuk. Algoritma ML bisa belajar dari data sensor, log alarm, hingga laporan teknisi untuk mengenali pola kerusakan yang sering tersembunyi atau tidak kasat mata. Agostini dalam papernya menguji beberapa pendekatan populer, seperti XGBoost, Long-Short Term Memory (LSTM), model NLP (Natural Language Processing), ensemble model, hingga BERT (Bidirectional Encoder Representations from Transformers) untuk data teks. Selain itu, paper ini juga membahas implementasi pipeline berbasis AWS (Amazon Web Services) untuk deployment skala industri.
Dataset dan Kompleksitas Data Industri
Dataset yang dipakai dalam penelitian ini berasal dari perusahaan besar di bidang refrigeration system atau sistem pendingin. Data ini mencakup:
Bayangin aja, data sebanyak ini sangat noisy (banyak gangguan atau error). Misalnya, laporan teknisi sering bercampur antara kerusakan serius dan hal remeh kayak lampu mati. Ada juga masalah delay: laporan teknisi kadang ditulis berhari-hari atau berbulan-bulan setelah kejadian. Jadi, tantangan besar penelitian ini bukan cuma bikin model prediksi, tapi juga membersihkan dan menyatukan data supaya lebih usable.
Agostini melakukan Exploratory Data Analysis (EDA) untuk memahami pola dasar. Hasilnya menunjukkan bahwa tiap fasilitas punya perilaku alarm yang unik. Artinya, mesin di lokasi A bisa sering memicu alarm tertentu, sementara di lokasi B tidak. Hal ini bikin sulit bikin satu model generik untuk semua fasilitas. Solusi yang diusulkan adalah menambahkan variabel lokasi dalam model agar algoritma bisa belajar perbedaan karakteristik antar fasilitas.
Pendekatan Machine Learning untuk Failure Prediction
XGBoost: Simple tapi Powerful
XGBoost (Extreme Gradient Boosting) adalah algoritma berbasis decision tree yang sering jadi andalan di kompetisi data science. Model ini terbukti unggul dalam penelitian Agostini. Dengan threshold probabilitas 0,3, XGBoost mampu mendeteksi sekitar 70% kasus kerusakan dengan tingkat false alarm sekitar 35%.
Kalau threshold diturunkan ke 0,1, hampir semua kerusakan bisa terdeteksi (recall tinggi), tapi trade-off-nya false positives melonjak. Bagi industri, ini berarti dilema klasik: apakah mau lebih aman dengan biaya maintenance lebih besar, atau lebih hemat dengan risiko ada kerusakan yang lolos.
Kekuatan XGBoost ada pada kemampuannya menangani data besar, tidak butuh asumsi distribusi data, dan relatif mudah diinterpretasi. Buat perusahaan yang butuh solusi praktis, ini sangat relevan.
LSTM: Harapan yang Gagal
Long-Short Term Memory (LSTM) adalah arsitektur neural network khusus untuk time series. Harapannya, LSTM bisa menangkap pola jangka panjang dari data alarm. Tapi, hasil di paper ini justru mengecewakan.
Model LSTM hanya menghasilkan AUC di bawah 0,5, artinya prediksinya bahkan lebih buruk dari tebak random. Kenapa bisa begitu? Karena kerusakan mesin di dataset ini ternyata bukan pola bertahap, tapi lebih sering muncul mendadak. Jadi, mencoba memprediksi dengan mengandalkan memori jangka panjang justru membuat model salah interpretasi.
Pelajaran penting: jangan asal pakai deep learning kalau tidak sesuai karakter data. Banyak praktisi industri terlalu cepat mengadopsi neural network, padahal model berbasis tree kayak XGBoost bisa jauh lebih robust.
NLP-like Model: Alarm Sebagai Bahasa
Agostini juga mencoba pendekatan kreatif dengan memperlakukan urutan alarm seperti kalimat. Jadi, tiap ID alarm dianggap kata, dan rangkaian alarm dianggap dokumen.
Sayangnya, pendekatan ini gagal. AUC model hanya sekitar 0,576. Hal ini bisa dipahami karena alarm sequence tidak punya kekayaan semantik seperti bahasa alami. Dengan kata lain, alarm ID bukanlah kata dengan makna, melainkan hanya sinyal teknis.
Ensemble LSTM + XGBoost
Kombinasi LSTM dan XGBoost diuji untuk melihat apakah dua pendekatan bisa saling melengkapi. Skemanya: LSTM memprediksi alarm esok hari, lalu hasil prediksi dipakai XGBoost untuk menentukan ada kerusakan atau tidak.
Hasilnya? AUC sekitar 0,66, alias lebih buruk dari XGBoost sendiri. Walau LSTM punya MAE (Mean Absolute Error) rendah dalam memprediksi jumlah alarm, tapi begitu digabung dengan XGBoost, performanya drop.
Artinya, ensemble ini tidak memberikan sinergi karena noise data dan imbalance class terlalu besar. Meski begitu, ide ensemble tetap menarik untuk dieksplorasi dengan teknik balancing data yang lebih baik.
Analisis Ticket Maintenance dengan Natural Language Processing (NLP)
Selain alarm, paper ini juga mengulik laporan teknisi. Data ini berupa teks pendek yang menjelaskan jenis masalah.
Unsupervised Approach: LDA, Doc2Vec, dan BERT
Kesimpulan: unsupervised NLP tidak efektif untuk ticket pendek.
Supervised Approach: SpectrumBoost vs BERT
Karena unsupervised gagal, penulis beralih ke supervised classification dengan 3 kategori kerusakan paling sering:
Dua metode dibandingkan:
Pelajaran praktis: jangan langsung pakai model mahal kayak BERT kalau datanya tidak cocok. Kadang metode lebih ringan justru lebih efektif dan efisien.
AWS Pipeline: Dari Riset ke Implementasi Nyata
Salah satu kontribusi penting paper ini adalah gambaran pipeline AWS (Amazon Web Services) untuk deployment predictive maintenance secara otomatis.
Alurnya:
Dengan pipeline ini, predictive maintenance bisa berjalan otomatis tanpa campur tangan manusia. Ini penting buat perusahaan dengan ribuan mesin tersebar, karena manual monitoring jelas tidak mungkin.
Kritik, Opini, dan Relevansi Dunia Nyata
Kesimpulan
Resensi ini menegaskan bahwa penelitian Agostini sangat aplikatif dan relevan dengan kebutuhan industri. Beberapa poin kunci yang bisa diambil:
Bagi perusahaan, temuan ini bisa langsung diadopsi untuk optimasi maintenance, mengurangi downtime, dan menekan biaya operasional. Inilah bukti nyata bagaimana machine learning bukan hanya jargon, tapi solusi konkret di era Industry 4.0.