Teknologi & Industri

Industrial Application of Machine Learning – Predictive Maintenance for Failure Detection

Dipublikasikan oleh Anjas Mifta Huda pada 25 September 2025


Paper ini ditulis oleh Federico Agostini sebagai bagian dari tesis master di Università degli Studi di Padova, dengan judul lengkap Industrial Application of Machine Learning: Predictive Maintenance for Failure Detection. Penelitian ini menjadi salah satu referensi menarik di bidang predictive maintenance (perawatan prediktif) karena membahas penerapan machine learning (pembelajaran mesin) dalam mendeteksi potensi kerusakan mesin industri sebelum benar-benar terjadi.

Predictive maintenance (sering disingkat PdM) merupakan strategi perawatan mesin yang memanfaatkan data sensor, alarm, dan laporan teknisi untuk memprediksi kapan kerusakan akan muncul. Konsep ini sangat relevan di era Industry 4.0, yaitu fase revolusi industri keempat yang ditandai dengan integrasi teknologi digital, Internet of Things (IoT), big data, kecerdasan buatan, dan sistem otonom dalam dunia produksi.

Kalau di masa lalu industri masih mengandalkan run-to-failure (R2F), yaitu menunggu mesin rusak dulu baru diperbaiki, atau preventive maintenance (PvM), yaitu mengganti komponen secara terjadwal meskipun kadang masih layak pakai, kini PdM hadir sebagai jalan tengah. PdM memungkinkan perusahaan mengoptimalkan umur pakai komponen, menekan downtime, dan mengurangi biaya karena maintenance hanya dilakukan saat memang ada indikasi kerusakan nyata.

Nah, di sinilah machine learning masuk. Algoritma ML bisa belajar dari data sensor, log alarm, hingga laporan teknisi untuk mengenali pola kerusakan yang sering tersembunyi atau tidak kasat mata. Agostini dalam papernya menguji beberapa pendekatan populer, seperti XGBoost, Long-Short Term Memory (LSTM), model NLP (Natural Language Processing), ensemble model, hingga BERT (Bidirectional Encoder Representations from Transformers) untuk data teks. Selain itu, paper ini juga membahas implementasi pipeline berbasis AWS (Amazon Web Services) untuk deployment skala industri.

Dataset dan Kompleksitas Data Industri

Dataset yang dipakai dalam penelitian ini berasal dari perusahaan besar di bidang refrigeration system atau sistem pendingin. Data ini mencakup:

  1. Alarm records – berisi lebih dari 50,5 juta catatan alarm yang dipicu sensor mesin. Tiap entri punya informasi waktu, kode lokasi fasilitas, hingga ID alarm.
  2. Operations dataset – sekitar 500 ribu catatan operasi teknisi, termasuk waktu laporan dan jenis kerusakan.
  3. Assistance calls dataset – lebih dari 630 ribu laporan permintaan bantuan teknis, biasanya dikirim via telepon/email saat terjadi malfungsi.

Bayangin aja, data sebanyak ini sangat noisy (banyak gangguan atau error). Misalnya, laporan teknisi sering bercampur antara kerusakan serius dan hal remeh kayak lampu mati. Ada juga masalah delay: laporan teknisi kadang ditulis berhari-hari atau berbulan-bulan setelah kejadian. Jadi, tantangan besar penelitian ini bukan cuma bikin model prediksi, tapi juga membersihkan dan menyatukan data supaya lebih usable.

Agostini melakukan Exploratory Data Analysis (EDA) untuk memahami pola dasar. Hasilnya menunjukkan bahwa tiap fasilitas punya perilaku alarm yang unik. Artinya, mesin di lokasi A bisa sering memicu alarm tertentu, sementara di lokasi B tidak. Hal ini bikin sulit bikin satu model generik untuk semua fasilitas. Solusi yang diusulkan adalah menambahkan variabel lokasi dalam model agar algoritma bisa belajar perbedaan karakteristik antar fasilitas.

Pendekatan Machine Learning untuk Failure Prediction

XGBoost: Simple tapi Powerful

XGBoost (Extreme Gradient Boosting) adalah algoritma berbasis decision tree yang sering jadi andalan di kompetisi data science. Model ini terbukti unggul dalam penelitian Agostini. Dengan threshold probabilitas 0,3, XGBoost mampu mendeteksi sekitar 70% kasus kerusakan dengan tingkat false alarm sekitar 35%.

Kalau threshold diturunkan ke 0,1, hampir semua kerusakan bisa terdeteksi (recall tinggi), tapi trade-off-nya false positives melonjak. Bagi industri, ini berarti dilema klasik: apakah mau lebih aman dengan biaya maintenance lebih besar, atau lebih hemat dengan risiko ada kerusakan yang lolos.

Kekuatan XGBoost ada pada kemampuannya menangani data besar, tidak butuh asumsi distribusi data, dan relatif mudah diinterpretasi. Buat perusahaan yang butuh solusi praktis, ini sangat relevan.

LSTM: Harapan yang Gagal

Long-Short Term Memory (LSTM) adalah arsitektur neural network khusus untuk time series. Harapannya, LSTM bisa menangkap pola jangka panjang dari data alarm. Tapi, hasil di paper ini justru mengecewakan.

Model LSTM hanya menghasilkan AUC di bawah 0,5, artinya prediksinya bahkan lebih buruk dari tebak random. Kenapa bisa begitu? Karena kerusakan mesin di dataset ini ternyata bukan pola bertahap, tapi lebih sering muncul mendadak. Jadi, mencoba memprediksi dengan mengandalkan memori jangka panjang justru membuat model salah interpretasi.

Pelajaran penting: jangan asal pakai deep learning kalau tidak sesuai karakter data. Banyak praktisi industri terlalu cepat mengadopsi neural network, padahal model berbasis tree kayak XGBoost bisa jauh lebih robust.

NLP-like Model: Alarm Sebagai Bahasa

Agostini juga mencoba pendekatan kreatif dengan memperlakukan urutan alarm seperti kalimat. Jadi, tiap ID alarm dianggap kata, dan rangkaian alarm dianggap dokumen.

Sayangnya, pendekatan ini gagal. AUC model hanya sekitar 0,576. Hal ini bisa dipahami karena alarm sequence tidak punya kekayaan semantik seperti bahasa alami. Dengan kata lain, alarm ID bukanlah kata dengan makna, melainkan hanya sinyal teknis.

Ensemble LSTM + XGBoost

Kombinasi LSTM dan XGBoost diuji untuk melihat apakah dua pendekatan bisa saling melengkapi. Skemanya: LSTM memprediksi alarm esok hari, lalu hasil prediksi dipakai XGBoost untuk menentukan ada kerusakan atau tidak.

Hasilnya? AUC sekitar 0,66, alias lebih buruk dari XGBoost sendiri. Walau LSTM punya MAE (Mean Absolute Error) rendah dalam memprediksi jumlah alarm, tapi begitu digabung dengan XGBoost, performanya drop.

Artinya, ensemble ini tidak memberikan sinergi karena noise data dan imbalance class terlalu besar. Meski begitu, ide ensemble tetap menarik untuk dieksplorasi dengan teknik balancing data yang lebih baik.

Analisis Ticket Maintenance dengan Natural Language Processing (NLP)

Selain alarm, paper ini juga mengulik laporan teknisi. Data ini berupa teks pendek yang menjelaskan jenis masalah.

Unsupervised Approach: LDA, Doc2Vec, dan BERT

  • LDA (Latent Dirichlet Allocation): hasilnya buruk, topik campur aduk, tidak ada cluster yang jelas.
  • Doc2Vec: mapping ke vector space menghasilkan satu cluster besar tanpa diferensiasi signifikan.
  • BERT (Bidirectional Encoder Representations from Transformers): meski embedding lebih rapi, cluster tetap sulit dipisahkan, terutama karena teks laporan teknisi sangat pendek dan repetitif.

Kesimpulan: unsupervised NLP tidak efektif untuk ticket pendek.

Supervised Approach: SpectrumBoost vs BERT

Karena unsupervised gagal, penulis beralih ke supervised classification dengan 3 kategori kerusakan paling sering:

  1. Cold cycle error (ID 105).
  2. Masalah listrik (ID 115).
  3. Body parts failure (ID 140).

Dua metode dibandingkan:

  • SpectrumBoost (XGBoost dengan spectrum kernel): hasil terbaik, F1 dan AUC lebih tinggi sekitar 1% dibanding BERT. SpectrumBoost efektif karena bisa mengenali variasi kata seperti ghiaccio, ghiacci, ghiacc sebagai hal yang sama.
  • BERT: meskipun canggih, performanya tidak optimal di teks pendek. Model ini lebih cocok untuk kalimat panjang dengan konteks kaya.

Pelajaran praktis: jangan langsung pakai model mahal kayak BERT kalau datanya tidak cocok. Kadang metode lebih ringan justru lebih efektif dan efisien.

AWS Pipeline: Dari Riset ke Implementasi Nyata

Salah satu kontribusi penting paper ini adalah gambaran pipeline AWS (Amazon Web Services) untuk deployment predictive maintenance secara otomatis.

Alurnya:

  1. Data masuk ke Amazon S3.
  2. CloudWatch memicu event untuk menjalankan query dengan Athena.
  3. Data diproses oleh AWS Glue untuk cleaning.
  4. Hasil dipakai oleh Amazon Forecast (untuk time series) atau SageMaker (untuk model custom seperti XGBoost).
  5. Workflow diatur pakai AWS Step Functions, termasuk error handling.
  6. Output model kembali ke S3 dan siap dipakai dashboard atau sistem monitoring.

Dengan pipeline ini, predictive maintenance bisa berjalan otomatis tanpa campur tangan manusia. Ini penting buat perusahaan dengan ribuan mesin tersebar, karena manual monitoring jelas tidak mungkin.

Kritik, Opini, dan Relevansi Dunia Nyata

  1. Kekuatan paper:
    • Membandingkan berbagai pendekatan ML secara jujur, dari klasik sampai state-of-the-art.
    • Memberi evaluasi metrik yang lengkap, tidak hanya akurasi tapi juga AUC, F1, dan confusion matrix.
    • Menawarkan blueprint implementasi nyata lewat AWS.
  2. Kelemahan:
    • Masalah data imbalance belum terpecahkan dengan baik.
    • LSTM hanya diuji dalam bentuk standar, tanpa variasi seperti attention atau transformer-based time series.
    • Tidak ada analisis cost-benefit rinci tentang konsekuensi bisnis dari false positive vs false negative.
  3. Relevansi industri:
    • Menunjukkan bahwa XGBoost cukup kuat untuk predictive maintenance real-world.
    • Memberi insight bahwa data kualitas rendah bisa bikin model secanggih apa pun jadi tidak efektif.
    • Membuka peluang bagi perusahaan untuk memanfaatkan cloud pipeline agar sistem maintenance lebih efisien dan scalable.

Kesimpulan

Resensi ini menegaskan bahwa penelitian Agostini sangat aplikatif dan relevan dengan kebutuhan industri. Beberapa poin kunci yang bisa diambil:

  • Keep it simple. Model sederhana seperti XGBoost bisa outperform LSTM dalam banyak kasus.
  • Data lebih penting dari model. Tanpa data yang balance dan bersih, bahkan model paling canggih akan gagal.
  • Pilih tools sesuai data. Untuk ticket pendek, SpectrumBoost lebih efektif daripada BERT.
  • Deployment matters. Cloud pipeline memastikan predictive maintenance bisa benar-benar jalan di dunia nyata, bukan cuma eksperimen di lab.

Bagi perusahaan, temuan ini bisa langsung diadopsi untuk optimasi maintenance, mengurangi downtime, dan menekan biaya operasional. Inilah bukti nyata bagaimana machine learning bukan hanya jargon, tapi solusi konkret di era Industry 4.0.

Selengkapnya
Industrial Application of Machine Learning – Predictive Maintenance for Failure Detection
page 1 of 1