diklatkerja

Teknologi & Industri

aIntelligent Prognostics of Machinery Health: Analisis Praktis dan Relevansi Industri Modern

Dipublikasikan oleh Anjas Mifta Huda pada 08 Oktober 2025

Berdasarkan tesis Aiwina Soong Yin Heng (Queensland University of Technology, 2009)

DOI: 10.25904/1912/1360

Pendahuluan: Dari Maintenance Manual ke Kecerdasan Prediktif

Dalam industri modern, kerusakan mesin tak terduga bukan cuma bikin downtime, tapi juga bisa berujung pada kerugian finansial besar dan risiko keselamatan. Aiwina Heng, dalam tesis doktoralnya berjudul “Intelligent Prognostics of Machinery Health Utilising Suspended Condition Monitoring Data”, mencoba menabrak batas pendekatan tradisional dalam Condition-Based Maintenance (CBM) dengan menggabungkan kecerdasan buatan (AI) dan analisis statistik untuk memprediksi umur pakai mesin secara lebih akurat dan realistis.

Tesis ini nggak sekadar teoritis — Aiwina mengembangkan model prediksi baru yang memanfaatkan data kondisi yang “tertunda” atau tidak sampai titik kegagalan (suspended condition histories). Dalam dunia nyata, mesin jarang dibiarkan rusak total, jadi data seperti ini jauh lebih umum tapi sering diabaikan oleh model klasik. Nah, lewat pendekatan neural network dan statistik survival Kaplan-Meier, Aiwina berhasil menciptakan sistem yang bukan cuma pintar, tapi juga ngerti realitas lapangan.

1. Masalah Klasik di Dunia Maintenance

Kebanyakan metode perawatan prediktif tradisional bergantung pada data kegagalan total (run-to-failure). Padahal, mayoritas aset industri diganti atau diservis sebelum rusak. Akibatnya, model prediksi yang hanya mengandalkan event data jadi bias — sering meng-underestimate umur pakai mesin dan bikin maintenance terlalu dini (alias boros biaya).

Masalahnya nggak cuma itu:

Reliability data dan condition monitoring data sering dipisahkan. Padahal keduanya harusnya jalan bareng.
Hubungan antara data kondisi dan kesehatan aktual mesin sering non-linear.
Model lama butuh banyak asumsi fisik dan distribusi kegagalan (misalnya Weibull), yang bikin hasilnya sering meleset di dunia nyata.

Aiwina melihat lubang besar di situ, dan dia mencoba nutup dengan model yang:

Bisa pakai suspended data secara langsung,
Mengintegrasikan data populasi dan data individu,
Mampu mengenali hubungan non-linear pakai Artificial Neural Network (ANN),
Dan minim asumsi statistik yang ribet.

2. Konsep dan Struktur Model Prediksi Baru

Model yang dikembangin Aiwina berbasis Feed-Forward Neural Network (FFNN), di mana target latihannya bukan sekadar waktu kegagalan, tapi probabilitas kelangsungan hidup (survival probability) tiap unit mesin.

Komponen utama model ini:

Kaplan-Meier Estimator (KM):
Digunakan buat menghitung probabilitas bertahan dari tiap unit — termasuk yang datanya “digantung” alias belum gagal. Versi yang dipakai Aiwina adalah adapted Kaplan-Meier, yang bisa menghitung survival individual bahkan tanpa data kegagalan penuh.
Degradation-based Probability Density Estimation (PDF):
Mengambil ciri populasi dari data kondisi, bukan cuma dari data reliabilitas. Ini penting biar prediksi nggak cuma berdasarkan “berapa lama mesin bisa hidup,” tapi juga bagaimana kondisinya menurun.
Feed-Forward Neural Network (FFNN):
Ditraining buat mengenali hubungan non-linear antara sinyal kondisi (vibration, wear, oil analysis, dll.) dengan probabilitas kegagalan. Setelah training, FFNN ini bisa memproyeksikan kurva survival di masa depan hanya dari data kondisi terbaru.

Dengan kombinasi ini, model Aiwina berhasil memprediksi kemungkinan bertahan hidup mesin dalam horizon waktu tertentu, lengkap dengan tingkat keyakinan probabilistik. Jadi bukan cuma “mesin ini rusak dalam 10 hari,” tapi “mesin ini punya 80% peluang bertahan 10 hari lagi.”

3. Simulasi Data dan Validasi Model

Aiwina nggak cuma berhenti di teori. Dia bikin simulasi degradasi rolling element bearings (bantalan) — karena komponen ini adalah biang kerok utama kerusakan mesin berputar. Model simulasi ini menghasilkan vibration signatures yang merepresentasikan kerusakan progresif dari tahap awal sampai parah, dengan noise acak biar lebih mirip kondisi nyata.

Setelah itu, modelnya diuji dengan 5 jenis model pembanding:

FFNN tanpa suspended data,
FFNN dengan pendekatan tradisional,
RNN (Recurrent Neural Network) untuk prediksi deret waktu,
Model statistik Weibull klasik,
Model Aiwina (dengan KM dan PDF terintegrasi).

Hasilnya?
Model Aiwina unggul di semua pengujian.

Error prediksi jauh lebih rendah,
Output prediksi adaptif terhadap perubahan kondisi,
Dan bisa memproyeksikan survival probability dengan representasi yang realistis.

Dengan kata lain, model ini bisa “belajar” bahwa mesin nggak selalu rusak sesuai pola linier, tapi bisa melambat, stabil, atau bahkan membaik setelah perawatan kecil — hal yang gak mungkin ditangkap model Weibull atau RNN biasa.

4. Studi Kasus Industri: Pompa di Pabrik Kertas

Biar bukti makin kuat, model ini diuji di dunia nyata: Irving Pulp and Paper Mill (pabrik kertas). Di sini, data getaran dari pompa industri dipakai buat ngetes kemampuan model di lingkungan operasional yang penuh variabel liar — suhu, kecepatan, dan beban yang berubah-ubah.

Dari 12 histori bearing gagal dan puluhan histori suspended, model Aiwina berhasil:

Menghasilkan kurva survival yang realistis dan stabil,
Menangkap pola degradasi yang nggak linier,
Dan memberikan estimasi waktu kegagalan lebih presisi dibanding empat model lain.

Tabel dan grafik hasil menunjukkan bahwa prediksi survival probabilitas Aiwina punya kesalahan rata-rata paling kecil dan penalty function paling rendah — artinya performa terbaik secara akurasi dan cakupan waktu.

5. Relevansi Praktis di Dunia Industri

Pendekatan Aiwina ini sangat relevan buat era Industry 4.0 dan Smart Factory.
Dengan sistem seperti ini, perusahaan bisa:

Mengoptimalkan jadwal maintenance: perawatan dilakukan berdasarkan kondisi real-time, bukan jadwal tetap.
Menghemat biaya operasional: karena nggak ada lagi penggantian dini akibat prediksi ngawur.
Meningkatkan keandalan aset: mesin nggak perlu dimatikan hanya karena “jadwal inspeksi tiba.”
Meningkatkan keselamatan kerja: karena kerusakan bisa diprediksi lebih awal dengan probabilitas yang bisa dipercaya.

Model ini juga cocok buat sistem IoT industri modern, karena bisa diintegrasikan dengan sensor data real-time. Kalau diterapkan di sistem seperti predictive maintenance untuk manufaktur, pembangkit listrik, atau pertambangan, hasilnya bakal signifikan dalam efisiensi dan keselamatan.

6. Kelebihan dan Keterbatasan Model

Kelebihan:

Non-parametrik: gak butuh asumsi bentuk distribusi kegagalan.
Data efisien: bisa manfaatkan data “gagal” maupun “tidak gagal.”
Adaptif: bisa menyesuaikan dengan kondisi yang berubah-ubah.
Lebih realistis: cocok untuk mesin yang jarang dibiarkan rusak total.

Keterbatasan:

Butuh volume data besar untuk training neural network.
Kompleksitas komputasi tinggi dibanding model statistik sederhana.
Sulit diterapkan di sistem tanpa sensor CM terintegrasi.

Tapi di tengah perkembangan AI dan big data industri, keterbatasan ini makin kecil relevansinya. Justru, fondasi model ini jadi dasar dari sistem prognostics and health management (PHM) yang dipakai di industri berat modern — dari turbin gas sampai kendaraan otonom.

7. Opini dan Kritik

Secara ilmiah, pendekatan Aiwina adalah lompatan besar di bidang predictive maintenance. Tapi dari sisi implementasi industri, ada beberapa hal yang bisa dikritisi:

Biaya implementasi awal tinggi.
Perusahaan perlu investasi besar di sensor, penyimpanan data, dan komputasi neural network.
Kurangnya transparansi model.
ANN bersifat black-box, jadi sulit dijelaskan ke teknisi lapangan kenapa model memprediksi kegagalan tertentu.
Butuh validasi lintas domain.
Walau berhasil di pompa industri, belum tentu hasilnya sama di sektor lain (misalnya otomotif atau energi).

Namun, secara keseluruhan, tesis ini membangun pondasi untuk era maintenance modern: di mana keputusan perawatan bukan lagi berbasis insting teknisi, tapi hasil pembelajaran mesin yang memanfaatkan setiap potongan data yang ada.

Kesimpulan: Dari Teori ke Revolusi Industri

Aiwina Heng berhasil menjawab pertanyaan besar di dunia maintenance: bisakah mesin memprediksi nasibnya sendiri?
Jawabannya: bisa.

Dengan model hybrid berbasis neural network dan Kaplan-Meier estimator, penelitian ini membuktikan bahwa suspended data — yang dulu dianggap “sampah statistik” — justru punya nilai besar untuk prediksi umur mesin.

Tesis ini bukan cuma inovasi akademis, tapi juga blueprint untuk implementasi industri masa depan. Model ini bisa jadi dasar sistem PHM cerdas di pabrik pintar, transportasi modern, dan infrastruktur kritikal.

Intinya, karya Aiwina adalah jembatan antara data mentah dan keputusan strategis. Ia menunjukkan bahwa AI bukan cuma alat bantu, tapi otak baru bagi dunia maintenance.

Selengkapnya

aIntelligent Prognostics of Machinery Health: Analisis Praktis dan Relevansi Industri Modern

Teknologi & Industri

Industrial Application of Machine Learning – Predictive Maintenance for Failure Detection

Dipublikasikan oleh Anjas Mifta Huda pada 25 September 2025

Paper ini ditulis oleh Federico Agostini sebagai bagian dari tesis master di Università degli Studi di Padova, dengan judul lengkap Industrial Application of Machine Learning: Predictive Maintenance for Failure Detection. Penelitian ini menjadi salah satu referensi menarik di bidang predictive maintenance (perawatan prediktif) karena membahas penerapan machine learning (pembelajaran mesin) dalam mendeteksi potensi kerusakan mesin industri sebelum benar-benar terjadi.

Predictive maintenance (sering disingkat PdM) merupakan strategi perawatan mesin yang memanfaatkan data sensor, alarm, dan laporan teknisi untuk memprediksi kapan kerusakan akan muncul. Konsep ini sangat relevan di era Industry 4.0, yaitu fase revolusi industri keempat yang ditandai dengan integrasi teknologi digital, Internet of Things (IoT), big data, kecerdasan buatan, dan sistem otonom dalam dunia produksi.

Kalau di masa lalu industri masih mengandalkan run-to-failure (R2F), yaitu menunggu mesin rusak dulu baru diperbaiki, atau preventive maintenance (PvM), yaitu mengganti komponen secara terjadwal meskipun kadang masih layak pakai, kini PdM hadir sebagai jalan tengah. PdM memungkinkan perusahaan mengoptimalkan umur pakai komponen, menekan downtime, dan mengurangi biaya karena maintenance hanya dilakukan saat memang ada indikasi kerusakan nyata.

Nah, di sinilah machine learning masuk. Algoritma ML bisa belajar dari data sensor, log alarm, hingga laporan teknisi untuk mengenali pola kerusakan yang sering tersembunyi atau tidak kasat mata. Agostini dalam papernya menguji beberapa pendekatan populer, seperti XGBoost, Long-Short Term Memory (LSTM), model NLP (Natural Language Processing), ensemble model, hingga BERT (Bidirectional Encoder Representations from Transformers) untuk data teks. Selain itu, paper ini juga membahas implementasi pipeline berbasis AWS (Amazon Web Services) untuk deployment skala industri.

Dataset dan Kompleksitas Data Industri

Dataset yang dipakai dalam penelitian ini berasal dari perusahaan besar di bidang refrigeration system atau sistem pendingin. Data ini mencakup:

Alarm records – berisi lebih dari 50,5 juta catatan alarm yang dipicu sensor mesin. Tiap entri punya informasi waktu, kode lokasi fasilitas, hingga ID alarm.
Operations dataset – sekitar 500 ribu catatan operasi teknisi, termasuk waktu laporan dan jenis kerusakan.
Assistance calls dataset – lebih dari 630 ribu laporan permintaan bantuan teknis, biasanya dikirim via telepon/email saat terjadi malfungsi.

Bayangin aja, data sebanyak ini sangat noisy (banyak gangguan atau error). Misalnya, laporan teknisi sering bercampur antara kerusakan serius dan hal remeh kayak lampu mati. Ada juga masalah delay: laporan teknisi kadang ditulis berhari-hari atau berbulan-bulan setelah kejadian. Jadi, tantangan besar penelitian ini bukan cuma bikin model prediksi, tapi juga membersihkan dan menyatukan data supaya lebih usable.

Agostini melakukan Exploratory Data Analysis (EDA) untuk memahami pola dasar. Hasilnya menunjukkan bahwa tiap fasilitas punya perilaku alarm yang unik. Artinya, mesin di lokasi A bisa sering memicu alarm tertentu, sementara di lokasi B tidak. Hal ini bikin sulit bikin satu model generik untuk semua fasilitas. Solusi yang diusulkan adalah menambahkan variabel lokasi dalam model agar algoritma bisa belajar perbedaan karakteristik antar fasilitas.

Pendekatan Machine Learning untuk Failure Prediction

XGBoost: Simple tapi Powerful

XGBoost (Extreme Gradient Boosting) adalah algoritma berbasis decision tree yang sering jadi andalan di kompetisi data science. Model ini terbukti unggul dalam penelitian Agostini. Dengan threshold probabilitas 0,3, XGBoost mampu mendeteksi sekitar 70% kasus kerusakan dengan tingkat false alarm sekitar 35%.

Kalau threshold diturunkan ke 0,1, hampir semua kerusakan bisa terdeteksi (recall tinggi), tapi trade-off-nya false positives melonjak. Bagi industri, ini berarti dilema klasik: apakah mau lebih aman dengan biaya maintenance lebih besar, atau lebih hemat dengan risiko ada kerusakan yang lolos.

Kekuatan XGBoost ada pada kemampuannya menangani data besar, tidak butuh asumsi distribusi data, dan relatif mudah diinterpretasi. Buat perusahaan yang butuh solusi praktis, ini sangat relevan.

LSTM: Harapan yang Gagal

Long-Short Term Memory (LSTM) adalah arsitektur neural network khusus untuk time series. Harapannya, LSTM bisa menangkap pola jangka panjang dari data alarm. Tapi, hasil di paper ini justru mengecewakan.

Model LSTM hanya menghasilkan AUC di bawah 0,5, artinya prediksinya bahkan lebih buruk dari tebak random. Kenapa bisa begitu? Karena kerusakan mesin di dataset ini ternyata bukan pola bertahap, tapi lebih sering muncul mendadak. Jadi, mencoba memprediksi dengan mengandalkan memori jangka panjang justru membuat model salah interpretasi.

Pelajaran penting: jangan asal pakai deep learning kalau tidak sesuai karakter data. Banyak praktisi industri terlalu cepat mengadopsi neural network, padahal model berbasis tree kayak XGBoost bisa jauh lebih robust.

NLP-like Model: Alarm Sebagai Bahasa

Agostini juga mencoba pendekatan kreatif dengan memperlakukan urutan alarm seperti kalimat. Jadi, tiap ID alarm dianggap kata, dan rangkaian alarm dianggap dokumen.

Sayangnya, pendekatan ini gagal. AUC model hanya sekitar 0,576. Hal ini bisa dipahami karena alarm sequence tidak punya kekayaan semantik seperti bahasa alami. Dengan kata lain, alarm ID bukanlah kata dengan makna, melainkan hanya sinyal teknis.

Ensemble LSTM + XGBoost

Kombinasi LSTM dan XGBoost diuji untuk melihat apakah dua pendekatan bisa saling melengkapi. Skemanya: LSTM memprediksi alarm esok hari, lalu hasil prediksi dipakai XGBoost untuk menentukan ada kerusakan atau tidak.

Hasilnya? AUC sekitar 0,66, alias lebih buruk dari XGBoost sendiri. Walau LSTM punya MAE (Mean Absolute Error) rendah dalam memprediksi jumlah alarm, tapi begitu digabung dengan XGBoost, performanya drop.

Artinya, ensemble ini tidak memberikan sinergi karena noise data dan imbalance class terlalu besar. Meski begitu, ide ensemble tetap menarik untuk dieksplorasi dengan teknik balancing data yang lebih baik.

Analisis Ticket Maintenance dengan Natural Language Processing (NLP)

Selain alarm, paper ini juga mengulik laporan teknisi. Data ini berupa teks pendek yang menjelaskan jenis masalah.

Unsupervised Approach: LDA, Doc2Vec, dan BERT

LDA (Latent Dirichlet Allocation): hasilnya buruk, topik campur aduk, tidak ada cluster yang jelas.
Doc2Vec: mapping ke vector space menghasilkan satu cluster besar tanpa diferensiasi signifikan.
BERT (Bidirectional Encoder Representations from Transformers): meski embedding lebih rapi, cluster tetap sulit dipisahkan, terutama karena teks laporan teknisi sangat pendek dan repetitif.

Kesimpulan: unsupervised NLP tidak efektif untuk ticket pendek.

Supervised Approach: SpectrumBoost vs BERT

Karena unsupervised gagal, penulis beralih ke supervised classification dengan 3 kategori kerusakan paling sering:

Cold cycle error (ID 105).
Masalah listrik (ID 115).
Body parts failure (ID 140).

Dua metode dibandingkan:

SpectrumBoost (XGBoost dengan spectrum kernel): hasil terbaik, F1 dan AUC lebih tinggi sekitar 1% dibanding BERT. SpectrumBoost efektif karena bisa mengenali variasi kata seperti ghiaccio, ghiacci, ghiacc sebagai hal yang sama.
BERT: meskipun canggih, performanya tidak optimal di teks pendek. Model ini lebih cocok untuk kalimat panjang dengan konteks kaya.

Pelajaran praktis: jangan langsung pakai model mahal kayak BERT kalau datanya tidak cocok. Kadang metode lebih ringan justru lebih efektif dan efisien.

AWS Pipeline: Dari Riset ke Implementasi Nyata

Salah satu kontribusi penting paper ini adalah gambaran pipeline AWS (Amazon Web Services) untuk deployment predictive maintenance secara otomatis.

Alurnya:

Data masuk ke Amazon S3.
CloudWatch memicu event untuk menjalankan query dengan Athena.
Data diproses oleh AWS Glue untuk cleaning.
Hasil dipakai oleh Amazon Forecast (untuk time series) atau SageMaker (untuk model custom seperti XGBoost).
Workflow diatur pakai AWS Step Functions, termasuk error handling.
Output model kembali ke S3 dan siap dipakai dashboard atau sistem monitoring.

Dengan pipeline ini, predictive maintenance bisa berjalan otomatis tanpa campur tangan manusia. Ini penting buat perusahaan dengan ribuan mesin tersebar, karena manual monitoring jelas tidak mungkin.

Kritik, Opini, dan Relevansi Dunia Nyata

Kekuatan paper:
- Membandingkan berbagai pendekatan ML secara jujur, dari klasik sampai state-of-the-art.
- Memberi evaluasi metrik yang lengkap, tidak hanya akurasi tapi juga AUC, F1, dan confusion matrix.
- Menawarkan blueprint implementasi nyata lewat AWS.
Kelemahan:
- Masalah data imbalance belum terpecahkan dengan baik.
- LSTM hanya diuji dalam bentuk standar, tanpa variasi seperti attention atau transformer-based time series.
- Tidak ada analisis cost-benefit rinci tentang konsekuensi bisnis dari false positive vs false negative.
Relevansi industri:
- Menunjukkan bahwa XGBoost cukup kuat untuk predictive maintenance real-world.
- Memberi insight bahwa data kualitas rendah bisa bikin model secanggih apa pun jadi tidak efektif.
- Membuka peluang bagi perusahaan untuk memanfaatkan cloud pipeline agar sistem maintenance lebih efisien dan scalable.

Kesimpulan

Resensi ini menegaskan bahwa penelitian Agostini sangat aplikatif dan relevan dengan kebutuhan industri. Beberapa poin kunci yang bisa diambil:

Keep it simple. Model sederhana seperti XGBoost bisa outperform LSTM dalam banyak kasus.
Data lebih penting dari model. Tanpa data yang balance dan bersih, bahkan model paling canggih akan gagal.
Pilih tools sesuai data. Untuk ticket pendek, SpectrumBoost lebih efektif daripada BERT.
Deployment matters. Cloud pipeline memastikan predictive maintenance bisa benar-benar jalan di dunia nyata, bukan cuma eksperimen di lab.

Bagi perusahaan, temuan ini bisa langsung diadopsi untuk optimasi maintenance, mengurangi downtime, dan menekan biaya operasional. Inilah bukti nyata bagaimana machine learning bukan hanya jargon, tapi solusi konkret di era Industry 4.0.

Selengkapnya