Menyintesis Gambar Cacat Permukaan Industri dengan AI

Dipublikasikan oleh Viskha Dwi Marcella Nanda

22 April 2025, 07.53

pixabay.com

Pendahuluan: Krisis Data dalam Dunia Deteksi Cacat

Industri manufaktur modern menuntut inspeksi kualitas dengan presisi tinggi dan kecepatan maksimal. Namun, ketika berhadapan dengan cacat permukaan pada produk—dari goresan hingga deformasi struktural—tantangan terbesar justru datang dari kelangkaan data.

Cacat industri kerap kali bersifat langka dan tidak terstruktur, menjadikannya tidak ideal untuk model deep learning yang membutuhkan ribuan contoh data. Dalam konteks ini, riset oleh Xiaopin Zhong et al. (2023) memberikan solusi strategis: menghasilkan gambar cacat sintetis yang realistis sebagai pelengkap data pelatihan.

 

Mengapa Gambar Cacat Sintetis Itu Penting?

Permasalahan utama dalam deteksi cacat berbasis AI adalah long-tailed distribution—di mana sebagian besar data didominasi oleh contoh normal, sementara contoh cacat sangat jarang. Ini menyebabkan model menjadi bias dan gagal mendeteksi cacat minor yang krusial. Untuk mengatasi ini, teknik image generation atau sintesis gambar muncul sebagai solusi strategis.

Dengan memanfaatkan model seperti Generative Adversarial Networks (GAN) dan diffusion models, peneliti dapat menciptakan ratusan bahkan ribuan gambar cacat baru yang memiliki variasi bentuk, ukuran, dan posisi, tanpa perlu proses labeling manual yang mahal dan memakan waktu.

 

Metode Tradisional vs Deep Learning: Siapa yang Unggul?

Metode Tradisional: Cepat, Murah, tapi Kurang Realistis

Teknik tradisional seperti Computer-Aided Design (CAD) dan pemrosesan citra digital masih digunakan, terutama untuk simulasi cacat pada material kaku seperti baja atau logam tuang. Misalnya:

  • CAD dapat menghasilkan cacat geometris secara presisi.
  • Metode berbasis noise seperti Perlin Noise atau Gaussian dapat digunakan untuk menciptakan cacat pori atau spot pada latar belakang nyata.

Namun, metode ini terbatas pada variasi bentuk dan tidak mampu menangkap kompleksitas dunia nyata—misalnya efek pencahayaan, tekstur acak, atau pencampuran dengan latar yang tidak homogen.

Deep Learning: Realisme Tinggi dengan Biaya Komputasi

Teknik berbasis deep learning membawa revolusi besar. Generative Adversarial Networks (GAN) dan diffusion models terbukti mampu menghasilkan gambar sintetis yang hampir tak bisa dibedakan dari gambar nyata.

Model GAN Populer:

  • DCGAN: Pionir dalam menyintesis gambar dari noise.
  • Pix2Pix: Cocok untuk data berpasangan (input-output).
  • CycleGAN: Ideal untuk data tidak berpasangan.
  • StyleGAN: Fokus pada kontrol fitur gambar seperti tekstur dan bentuk.
  • ACGAN: Menambahkan kondisi label untuk klasifikasi sekaligus generasi.

Kelebihan utama deep learning terletak pada fleksibilitas dan skalabilitas. Model seperti StyleGAN bahkan mampu menyintesis cacat yang tidak tersedia dalam data nyata, seperti goresan mikroskopis atau cacat struktural kompleks.

 

Studi Kasus: Benchmark Empiris yang Menarik

Penulis melakukan eksperimen pada dataset Magnetic Tile Defect dan membandingkan 5 pendekatan: Pix2Pix, CycleGAN, StyleGAN, serta dua model diffusion—SD + LoRA dan SD + LoRA + ControlNet.

Temuan Utama:

  • SD + LoRA + ControlNet menghasilkan kualitas gambar terbaik, terutama pada detail latar belakang dan akurasi bentuk cacat.
  • Pix2Pix unggul di antara model GAN karena pelatihan data berpasangan membuatnya lebih presisi.
  • StyleGAN unggul untuk cacat besar atau tidak beraturan, sedangkan CycleGAN lebih stabil untuk cacat kecil seperti gelembung atau bintik.

Evaluasi Objektif:

  • FID (Fréchet Inception Distance), IS (Inception Score), SSIM, dan LPIPS menunjukkan performa tertinggi oleh model diffusion.
  • Kinerja model juga diuji dalam tugas klasifikasi: akurasi meningkat dari 75% menjadi hampir 89% saat data augmented dengan gambar sintetis—angka yang signifikan di dunia industri.

 

Tantangan dan Masa Depan: GAN vs Diffusion

Masalah pada GAN:

  • Mode Collapse: Gambar yang dihasilkan tidak bervariasi.
  • Kesulitan Pelatihan: Tidak stabil dan sensitif terhadap parameter.
  • Resolusi Terbatas: Sulit menghasilkan gambar HD tanpa struktur khusus.

Keunggulan Diffusion Model:

  • Mampu menghasilkan gambar ultra-realistis bahkan dari noise acak.
  • Lebih stabil dan tahan terhadap overfitting.
  • Kontrol terhadap fitur cacat bisa lebih presisi dengan bantuan seperti ControlNet.

Namun, diffusion model juga memiliki tantangan seperti waktu pelatihan yang lebih lama dan kebutuhan komputasi yang lebih tinggi.

 

Implikasi Nyata di Dunia Industri

Sektor manufaktur seperti otomotif, elektronik, hingga logam berat dapat mengambil manfaat dari metode ini untuk:

  • Peningkatan kualitas inspeksi visual otomatis
  • Pengurangan ketergantungan pada inspeksi manual
  • Pemangkasan waktu dan biaya pelabelan data
  • Pemecahan masalah data imbalance pada proses pelatihan AI

Dengan diterapkannya teknik ini, industri bisa mencapai efisiensi lebih tinggi, akurasi lebih baik, dan sistem deteksi cacat yang lebih adaptif terhadap perubahan produk.

 

Opini dan Perbandingan

Dibandingkan dengan riset lain yang fokus pada augmentasi data secara sederhana (rotasi, flipping), pendekatan generatif memiliki keunggulan signifikan. Bahkan, paper ini berhasil mengisi celah dalam literatur dengan menawarkan benchmark pertama untuk evaluasi berbagai metode sintesis gambar cacat, sesuatu yang sebelumnya belum tersedia secara komprehensif.

Sebagai nilai tambah, penggunaan diffusion model yang dipadukan dengan LoRA dan ControlNet juga menandai pergeseran paradigma dari sekadar augmentation menjadi generative augmentation yang cerdas dan terarah.

 

Kesimpulan: Dari Gambar Buatan Menuju Deteksi yang Cerdas

Riset ini membuktikan bahwa gambar sintetis bukan hanya sekadar “tambahan data”, tetapi fondasi baru dalam membangun sistem deteksi cacat industri yang cerdas, adaptif, dan presisi. Di tengah keterbatasan data nyata dan tantangan label manual, pendekatan ini mampu menjawab kebutuhan industri akan efisiensi dan akurasi dalam satu paket inovatif.

 

Sumber:

Zhong, X., Zhu, J., Liu, W., Hu, C., Deng, Y., & Wu, Z. (2023). An Overview of Image Generation of Industrial Surface Defects. Sensors, 23(19), 8160.